当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 17 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : [问题]下载文件名部分规则的漫画如何实现?
帖子发表于 : 2008-01-06 21:08 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-01-06 21:15 
头像

注册: 2006-04-12 20:05
帖子: 8495
地址: 杭州
送出感谢: 0 次
接收感谢: 8
只要能找到规律就可以用脚本处理。


_________________
关注我的blog: ε==3


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-01-06 22:10 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
一个电脑生成的四位数列想找到规律估计挺费劲 :cry:


页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2008-01-06 22:19 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
写个蜘蛛, 遍历..


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2008-01-06 22:30 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
BigSnake.NET在4楼 写道:
写个蜘蛛, 遍历..


不会 :?
其实这思路俺想到了,就是0000-9999挨个试呗,就是不会具体弄啊。


页首
 用户资料  
 
6 楼 
 文章标题 :
帖子发表于 : 2008-01-06 23:22 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
刚发现下划线后的数字不一定是四位,三位,五位都有。应该比较绝望了。


页首
 用户资料  
 
7 楼 
 文章标题 :
帖子发表于 : 2008-01-06 23:33 
头像

注册: 2006-05-03 0:39
帖子: 8273
地址: المريخ
送出感谢: 0 次
接收感谢: 1
?


_________________
PHP是最好的语言!不服来战!


页首
 用户资料  
 
8 楼 
 文章标题 :
帖子发表于 : 2008-01-08 12:32 
头像

注册: 2008-01-07 16:53
帖子: 42
送出感谢: 0 次
接收感谢: 0 次
遍历网页上的图片的超连接试试?


页首
 用户资料  
 
9 楼 
 文章标题 :
帖子发表于 : 2008-01-08 14:03 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
那个超链接html页是禁止访问的,否则也就不用这么麻烦了。算了,俺还是在线看吧。反正对漫画瘾头不大,也没多少卷了。


页首
 用户资料  
 
10 楼 
 文章标题 :
帖子发表于 : 2008-01-08 14:04 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
不给出地址


_________________
● 鸣学


页首
 用户资料  
 
11 楼 
 文章标题 : Re: [问题]下载文件名部分规则的漫画如何实现?
帖子发表于 : 2008-01-08 21:35 

注册: 2006-10-26 7:02
帖子: 441
送出感谢: 0 次
接收感谢: 0 次
trigger 写道:
最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。

没办法的,这种地址就是要防你这样的.


页首
 用户资料  
 
12 楼 
 文章标题 :
帖子发表于 : 2008-01-09 0:52 
头像

注册: 2007-12-31 14:57
帖子: 1097
送出感谢: 0 次
接收感谢: 1
对于这个问题用firefox的自动翻页搞定,楼主能提供地址么,就是有页码那个地址?让我来试试写规则


页首
 用户资料  
 
13 楼 
 文章标题 :
帖子发表于 : 2008-01-09 8:34 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
jpg是地址?要html的。进入看jpg的地址。
难道网站都是进去,就全部jpg链接?


_________________
● 鸣学


页首
 用户资料  
 
14 楼 
 文章标题 :
帖子发表于 : 2008-01-09 13:01 
头像

注册: 2006-10-25 18:08
帖子: 1582
送出感谢: 0 次
接收感谢: 0 次
ee,表激动,你也不想想,要是网页上直接就全是jpg链接咱用downthemall不就全给突鲁下来了?
这是那个网站:http://comic.sky-fire.com/


页首
 用户资料  
 
15 楼 
 文章标题 :
帖子发表于 : 2008-01-09 13:41 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
激动?不是吧。我才不激动。

http://comic.sky-fire.com/HTML/HELLSING/ 下载这html。搜索那085话这样的链接。
得出
http://pic.sky-fire.com/AllComic/Browse ... &v=086&p=1 这样的链接列表。
再html里面找图片。规律就在这最后的html里面。
http://pic.sky-fire.com/Pic/OnlineComic ... _11026.jpg


_________________
● 鸣学


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 17 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 2 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译