分页: 1 / 2

[问题]下载文件名部分规则的漫画如何实现?

发表于 : 2008-01-06 21:08
trigger
最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。

发表于 : 2008-01-06 21:15
bones7456
只要能找到规律就可以用脚本处理。

发表于 : 2008-01-06 22:10
trigger
一个电脑生成的四位数列想找到规律估计挺费劲 :cry:

发表于 : 2008-01-06 22:19
BigSnake.NET
写个蜘蛛, 遍历..

发表于 : 2008-01-06 22:30
trigger
BigSnake.NET在4楼 写了:写个蜘蛛, 遍历..
不会 :?
其实这思路俺想到了,就是0000-9999挨个试呗,就是不会具体弄啊。

发表于 : 2008-01-06 23:22
trigger
刚发现下划线后的数字不一定是四位,三位,五位都有。应该比较绝望了。

发表于 : 2008-01-06 23:33
stlxv
?

发表于 : 2008-01-08 12:32
dr_liu
遍历网页上的图片的超连接试试?

发表于 : 2008-01-08 14:03
trigger
那个超链接html页是禁止访问的,否则也就不用这么麻烦了。算了,俺还是在线看吧。反正对漫画瘾头不大,也没多少卷了。

发表于 : 2008-01-08 14:04
eexpress
不给出地址

Re: [问题]下载文件名部分规则的漫画如何实现?

发表于 : 2008-01-08 21:35
vvvli
trigger 写了:最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。
没办法的,这种地址就是要防你这样的.

发表于 : 2008-01-09 0:52
muzuiget
对于这个问题用firefox的自动翻页搞定,楼主能提供地址么,就是有页码那个地址?让我来试试写规则

发表于 : 2008-01-09 8:34
eexpress
jpg是地址?要html的。进入看jpg的地址。
难道网站都是进去,就全部jpg链接?

发表于 : 2008-01-09 13:01
trigger
ee,表激动,你也不想想,要是网页上直接就全是jpg链接咱用downthemall不就全给突鲁下来了?
这是那个网站:http://comic.sky-fire.com/

发表于 : 2008-01-09 13:41
eexpress
激动?不是吧。我才不激动。

http://comic.sky-fire.com/HTML/HELLSING/ 下载这html。搜索那085话这样的链接。
得出
http://pic.sky-fire.com/AllComic/Browse ... &v=086&p=1 这样的链接列表。
再html里面找图片。规律就在这最后的html里面。
http://pic.sky-fire.com/Pic/OnlineComic ... _11026.jpg