[问题]下载文件名部分规则的漫画如何实现?

上网、浏览、聊天、下载等
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

[问题]下载文件名部分规则的漫画如何实现?

#1

帖子 trigger » 2008-01-06 21:08

最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。
头像
bones7456
帖子: 8495
注册时间: 2006-04-12 20:05
来自: 杭州
联系:

#2

帖子 bones7456 » 2008-01-06 21:15

只要能找到规律就可以用脚本处理。
关注我的blog: ε==3
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

#3

帖子 trigger » 2008-01-06 22:10

一个电脑生成的四位数列想找到规律估计挺费劲 :cry:
头像
BigSnake.NET
帖子: 12522
注册时间: 2006-07-02 11:16
来自: 廣州
联系:

#4

帖子 BigSnake.NET » 2008-01-06 22:19

写个蜘蛛, 遍历..
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

#5

帖子 trigger » 2008-01-06 22:30

BigSnake.NET在4楼 写了:写个蜘蛛, 遍历..
不会 :?
其实这思路俺想到了,就是0000-9999挨个试呗,就是不会具体弄啊。
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

#6

帖子 trigger » 2008-01-06 23:22

刚发现下划线后的数字不一定是四位,三位,五位都有。应该比较绝望了。
头像
stlxv
论坛版主
帖子: 8275
注册时间: 2006-05-03 0:39
来自: المريخ

#7

帖子 stlxv » 2008-01-06 23:33

?
PHP是最好的语言!不服来战!
头像
dr_liu
帖子: 42
注册时间: 2008-01-07 16:53

#8

帖子 dr_liu » 2008-01-08 12:32

遍历网页上的图片的超连接试试?
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

#9

帖子 trigger » 2008-01-08 14:03

那个超链接html页是禁止访问的,否则也就不用这么麻烦了。算了,俺还是在线看吧。反正对漫画瘾头不大,也没多少卷了。
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#10

帖子 eexpress » 2008-01-08 14:04

不给出地址
● 鸣学
vvvli
帖子: 441
注册时间: 2006-10-26 7:02

Re: [问题]下载文件名部分规则的漫画如何实现?

#11

帖子 vvvli » 2008-01-08 21:35

trigger 写了:最近看漫画,下一页下一页麻烦,还载入缓慢。于是试图下载下来看。问题来了:

该漫画网站的图片地址是形如这样的:
http://pic.sky-fire.com/Pic/OnlineComic ... 0_8857.jpg
其中下划线之前的数字是代表图片的页码,排列有序。下划线后面的数字是无序的。即
http://pic.sky-fire.com/Pic/OnlineComic ... LAST/002j/[001-xxx]_anynumber.jpg
这样的情况有什么办法批量处理?
wget -r没法递归,downthemall正则式处理也不合适。明白人给个办法吧。谢谢。
没办法的,这种地址就是要防你这样的.
头像
muzuiget
帖子: 1097
注册时间: 2007-12-31 14:57

#12

帖子 muzuiget » 2008-01-09 0:52

对于这个问题用firefox的自动翻页搞定,楼主能提供地址么,就是有页码那个地址?让我来试试写规则
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#13

帖子 eexpress » 2008-01-09 8:34

jpg是地址?要html的。进入看jpg的地址。
难道网站都是进去,就全部jpg链接?
● 鸣学
头像
trigger
帖子: 1604
注册时间: 2006-10-25 18:08

#14

帖子 trigger » 2008-01-09 13:01

ee,表激动,你也不想想,要是网页上直接就全是jpg链接咱用downthemall不就全给突鲁下来了?
这是那个网站:http://comic.sky-fire.com/
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#15

帖子 eexpress » 2008-01-09 13:41

激动?不是吧。我才不激动。

http://comic.sky-fire.com/HTML/HELLSING/ 下载这html。搜索那085话这样的链接。
得出
http://pic.sky-fire.com/AllComic/Browse ... &v=086&p=1 这样的链接列表。
再html里面找图片。规律就在这最后的html里面。
http://pic.sky-fire.com/Pic/OnlineComic ... _11026.jpg
● 鸣学
回复