[求指导]如何利用脚本/程序从静雅思听网站下载音乐文件?
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
[求指导]如何利用脚本/程序从静雅思听网站下载音乐文件?
网页地址:http://www.justing.com.cn/page/74012.html
右键另存为链接:http://www.justing.com.cn/download.jsp?id=74012
最后的下载链接是:http://dl.justing.com.cn/page/瘾的世纪.mp3
请教如何从另存为链接得到最后的下载链接呀?
右键另存为链接:http://www.justing.com.cn/download.jsp?id=74012
最后的下载链接是:http://dl.justing.com.cn/page/瘾的世纪.mp3
请教如何从另存为链接得到最后的下载链接呀?
上次由 highwind 在 2014-02-18 2:28,总共编辑 1 次。
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
- YeLee
- 论坛版主
- 帖子: 26406
- 注册时间: 2008-08-13 8:48
- 系统: Fundu i64
- 来自: 东海硇州,一双管钥。
- 联系:
Re: [求指导]如何从这个网页下载音乐文件?
代码: 全选
wget -q "http://www.justing.com.cn/page/74012.html" -O -|grep -oP "(?<=<div class=\"title\" id=\"title\").*" |sed 's=^[^\>]*>\([^\<]*\)<.*=http://dl.justing.com.cn/page/\1.mp3=g'

◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
-
- 帖子: 2148
- 注册时间: 2012-12-16 15:43
- 系统: debian
Re: [求指导]如何从这个网页下载音乐文件?
下载器不会自动解析?
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙
Re: [求指导]如何从这个网页下载音乐文件?
oncontextmenu="fDownload(event)"
oncontextmenu="fBogoDown(event)"
script src="http://ajax.googleapis.com/ajax/libs/
这不能用爬虫下载了。
oncontextmenu="fBogoDown(event)"
script src="http://ajax.googleapis.com/ajax/libs/
这不能用爬虫下载了。
● 鸣学
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?
谢谢呀,虽然有些具体的参数含义不懂,不过我猜大致意思是截取文件名插入到链接里吧。我想问问1为啥要右键另存为才能得到这个地址?2这个动作脚本可以模拟吗?
Sent from my iPod touch using Tapatalk
Sent from my iPod touch using Tapatalk
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?
谢谢ee ,请问您是怎么看出来爬虫不能下载这个问题呢? 您列举代码的含义是? 或者我应该查js方面的书吗?
Sent from my iPod touch using Tapatalk
Sent from my iPod touch using Tapatalk
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
- mjp123
- 帖子: 703
- 注册时间: 2009-04-09 15:06
Re: [求指导]如何从这个网页下载音乐文件?
由于其下载url有很强的规律,所以“爬虫”可以,
其实,写个油侯脚本可能更加方便下载。
其实,写个油侯脚本可能更加方便下载。
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?
谢谢提示,这也是个好主意。 可是还是不懂为什么右键另存为才能得到链接呢?
Sent from my iPod touch using Tapatalk
Sent from my iPod touch using Tapatalk
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [求指导]如何从这个网页下载音乐文件?
不难.
刚才看了一下, 写了个油㺅脚本, 会自动在页面的右下角生成最终的mp3的下载地址.
* 不需要登录
* 不需要启用页面的javascript
* 不需要启用cookie
脚本可以在这里下载: https://github.com/LiuLang/monkey-videos
另附截图:
刚才看了一下, 写了个油㺅脚本, 会自动在页面的右下角生成最终的mp3的下载地址.
* 不需要登录
* 不需要启用页面的javascript
* 不需要启用cookie
脚本可以在这里下载: https://github.com/LiuLang/monkey-videos
另附截图:
- 附件
-
- justingHTML5-demo.png (19.94 KiB) 查看 6746 次
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?


茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [求指导]如何从这个网页下载音乐文件?
@highwindhighwind 写了:我才把那个sed看明白了,正准备再去捣鼓油猴呢,您就已经写好啦,
。我去学习学习啊,看看怎么加一个自动下载(不过网站好像是限线程的)。
你需要的是批量下载?
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?
我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。
Sent from Tapatal
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。
Sent from Tapatal
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [求指导]如何从这个网页下载音乐文件?
我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。
Sent from Tapatal
如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.
我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: [求指导]如何从这个网页下载音乐文件?
哇塞,都不知道怎么感谢了,反正我也只是拿这个学学写脚本而已,如果有人提点再好不过啦。nae6taiyie0T 写了:我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。
Sent from Tapatal
如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.
我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
那个乱码确实没法子,只好自己转了,跟网站提过建议的,不过他们还没回音;
分类的话,其实倒也不打紧,我现在都是按每篇文章来分类(手动建立文件夹而已),当然要是学会怎么自动分也很开心啊;
多线程不错啊,不过每个文件都不大,单线程一会儿也下完了,而且是不是相应可以多下几个文件呢(待求证);
另外如果是注册用户,每次下载好像都会有点小积分,不知道咱要是用脚本下,这个网站能不能识别呢?

茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
-
- 帖子: 482
- 注册时间: 2013-09-13 0:42
- 系统: Debian sid
Re: [求指导]如何从这个网页下载音乐文件?
@highwindhighwind 写了:哇塞,都不知道怎么感谢了,反正我也只是拿这个学学写脚本而已,如果有人提点再好不过啦。nae6taiyie0T 写了:我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。
Sent from Tapatal
如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.
我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
那个乱码确实没法子,只好自己转了,跟网站提过建议的,不过他们还没回音;
分类的话,其实倒也不打紧,我现在都是按每篇文章来分类(手动建立文件夹而已),当然要是学会怎么自动分也很开心啊;
多线程不错啊,不过每个文件都不大,单线程一会儿也下完了,而且是不是相应可以多下几个文件呢(待求证);
另外如果是注册用户,每次下载好像都会有点小积分,不知道咱要是用脚本下,这个网站能不能识别呢?
已经写好, 需要的话可以联系我, 下载速度还行, 默认是3个下载线程.
我的gtalk 是 gsushzhsosgsu@gmail.com, 也可以发邮件
==========
17:33 更新
把程序上传到了github里, 这里: https://github.com/LiuLang/monkey-video ... er/justing
只需要下载那个justing.py文件, 然后安装必要的python3依赖包, 就可以运行了.
上次由 nae6taiyie0T 在 2014-02-18 17:33,总共编辑 1 次。