[求指导]如何利用脚本/程序从静雅思听网站下载音乐文件?

sh/bash/dash/ksh/zsh等Shell脚本
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

[求指导]如何利用脚本/程序从静雅思听网站下载音乐文件?

#1

帖子 highwind » 2014-02-15 12:15

网页地址:http://www.justing.com.cn/page/74012.html
右键另存为链接:http://www.justing.com.cn/download.jsp?id=74012
最后的下载链接是:http://dl.justing.com.cn/page/瘾的世纪.mp3

请教如何从另存为链接得到最后的下载链接呀?
上次由 highwind 在 2014-02-18 2:28,总共编辑 1 次。
头像
YeLee
论坛版主
帖子: 26406
注册时间: 2008-08-13 8:48
系统: Fundu i64
来自: 东海硇州,一双管钥。
联系:

Re: [求指导]如何从这个网页下载音乐文件?

#2

帖子 YeLee » 2014-02-15 12:33

代码: 全选

wget -q "http://www.justing.com.cn/page/74012.html" -O -|grep -oP "(?<=<div class=\"title\" id=\"title\").*" |sed 's=^[^\>]*>\([^\<]*\)<.*=http://dl.justing.com.cn/page/\1.mp3=g'
那东西下载还要登录的……不过,假如下载地址有个规律的话,应该可以这样用的吧。 :em20
◎当我站在道德的高度上俯视别人的时候,发现自己是多么渺小。
♥执着但不偏激,反对而不排斥,坚决捍卫矛盾体的存在方式。
★★★天气预报★★★
fcitx-yatable一个可以使用的码表输入法
[教程]几个实例攻克软件编译难关
Gentoo Development Guide
字体相关
jinjiachen
帖子: 2148
注册时间: 2012-12-16 15:43
系统: debian

Re: [求指导]如何从这个网页下载音乐文件?

#3

帖子 jinjiachen » 2014-02-15 16:13

下载器不会自动解析?
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

Re: [求指导]如何从这个网页下载音乐文件?

#4

帖子 eexpress » 2014-02-15 17:05

oncontextmenu="fDownload(event)"
oncontextmenu="fBogoDown(event)"
script src="http://ajax.googleapis.com/ajax/libs/

这不能用爬虫下载了。
● 鸣学
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#5

帖子 highwind » 2014-02-15 21:20

谢谢呀,虽然有些具体的参数含义不懂,不过我猜大致意思是截取文件名插入到链接里吧。我想问问1为啥要右键另存为才能得到这个地址?2这个动作脚本可以模拟吗?


Sent from my iPod touch using Tapatalk
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#6

帖子 highwind » 2014-02-15 21:24

谢谢ee ,请问您是怎么看出来爬虫不能下载这个问题呢? 您列举代码的含义是? 或者我应该查js方面的书吗?



Sent from my iPod touch using Tapatalk
头像
mjp123
帖子: 703
注册时间: 2009-04-09 15:06

Re: [求指导]如何从这个网页下载音乐文件?

#7

帖子 mjp123 » 2014-02-16 9:36

由于其下载url有很强的规律,所以“爬虫”可以,
其实,写个油侯脚本可能更加方便下载。
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#8

帖子 highwind » 2014-02-16 11:09

谢谢提示,这也是个好主意。 可是还是不懂为什么右键另存为才能得到链接呢?



Sent from my iPod touch using Tapatalk
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid

Re: [求指导]如何从这个网页下载音乐文件?

#9

帖子 nae6taiyie0T » 2014-02-17 13:26

不难.

刚才看了一下, 写了个油㺅脚本, 会自动在页面的右下角生成最终的mp3的下载地址.
* 不需要登录
* 不需要启用页面的javascript
* 不需要启用cookie

脚本可以在这里下载: https://github.com/LiuLang/monkey-videos

另附截图:
附件
justingHTML5-demo.png
justingHTML5-demo.png (19.94 KiB) 查看 6746 次
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#10

帖子 highwind » 2014-02-18 0:26

:em06 我才把那个sed看明白了,正准备再去捣鼓油猴呢,您就已经写好啦, :em05 。我去学习学习啊,看看怎么加一个自动下载(不过网站好像是限线程的)。
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid

Re: [求指导]如何从这个网页下载音乐文件?

#11

帖子 nae6taiyie0T » 2014-02-18 0:35

highwind 写了::em06 我才把那个sed看明白了,正准备再去捣鼓油猴呢,您就已经写好啦, :em05 。我去学习学习啊,看看怎么加一个自动下载(不过网站好像是限线程的)。
@highwind

你需要的是批量下载?
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#12

帖子 highwind » 2014-02-18 1:29

我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。


Sent from Tapatal
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid

Re: [求指导]如何从这个网页下载音乐文件?

#13

帖子 nae6taiyie0T » 2014-02-18 1:45

highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。


Sent from Tapatal
我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.

如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.

我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: [求指导]如何从这个网页下载音乐文件?

#14

帖子 highwind » 2014-02-18 2:27

nae6taiyie0T 写了:
highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。


Sent from Tapatal
我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.

如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.

我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
哇塞,都不知道怎么感谢了,反正我也只是拿这个学学写脚本而已,如果有人提点再好不过啦。
那个乱码确实没法子,只好自己转了,跟网站提过建议的,不过他们还没回音;
分类的话,其实倒也不打紧,我现在都是按每篇文章来分类(手动建立文件夹而已),当然要是学会怎么自动分也很开心啊;
多线程不错啊,不过每个文件都不大,单线程一会儿也下完了,而且是不是相应可以多下几个文件呢(待求证);
另外如果是注册用户,每次下载好像都会有点小积分,不知道咱要是用脚本下,这个网站能不能识别呢? :em09
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid

Re: [求指导]如何从这个网页下载音乐文件?

#15

帖子 nae6taiyie0T » 2014-02-18 15:29

highwind 写了:
nae6taiyie0T 写了:
highwind 写了:我是想一步一步来的,先学下一个 再看能不能下一批,因为每天每个类别都有更新。
因为蛮喜欢这个网站的,就是不知道这样多网站会不会有啥不利的。


Sent from Tapatal
我刚开试了下, 是可以批量下载的, 我同时下载了6首mp3, 没问题.

如果考虑网站负担的话, 不妨在晚上睡觉前开始下载, 因为零晨以后的网速快, 网站的访问量也很小了.

我可以帮你写一个下载的程序, 刚才我想了一下, 可以有这些功能:
* 自动分类
* 自动将mp3的标签转为UTF8格式的, 因为它默认的是gbk, 会有乱码.
* 多线程下载.
哇塞,都不知道怎么感谢了,反正我也只是拿这个学学写脚本而已,如果有人提点再好不过啦。
那个乱码确实没法子,只好自己转了,跟网站提过建议的,不过他们还没回音;
分类的话,其实倒也不打紧,我现在都是按每篇文章来分类(手动建立文件夹而已),当然要是学会怎么自动分也很开心啊;
多线程不错啊,不过每个文件都不大,单线程一会儿也下完了,而且是不是相应可以多下几个文件呢(待求证);
另外如果是注册用户,每次下载好像都会有点小积分,不知道咱要是用脚本下,这个网站能不能识别呢? :em09
@highwind
已经写好, 需要的话可以联系我, 下载速度还行, 默认是3个下载线程.
我的gtalk 是 gsushzhsosgsu@gmail.com, 也可以发邮件

==========
17:33 更新
把程序上传到了github里, 这里: https://github.com/LiuLang/monkey-video ... er/justing
只需要下载那个justing.py文件, 然后安装必要的python3依赖包, 就可以运行了.
上次由 nae6taiyie0T 在 2014-02-18 17:33,总共编辑 1 次。
回复