[三星]脚本抓取youku.com的视频

除了美化之外,还可以来尝试挑战一下任务
回复
头像
oneleaf
论坛管理员
帖子: 10230
注册时间: 2005-03-27 0:06
系统: Ubuntu 12.04
送出感谢: 7 次
接收感谢: 103 次

[三星]脚本抓取youku.com的视频

#1

帖子 oneleaf » 2013-12-26 10:31

1 任务内容: 分析优酷的链接并保存视频,可以考虑在html5模式下抓取。

2 任务的难度: 三星

3 任务的目的: 脚本掌握

4 任务所涉及的软件: Ubuntu

5 任务将大致消耗的时间: 1周
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: [三星]脚本抓取youku.com的视频

#2

帖子 eexpress » 2013-12-26 10:35

没js实时解析的,脚本咋搞得定。而且youku的js监视广告播放,跳不过去。
如果外挂的,flash-down.pl 早发过。
html5的没看过啊。还要伪装成手机浏览器?
● 鸣学
头像
oneleaf
论坛管理员
帖子: 10230
注册时间: 2005-03-27 0:06
系统: Ubuntu 12.04
送出感谢: 7 次
接收感谢: 103 次

Re: [三星]脚本抓取youku.com的视频

#3

帖子 oneleaf » 2013-12-26 10:38

最后一句正解。 :em09
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙
送出感谢: 4 次
接收感谢: 256 次

Re: [三星]脚本抓取youku.com的视频

#4

帖子 eexpress » 2013-12-26 10:40

html5的看不了。
继续youtube。lol
● 鸣学
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid
送出感谢: 0
接收感谢: 46 次

Re: [三星]脚本抓取youku.com的视频

#5

帖子 nae6taiyie0T » 2013-12-26 12:40

只要获取一个视频的VID, 就可以取得它的所有格式的视频地址.

比较麻烦的是分类, 但总体来说, youku.com里面用的页面模板并不多, 比cntv少很多了.
手头上正在进行的项目(还没写完, 没发布), 里面有youku的部分, 下面附加的代码就是解析用户页面的, 主要解析本用户的基本信息, 所有视频和专辑.
还有其它页面, 比如soku的搜索页, starpage, showpage, playpage, categoriesPage等, 也类似, 但还没写完.

这是解析模块, 得到的数据可以通过数据模块保存下来, 比如存到数据库中. 用python来写的, 舒服
您没有权限查看这个主题的附件。
nae6taiyie0T
帖子: 482
注册时间: 2013-09-13 0:42
系统: Debian sid
送出感谢: 0
接收感谢: 46 次

Re: [三星]脚本抓取youku.com的视频

#6

帖子 nae6taiyie0T » 2013-12-26 12:45

可能我理解错了, 如果只想从某个链接地址中得到视频下载地址的话, 也有不少现成的开源项目:

比如, 我之前发过的, https://github.com/wenketel/monkey-videos 是js脚本.
另一个, you-get https://github.com/soimort/you-get , 是用python3写的.
https://github.com/rg3/youtube-dl, 这个是国外朋友维护的, 也支持几个国内视频网站.
头像
oneleaf
论坛管理员
帖子: 10230
注册时间: 2005-03-27 0:06
系统: Ubuntu 12.04
送出感谢: 7 次
接收感谢: 103 次

Re: [三星]脚本抓取youku.com的视频

#7

帖子 oneleaf » 2013-12-26 13:03

:em01
头像
mjp123
帖子: 685
注册时间: 2009-04-09 15:06
送出感谢: 1 次
接收感谢: 12 次

Re: [三星]脚本抓取youku.com的视频

#8

帖子 mjp123 » 2013-12-26 13:10

eexpress 写了:html5的看不了。
m3u8用vlc看。
回复

回到 “非常任务”