WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

由本社区发起的开源项目
回复
Bill Lee
帖子: 598
注册时间: 2009-09-19 20:50

WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

#1

帖子 Bill Lee » 2011-06-01 18:23

Firefox 可以保存单个网页,但是,当有一大堆互相链接的网页时, Firefox 就力不从心了,它可以保存,但是在浏览这些网页时点击链接却有会被带到 Internet 上。
利用 wget -p -k 可以把整个网站保存,并且把链接转换成本地的相对链接。
但是 wget 要一个个输入网址的话,非累死不可,于是我用 PyQt4 写了这个 GUI 前端,通过简单的通配符(*),自动生成带数字的 URL 列表(想想分页的文章,往往是 http://domin.com/page_03.htm),调用 wget 保存网站,在很短的时间内做出来的,目前功能比较简单,以后有空再完善。
Licensed under GNU GPLv3
WebArchiver 0.0.1 archiving Google.com and Google.com.hk
WebArchiver 0.0.1 archiving Google.com and Google.com.hk
Known bugs:
1. 终端输出不能格式化
4. Wget 会遵循 robots.txt, 导致部分网站无法下载。(这个功能竟然不能在 wget 里关掉)
Fixed bugs:
2. 没有输入任何 URL 时若点击 Start Download 会导致界面被禁用。 (Fixed in 0.0.2)
3. Remove 按钮未实现。 (Fixed in 0.0.2)

下载:
WebArchiver-0.0.2.tar.bz2
WebArchiver 0.0.2
(30 KiB) 已下载 379 次
展开直接运行 WebArchiver.py, 需要安装 python-qt4 运行环境。
例子:
要下载 http://abc.com/somepage.html, http://abc.com/somepage_2.html, ..., http://abc.com/somepage_11.html
则设置模板为, http://abc.com/somepage_*.html, 通配符长度为 1, 起始为 2, 结束为 11. 即可添加 2 到 11 页。然后在添加 http://abc.com/somepage.html,点击 Start Download 即可调用 Wget 下载。
上次由 Bill Lee 在 2011-06-04 10:07,总共编辑 1 次。
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
头像
枫叶饭团
帖子: 14683
注册时间: 2010-06-16 1:05
系统: Mac OS X
来自: Tencent
联系:

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

#2

帖子 枫叶饭团 » 2011-06-01 19:25

这个必须顶 :em11
Bill Lee
帖子: 598
注册时间: 2009-09-19 20:50

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

#3

帖子 Bill Lee » 2011-06-04 10:21

修复了一个很严重的错误 (bug 3)
:em06
图片没更新
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记
andy_npf
帖子: 3
注册时间: 2009-10-18 15:53

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

#4

帖子 andy_npf » 2014-02-23 14:48

WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端
收藏了
头像
fuhaoyun
帖子: 526
注册时间: 2009-05-08 14:12
来自: http://weibo.com/u/2201287863

Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)

#5

帖子 fuhaoyun » 2014-03-14 10:18

这么好的东西,还在还在开发么 :em02

只用Ubuntu/Unity:安全、高效、自由、简洁!
http://weibo.com/u/2201287863
----------------------------------------------------
用了4年Ubuntu,发现离开windows也可以活得很好
看球赛、炒股、聊天、office等等都不算问题了
一切都是习惯,困难解决了就好

回复