当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 5 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
帖子发表于 : 2011-06-01 18:23 

注册: 2009-09-19 20:50
帖子: 598
送出感谢: 0 次
接收感谢: 2
Firefox 可以保存单个网页,但是,当有一大堆互相链接的网页时, Firefox 就力不从心了,它可以保存,但是在浏览这些网页时点击链接却有会被带到 Internet 上。
利用 wget -p -k 可以把整个网站保存,并且把链接转换成本地的相对链接。
但是 wget 要一个个输入网址的话,非累死不可,于是我用 PyQt4 写了这个 GUI 前端,通过简单的通配符(*),自动生成带数字的 URL 列表(想想分页的文章,往往是 http://domin.com/page_03.htm),调用 wget 保存网站,在很短的时间内做出来的,目前功能比较简单,以后有空再完善。
Licensed under GNU GPLv3
附件:
文件注释: WebArchiver 0.0.1 archiving Google.com and Google.com.hk
Screenshot-WebArchiver.png
Screenshot-WebArchiver.png [ 38.83 KiB | 被浏览 7115 次 ]


Known bugs:
1. 终端输出不能格式化
4. Wget 会遵循 robots.txt, 导致部分网站无法下载。(这个功能竟然不能在 wget 里关掉)
Fixed bugs:
2. 没有输入任何 URL 时若点击 Start Download 会导致界面被禁用。 (Fixed in 0.0.2)
3. Remove 按钮未实现。 (Fixed in 0.0.2)

下载:
附件:
文件注释: WebArchiver 0.0.2
WebArchiver-0.0.2.tar.bz2 [30 KiB]
被下载 147 次

展开直接运行 WebArchiver.py, 需要安装 python-qt4 运行环境。
例子:
要下载 http://abc.com/somepage.html, http://abc.com/somepage_2.html, ..., http://abc.com/somepage_11.html
则设置模板为, http://abc.com/somepage_*.html, 通配符长度为 1, 起始为 2, 结束为 11. 即可添加 2 到 11 页。然后在添加 http://abc.com/somepage.html,点击 Start Download 即可调用 Wget 下载。


_________________
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记


最后由 Bill Lee 编辑于 2011-06-04 10:07,总共编辑了 1 次

页首
 用户资料  
 
2 楼 
 文章标题 : Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
帖子发表于 : 2011-06-01 19:25 
头像

注册: 2010-06-16 1:05
帖子: 14684
地址: Tencent
系统: Mac OS X
送出感谢: 1
接收感谢: 153
这个必须顶 :em11


_________________
twitter求fo:http://twitter.com/maplebeats
博客求踩:http://maplebeats.com


页首
 用户资料  
 
3 楼 
 文章标题 : Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
帖子发表于 : 2011-06-04 10:21 

注册: 2009-09-19 20:50
帖子: 598
送出感谢: 0 次
接收感谢: 2
修复了一个很严重的错误 (bug 3)
:em06
图片没更新


_________________
aMule 2.3.1 is coming...
真正动态的 amule-dlp is coming...
本人帐号在2011年1月被盗,在2011年1月3日17:19到2010年1月6日13:34之间本帐号发的一切帖子、短信等与本人无关!
amule-dlp 开发动态
amule-dlp on Google Code
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
Linux 2.6.34 编译笔记


页首
 用户资料  
 
4 楼 
 文章标题 : Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
帖子发表于 : 2014-02-23 14:48 

注册: 2009-10-18 15:53
帖子: 3
送出感谢: 0 次
接收感谢: 0 次
WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端
收藏了


页首
 用户资料  
 
5 楼 
 文章标题 : Re: WebArchiver - 基于 wget 的网页归档工具(PyQt4 GUI 前端)
帖子发表于 : 2014-03-14 10:18 
头像

注册: 2009-05-08 14:12
帖子: 526
地址: http://weibo.com/u/2201287863
送出感谢: 2
接收感谢: 4
这么好的东西,还在还在开发么 :em02


_________________

只用Ubuntu/Unity:安全、高效、自由、简洁!
http://weibo.com/u/2201287863
----------------------------------------------------
用了4年Ubuntu,发现离开windows也可以活得很好
看球赛、炒股、聊天、office等等都不算问题了
一切都是习惯,困难解决了就好



页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 5 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译