当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 29 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 19:54 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
现在我用的是中国电信的EVDO3G无线网络,有限制上网的连接时间(每月只能上200个小时,)流量不限,有时候会在网上看一些网页资料,不能整天挂在网上慢慢看的,所以用wget把经常浏览的网页都给快速镜像到本地的硬盘里,然后离线慢慢的浏览(一次连接下载,以后浏览镜像网页都不用连接到网上了), :em04
附件:
离线浏览网页.png
离线浏览网页.png [ 304.23 KiB | 被浏览 959 次 ]


比如我要在我的文档目录下一个叫做网页的文件夹里镜像苹果的官方网站
打开一个终端
输入ls
cd 文档
cd 网页
然后
wget -r -p -np -k -N -t 2 http://www.apple.com.cn/
然后回车
就开始下载啦
再如我我们要在 文档/网页/A/文件夹下镜像保存Ubuntu的中文培训课程网页(整个课程的网页都镜像下来)
我们只需要打开终端
输入
cd 文档/网页/A/
然后回车
进入A目录下
然后在输入
[size=200]wget -r -p -np -k -N -t 3 http://people.ubuntu.com/~happyaron/udc-cn/

回车
就可以把Ubuntu的中文培训课程网页给完整的镜像保存下来了 :em04
附件:
Ubuntu桌面培训中文版.png
Ubuntu桌面培训中文版.png [ 122.04 KiB | 被浏览 858 次 ]

附件:
离线浏览效果图1.png
离线浏览效果图1.png [ 172.06 KiB | 被浏览 858 次 ]

附件:
离线浏览效果图2.png
离线浏览效果图2.png [ 127.08 KiB | 被浏览 858 次 ]

附件:
离线浏览效果图3.png
离线浏览效果图3.png [ 207.2 KiB | 被浏览 858 次 ]

附件:
离线浏览效果图4.png
离线浏览效果图4.png [ 184.14 KiB | 被浏览 858 次 ]

[/size]


附件:
注意看网址是本地页面.png
注意看网址是本地页面.png [ 144.09 KiB | 被浏览 858 次 ]



最后由 binker 编辑于 2011-01-16 12:45,总共编辑了 6 次
页首
 用户资料  
 
2 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 19:58 
头像

注册: 2010-12-23 16:29
帖子: 730
地址: 北京
送出感谢: 8
接收感谢: 8
怎么做到的? 介绍下


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 20:01 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
lotutu 写道:
怎么做到的? 介绍下

用wget
你可以在网上搜索wget的用法


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 20:32 
头像

注册: 2010-12-23 16:29
帖子: 730
地址: 北京
送出感谢: 8
接收感谢: 8
嗯,刚刚看过. 这个确实不错.


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 20:40 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
lotutu 写道:
嗯,刚刚看过. 这个确实不错.

是阿,省了不少的连接时间和流量,不用重复浏览一个网站, :em04 离线浏览真舒服,想什么时候看资料都可以,镜像以后网页的页面风格效果结构都保持不变,原汁原味


最后由 binker 编辑于 2011-01-16 12:31,总共编辑了 1 次

页首
 用户资料  
 
6 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 20:56 

注册: 2010-05-22 16:30
帖子: 155
送出感谢: 0 次
接收感谢: 0 次
想法不错,我把想论坛的帖子给下载下来,回家慢慢看....不知道会不会把服务器给弄瘫痪,我能够使用的网络是60M宽带,不知道全速下载会用多久的时间。 :em06


_________________
凡尘飞扬Ubuntu Linux 开源知识技术共享,免费软件书籍电影下载
订阅我的博客
订阅我的新浪微博
订阅我的腾讯微博


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 21:00 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
kfajian 写道:
想法不错,我把想论坛的帖子给下载下来,回家慢慢看....不知道会不会把服务器给弄瘫痪,我能够使用的网络是60M宽带,不知道全速下载会用多久的时间。 :em06

当然不会瘫痪了。整个论坛的帖子加起来能有多少GB阿?不会很大的,下载一个高清的1080P电影要20多GB


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 22:20 
头像

注册: 2008-10-22 14:29
帖子: 724
送出感谢: 2
接收感谢: 1
下载下来的论坛可以随便更改吗,,,比如把一些垃圾帖子给删除了,,只留有用的部分


_________________
代码:
www.bashell.org

亲,走过路过,不要错过


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-14 22:40 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
c43035 写道:
下载下来的论坛可以随便更改吗,,,比如把一些垃圾帖子给删除了,,只留有用的部分

可以改的
你可以用网页设计工具软件修改


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-15 13:05 
头像

注册: 2010-12-23 16:29
帖子: 730
地址: 北京
送出感谢: 8
接收感谢: 8
我现在比较好奇的是,怎么有选择地下载? wget内嵌规则有无我不知道,想来即使有也不会太复杂。
而要是用脚本如Perl进行筛选后再下载,那么不是得每有一个符合的就要启动一次外部命令wget ? 这样应该不是一个好主意,
这时是不是要用到 socket 之类的? 可惜我还不会。


页首
 用户资料  
 
11 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-15 13:47 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
lotutu 写道:
我现在比较好奇的是,怎么有选择地下载? wget内嵌规则有无我不知道,想来即使有也不会太复杂。
而要是用脚本如Perl进行筛选后再下载,那么不是得每有一个符合的就要启动一次外部命令wget ? 这样应该不是一个好主意,
这时是不是要用到 socket 之类的? 可惜我还不会。

用wget命令加参数组合可以下载你想要的内容,跳过你不想要的内容
编辑好命令后保存在一个文本文件里面,然后复制粘贴到终端里面,回车,就是这么简单
正确设置好以后,你可以把你想要的整个技术资料网站给镜像下来 :em11 (我镜像了好几个小网站的资料,比如FreeBSD的中文版使用手册,Ubuntu中文培训指南,Debian用户手册,)
镜像下来,以后就可以在自己的电脑里面离线浏览这些网页资料了,不用再连接上网


页首
 用户资料  
 
12 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-15 13:56 
头像

注册: 2010-12-23 16:29
帖子: 730
地址: 北京
送出感谢: 8
接收感谢: 8
wget能复杂地选择吗? 比如 “凡是标题中含有三个以上问号或者叹号的不予理睬”这样的


页首
 用户资料  
 
13 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-15 22:24 
头像

注册: 2007-07-11 21:43
帖子: 3382
地址: 东江边
系统: archlinux
送出感谢: 15
接收感谢: 7
我这几天也想镜像一个网站。
用楼主的办法镜像不成功。
代码:
$ wget -r -p -np -k -N -t 2 http://www.mbalib.com/
--2011-01-15 22:22:19--  http://www.mbalib.com/
正在解析主机 www.mbalib.com... 110.80.7.42
正在连接 www.mbalib.com|110.80.7.42|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 403 Forbidden
2011-01-15 22:22:20 错误 403:Forbidden。

已转换 0 个文件(在 0 秒之内)。


楼主帮看看是怎么回事


_________________
我来了,我看见了,我征服了!
求勾搭,不管饭。


页首
 用户资料  
 
14 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-15 22:26 
头像

注册: 2007-07-11 21:43
帖子: 3382
地址: 东江边
系统: archlinux
送出感谢: 15
接收感谢: 7
如果服务器禁止这样的操作,有什么办法可以绕过?


_________________
我来了,我看见了,我征服了!
求勾搭,不管饭。


页首
 用户资料  
 
15 楼 
 文章标题 : Re: 把技术资料网站给镜像下来离线浏览
帖子发表于 : 2011-01-16 0:59 
头像

注册: 2008-09-10 11:54
帖子: 699
送出感谢: 0 次
接收感谢: 1
momova 写道:
我这几天也想镜像一个网站。
用楼主的办法镜像不成功。
代码:
$ wget -r -p -np -k -N -t 2 http://www.mbalib.com/
--2011-01-15 22:22:19--  http://www.mbalib.com/
正在解析主机 www.mbalib.com... 110.80.7.42
正在连接 www.mbalib.com|110.80.7.42|:80... 已连接。
已发出 HTTP 请求,正在等待回应... 403 Forbidden
2011-01-15 22:22:20 错误 403:Forbidden。

已转换 0 个文件(在 0 秒之内)。


楼主帮看看是怎么回事

你镜像的这个网站是一个搜索引擎网站,动态技术以及海量内容索引的的网站(和谷歌的网站同类型,后台都是分布式数据库),这些网站服务器规模都是很庞大的,如果镜像的话那些网络文件流量肯定很大的,我们的硬盘装不了那么多 :em04
我一般就镜像一些比较小型的技术网站(整个网站内容加起来不超过10GB的),有的网站全部页面才500多MB, :em09


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 29 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 2 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译