当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 15 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 制作镜像网站
帖子发表于 : 2008-08-21 21:21 
头像

注册: 2006-09-21 14:28
帖子: 2376
送出感谢: 0 次
接收感谢: 0 次
我尝试了google “wget 镜像”出来的前二页结果不起作用。

目标是
http://www.w3school.com.cn

理想结果是可以本地浏览,有图像,有样式。

请问如果做?


_________________
http://lee.youxu.info/


页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-08-21 21:22 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
这个网站很巨型的说。。


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-08-23 17:37 
头像

注册: 2006-09-21 14:28
帖子: 2376
送出感谢: 0 次
接收感谢: 0 次
容量根本不是要考虑的问题……


该死的猫,学EE,答问题从来不答到点子上来……


_________________
http://lee.youxu.info/


页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2008-08-23 18:40 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
我抓网页用 ScrapBook


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2008-08-23 20:05 
头像

注册: 2006-04-05 18:12
帖子: 474
送出感谢: 0 次
接收感谢: 0 次
貌似css或者图片文件的路径有问题,在前面都加了一个“/”,我刚才试着改回去就好了,不过要是全部手工改。。。


_________________
Fedora Notes


页首
 用户资料  
 
6 楼 
 文章标题 :
帖子发表于 : 2008-08-23 20:26 
头像

注册: 2006-04-05 18:12
帖子: 474
送出感谢: 0 次
接收感谢: 0 次
刚才又试了一下,如果在apache里面,也就是自己架一个apache,然后把下载的整站放到里面就好使 了,但是如果在本地用firefox打开还是会出现找不到图片的问题。
问题的起因就是每个文件前面的“/”(看源代码)!!!
我估计这个就是作网站时候为了防止别人下载整站用的,可是还应该有解决办法的,但是不是用wget
写个脚本作批量替换就好了,把
引用:
="/
替换成
引用:
="./
就好了


_________________
Fedora Notes


页首
 用户资料  
 
7 楼 
 文章标题 :
帖子发表于 : 2008-08-23 20:38 
头像

注册: 2006-04-05 18:12
帖子: 474
送出感谢: 0 次
接收感谢: 0 次
又发现了一个解决办法:
刚才忽然发现/其实就是linux下根目录的意思,也就是说可以把index.html同级的文件全部放到根目录下(貌似有点疯狂)
其实就是把html源代码里面的/c3.css这样的结构理解成了linux下的根目录下的c3.css的意思。


_________________
Fedora Notes


页首
 用户资料  
 
8 楼 
 文章标题 :
帖子发表于 : 2008-08-24 11:32 
头像

注册: 2006-09-21 14:28
帖子: 2376
送出感谢: 0 次
接收感谢: 0 次
楼上的,请写个实用脚本吧


_________________
http://lee.youxu.info/


页首
 用户资料  
 
9 楼 
 文章标题 :
帖子发表于 : 2008-08-24 12:15 
头像

注册: 2007-09-29 3:09
帖子: 5773
送出感谢: 0 次
接收感谢: 3
xiaomao101 写道:
又发现了一个解决办法:
刚才忽然发现/其实就是linux下根目录的意思,也就是说可以把index.html同级的文件全部放到根目录下(貌似有点疯狂)
其实就是把html源代码里面的/c3.css这样的结构理解成了linux下的根目录下的c3.css的意思。


本来目录就是这样分层的啊...


_________________
HUNT Unfortunately No Talent...


页首
 用户资料  
 
10 楼 
 文章标题 :
帖子发表于 : 2008-08-24 13:31 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
xiaomao101 写道:
刚才又试了一下,如果在apache里面,也就是自己架一个apache,然后把下载的整站放到里面就好使 了,但是如果在本地用firefox打开还是会出现找不到图片的问题。
问题的起因就是每个文件前面的“/”(看源代码)!!!
我估计这个就是作网站时候为了防止别人下载整站用的,可是还应该有解决办法的,但是不是用wget
写个脚本作批量替换就好了,把
引用:
="/
替换成
引用:
="./
就好了


这个不是防止别人下载整站的,因为此根非彼根


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
11 楼 
 文章标题 :
帖子发表于 : 2008-08-24 13:38 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
代码:
       --convert-links
           After the download is complete, convert the links in the document
           to make them suitable for local viewing.  This affects not only the
           visible hyperlinks, but any part of the document that links to
           external content, such as embedded images, links to style sheets,
           hyperlinks to non-HTML content, etc.

           Each link will be changed in one of the two ways:

           *   The links to files that have been downloaded by Wget will be
               changed to refer to the file they point to as a relative link.

               Example: if the downloaded file /foo/doc.html links to
               /bar/img.gif, also downloaded, then the link in doc.html will
               be modified to point to ../bar/img.gif.  This kind of transfor-
               mation works reliably for arbitrary combinations of directo-
               ries.

           *   The links to files that have not been downloaded by Wget will
               be changed to include host name and absolute path of the loca-
               tion they point to.

               Example: if the downloaded file /foo/doc.html links to
               /bar/img.gif (or to ../bar/img.gif), then the link in doc.html
               will be modified to point to http://hostname/bar/img.gif.

           Because of this, local browsing works reliably: if a linked file
           was downloaded, the link will refer to its local name; if it was
           not downloaded, the link will refer to its full Internet address
           rather than presenting a broken link.  The fact that the former
           links are converted to relative links ensures that you can move the
           downloaded hierarchy to another directory.

           Note that only at the end of the download can Wget know which links
           have been downloaded.  Because of that, the work done by -k will be
           performed at the end of all the downloads.


用 k 参数了么


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
12 楼 
 文章标题 :
帖子发表于 : 2008-08-24 20:06 
头像

注册: 2006-09-21 14:28
帖子: 2376
送出感谢: 0 次
接收感谢: 0 次
用了k。

你在几分种内想到的可能,我都试过了。

google出来的结果,有一个是一个会一点python写了一个脚本,也是针对一个垃圾ASP网站制镜像的,但是那个脚本我运行出错,我不会python,暂时也没空学。


_________________
http://lee.youxu.info/


页首
 用户资料  
 
13 楼 
 文章标题 :
帖子发表于 : 2008-08-24 21:16 
头像

注册: 2006-04-05 18:12
帖子: 474
送出感谢: 0 次
接收感谢: 0 次
flyinflash 写道:
楼上的,请写个实用脚本吧

呵呵,我不会 shell 阿,要不 早就 写了。


_________________
Fedora Notes


页首
 用户资料  
 
14 楼 
 文章标题 :
帖子发表于 : 2008-08-24 21:21 
头像

注册: 2006-04-05 18:12
帖子: 474
送出感谢: 0 次
接收感谢: 0 次
要不 lz自己 架一个轻量级的http把


_________________
Fedora Notes


页首
 用户资料  
 
15 楼 
 文章标题 :
帖子发表于 : 2008-08-25 0:45 
头像

注册: 2006-10-18 12:57
帖子: 417
送出感谢: 0 次
接收感谢: 1
可能的话还是备份http://www.w3schools.com/吧^_^


_________________
http://twitter.com/nothining
Mail: bjdfzster@gmail.com
南京的开源活动几乎是0,希望能有人组织下(也可以拉我入伙^_^)
最近在从零开始学习Linux程序设计,加油……


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 15 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 4 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译