当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 19 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : (已解决)ubuntu系统能否实现完美保存网页元素?如何操作?
帖子发表于 : 2005-12-10 21:17 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
windows系统可以通过acrobat的虚拟打印机将网页打印成为PDF文档格式文件。遗憾的是链接都丢失了。
Ubuntu可以将网页打印成PS文件,遗憾的是同样链接丢失,而且不能通过PDF查看器浏览。oneleaf大侠告知我可以通过ps2pdf命令转换ps文件,但是转换生成的PDF文件面目全非,大部分元素都丢失了。

我为什么需要将网页保存为PDF格式呢? 因为我看到好的文章,有些需要保留整个网页的元素和布局不丢失,不变形,虽然可以另存为HTMl网页或者选择全部保存。可是单单只保存HTML文件,有不少网页元素同样会缺失,但是选择全部保存则会生成一个于HTML文件对应的存放网页素材的文件夹,这给我的文件管理带来不便。
而保存为PDF文档则是理想的。一来单个文件就能保留网页原来风貌,而来可以跨平台查阅。

在windows系统下没有能够完美解决这个问题(好象有些非adobe公司的PDF虚拟打印机程序可以实现连超级链接元素都保存,不过都是商业软件,太贵了……试用还会在文件后头加盖一个“戳记”……)。不知道Ubuntu系统下我能否实现acrobat打印机的功能,或者能够更加完美的解决这个问题呢?


最后由 oliver 编辑于 2007-01-08 19:12,总共编辑了 3 次

页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2005-12-10 21:53 
头像

注册: 2005-03-26 9:38
帖子: 521
送出感谢: 0 次
接收感谢: 0 次
网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。


_________________
图片


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2005-12-10 21:59 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
我是指我在互联网上面浏览的任意网页,而非保存到本地硬盘的HTML文件。我随时有可能想将看到的网页保存到自己的电脑上。
freeflying 写道:
网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。


页首
 用户资料  
 
4 楼 
 文章标题 :
帖子发表于 : 2005-12-10 22:12 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
http://main.linuxfocus.org/有详细的说明。带连接的。我以前试过。


_________________
● 鸣学


页首
 用户资料  
 
5 楼 
 文章标题 :
帖子发表于 : 2005-12-10 22:33 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
您是指下载acrobat for linux?我倒是下载了一个老板本的acrobat,至于7.0版本for linux的我没有找到,可是acrobat是商业软件……widnows平台有注册机。但是linux系统我刚接触……各方面还都不熟悉……您给得网址我看了,上头有文章命为“在 KDE 里和 kprinter 一起使用 Adobe Acrobat Reader 7”提到acrobat7.0 for linux,可是,还是似乎还是不能解决我的问题。
eexpress 写道:
http://main.linuxfocus.org/有详细的说明。带连接的。我以前试过。


页首
 用户资料  
 
6 楼 
 文章标题 :
帖子发表于 : 2005-12-10 23:30 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
不是的。找找。就是打印时,可以带链接的文章。


_________________
● 鸣学


页首
 用户资料  
 
7 楼 
 文章标题 :
帖子发表于 : 2005-12-10 23:53 
头像

注册: 2005-10-25 11:15
帖子: 1016
送出感谢: 0 次
接收感谢: 1
代码:
wget -E -k -p -H http://www.somewhere.com


_________________
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser


页首
 用户资料  
 
8 楼 
 文章标题 :
帖子发表于 : 2005-12-11 8:12 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/February2005/article366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写道:
不是的。找找。就是打印时,可以带链接的文章。


页首
 用户资料  
 
9 楼 
 文章标题 :
帖子发表于 : 2005-12-11 8:16 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
laborer 写道:
代码:
wget -E -k -p -H http://www.somewhere.com


把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。


页首
 用户资料  
 
10 楼 
 文章标题 :
帖子发表于 : 2005-12-11 10:41 
论坛管理员

注册: 2005-03-27 0:06
帖子: 10116
系统: Ubuntu 12.04
送出感谢: 7
接收感谢: 128
oliver 写道:
找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/February2005/article366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写道:
不是的。找找。就是打印时,可以带链接的文章。


http://www.htmldoc.org/documentation.ph ... LFile.html
http://www.htmldoc.org/documentation.ph ... tFile.html

htmldoc -t pdf -webpage -f file.pdf file.html


页首
 用户资料  
 
11 楼 
 文章标题 :
帖子发表于 : 2005-12-11 10:54 
头像

注册: 2005-10-25 11:15
帖子: 1016
送出感谢: 0 次
接收感谢: 1
oliver 写道:
laborer 写道:
代码:
wget -E -k -p -H http://www.somewhere.com


把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。


https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。


_________________
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser


页首
 用户资料  
 
12 楼 
 文章标题 :
帖子发表于 : 2005-12-11 10:54 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
在终端中输入htmldoc以后打开htmldoc程序窗口,然后我input了一个任意的HTML文件,再output为PDF Format,但是save以后生成的却是一个以.book后缀的纯文本文件。

oneleaf 写道:


页首
 用户资料  
 
13 楼 
 文章标题 :
帖子发表于 : 2005-12-11 11:14 
头像

注册: 2005-10-05 11:31
帖子: 775
送出感谢: 0 次
接收感谢: 0 次
我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。

laborer 写道:

https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。


页首
 用户资料  
 
14 楼 
 文章标题 :
帖子发表于 : 2005-12-11 12:00 

注册: 2005-07-27 18:39
帖子: 117
送出感谢: 0 次
接收感谢: 0 次
oliver 写道:
我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。


这个插件应该可用啊.在终端的~/Desktop目录下ls看看

.mht在windows下也是很方便的保存单一页面元素的格式.


页首
 用户资料  
 
15 楼 
 文章标题 :
帖子发表于 : 2005-12-12 9:20 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
就是html2ps。ps2pdf。这样的。我试过,链接都在。htmldoc的没试过,想来就不会很正常。


_________________
● 鸣学


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 19 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译