分页: 1 / 2

(已解决)ubuntu系统能否实现完美保存网页元素?如何操作?

发表于 : 2005-12-10 21:17
oliver
windows系统可以通过acrobat的虚拟打印机将网页打印成为PDF文档格式文件。遗憾的是链接都丢失了。
Ubuntu可以将网页打印成PS文件,遗憾的是同样链接丢失,而且不能通过PDF查看器浏览。oneleaf大侠告知我可以通过ps2pdf命令转换ps文件,但是转换生成的PDF文件面目全非,大部分元素都丢失了。

我为什么需要将网页保存为PDF格式呢? 因为我看到好的文章,有些需要保留整个网页的元素和布局不丢失,不变形,虽然可以另存为HTMl网页或者选择全部保存。可是单单只保存HTML文件,有不少网页元素同样会缺失,但是选择全部保存则会生成一个于HTML文件对应的存放网页素材的文件夹,这给我的文件管理带来不便。
而保存为PDF文档则是理想的。一来单个文件就能保留网页原来风貌,而来可以跨平台查阅。

在windows系统下没有能够完美解决这个问题(好象有些非adobe公司的PDF虚拟打印机程序可以实现连超级链接元素都保存,不过都是商业软件,太贵了……试用还会在文件后头加盖一个“戳记”……)。不知道Ubuntu系统下我能否实现acrobat打印机的功能,或者能够更加完美的解决这个问题呢?

发表于 : 2005-12-10 21:53
freeflying
网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。

发表于 : 2005-12-10 21:59
oliver
我是指我在互联网上面浏览的任意网页,而非保存到本地硬盘的HTML文件。我随时有可能想将看到的网页保存到自己的电脑上。
freeflying 写了:网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。

发表于 : 2005-12-10 22:12
eexpress

发表于 : 2005-12-10 22:33
oliver
您是指下载acrobat for linux?我倒是下载了一个老板本的acrobat,至于7.0版本for linux的我没有找到,可是acrobat是商业软件……widnows平台有注册机。但是linux系统我刚接触……各方面还都不熟悉……您给得网址我看了,上头有文章命为“在 KDE 里和 kprinter 一起使用 Adobe Acrobat Reader 7”提到acrobat7.0 for linux,可是,还是似乎还是不能解决我的问题。

发表于 : 2005-12-10 23:30
eexpress
不是的。找找。就是打印时,可以带链接的文章。

发表于 : 2005-12-10 23:53
laborer

代码: 全选

wget -E -k -p -H http://www.somewhere.com

发表于 : 2005-12-11 8:12
oliver
找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。

发表于 : 2005-12-11 8:16
oliver
laborer 写了:

代码: 全选

wget -E -k -p -H http://www.somewhere.com
把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。

发表于 : 2005-12-11 10:41
oneleaf
oliver 写了:找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。
http://www.htmldoc.org/documentation.ph ... LFile.html
http://www.htmldoc.org/documentation.ph ... tFile.html

htmldoc -t pdf -webpage -f file.pdf file.html

发表于 : 2005-12-11 10:54
laborer
oliver 写了:
laborer 写了:

代码: 全选

wget -E -k -p -H http://www.somewhere.com
把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。
https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。

发表于 : 2005-12-11 10:54
oliver
在终端中输入htmldoc以后打开htmldoc程序窗口,然后我input了一个任意的HTML文件,再output为PDF Format,但是save以后生成的却是一个以.book后缀的纯文本文件。

发表于 : 2005-12-11 11:14
oliver
我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。
laborer 写了:
https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。

发表于 : 2005-12-11 12:00
苍紫云龙
oliver 写了:我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。
这个插件应该可用啊.在终端的~/Desktop目录下ls看看

.mht在windows下也是很方便的保存单一页面元素的格式.

发表于 : 2005-12-12 9:20
eexpress
就是html2ps。ps2pdf。这样的。我试过,链接都在。htmldoc的没试过,想来就不会很正常。