(已解决)ubuntu系统能否实现完美保存网页元素?如何操作?

OOo,TeX,KO,ABI,GIMP,Picasa,ProE,QCAD,Inkscape,Kicad,Eagle
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

(已解决)ubuntu系统能否实现完美保存网页元素?如何操作?

#1

帖子 oliver » 2005-12-10 21:17

windows系统可以通过acrobat的虚拟打印机将网页打印成为PDF文档格式文件。遗憾的是链接都丢失了。
Ubuntu可以将网页打印成PS文件,遗憾的是同样链接丢失,而且不能通过PDF查看器浏览。oneleaf大侠告知我可以通过ps2pdf命令转换ps文件,但是转换生成的PDF文件面目全非,大部分元素都丢失了。

我为什么需要将网页保存为PDF格式呢? 因为我看到好的文章,有些需要保留整个网页的元素和布局不丢失,不变形,虽然可以另存为HTMl网页或者选择全部保存。可是单单只保存HTML文件,有不少网页元素同样会缺失,但是选择全部保存则会生成一个于HTML文件对应的存放网页素材的文件夹,这给我的文件管理带来不便。
而保存为PDF文档则是理想的。一来单个文件就能保留网页原来风貌,而来可以跨平台查阅。

在windows系统下没有能够完美解决这个问题(好象有些非adobe公司的PDF虚拟打印机程序可以实现连超级链接元素都保存,不过都是商业软件,太贵了……试用还会在文件后头加盖一个“戳记”……)。不知道Ubuntu系统下我能否实现acrobat打印机的功能,或者能够更加完美的解决这个问题呢?
上次由 oliver 在 2007-01-08 19:12,总共编辑 3 次。
头像
freeflying
帖子: 521
注册时间: 2005-03-26 9:38

#2

帖子 freeflying » 2005-12-10 21:53

网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。
图片
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#3

帖子 oliver » 2005-12-10 21:59

我是指我在互联网上面浏览的任意网页,而非保存到本地硬盘的HTML文件。我随时有可能想将看到的网页保存到自己的电脑上。
freeflying 写了:网页?如果你使用标准的标记语言,如xml这些,可以很方便的在各种格式之间转换的。
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#4

帖子 eexpress » 2005-12-10 22:12

● 鸣学
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#5

帖子 oliver » 2005-12-10 22:33

您是指下载acrobat for linux?我倒是下载了一个老板本的acrobat,至于7.0版本for linux的我没有找到,可是acrobat是商业软件……widnows平台有注册机。但是linux系统我刚接触……各方面还都不熟悉……您给得网址我看了,上头有文章命为“在 KDE 里和 kprinter 一起使用 Adobe Acrobat Reader 7”提到acrobat7.0 for linux,可是,还是似乎还是不能解决我的问题。
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#6

帖子 eexpress » 2005-12-10 23:30

不是的。找找。就是打印时,可以带链接的文章。
● 鸣学
头像
laborer
帖子: 1016
注册时间: 2005-10-25 11:15
联系:

#7

帖子 laborer » 2005-12-10 23:53

代码: 全选

wget -E -k -p -H http://www.somewhere.com
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#8

帖子 oliver » 2005-12-11 8:12

找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#9

帖子 oliver » 2005-12-11 8:16

laborer 写了:

代码: 全选

wget -E -k -p -H http://www.somewhere.com
把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。
头像
oneleaf
论坛管理员
帖子: 10441
注册时间: 2005-03-27 0:06
系统: Ubuntu 12.04

#10

帖子 oneleaf » 2005-12-11 10:41

oliver 写了:找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。
http://www.htmldoc.org/documentation.ph ... LFile.html
http://www.htmldoc.org/documentation.ph ... tFile.html

htmldoc -t pdf -webpage -f file.pdf file.html
头像
laborer
帖子: 1016
注册时间: 2005-10-25 11:15
联系:

#11

帖子 laborer » 2005-12-11 10:54

oliver 写了:
laborer 写了:

代码: 全选

wget -E -k -p -H http://www.somewhere.com
把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。

所以我才想着将网页转换为PDF文件保存。
https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#12

帖子 oliver » 2005-12-11 10:54

在终端中输入htmldoc以后打开htmldoc程序窗口,然后我input了一个任意的HTML文件,再output为PDF Format,但是save以后生成的却是一个以.book后缀的纯文本文件。
头像
oliver
帖子: 775
注册时间: 2005-10-05 11:31
联系:

#13

帖子 oliver » 2005-12-11 11:14

我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。
laborer 写了:
https://addons.mozilla.org/extensions/m ... on=mozilla
可以试试这个,能支持mht,不过目前还不支持ff1.5。
苍紫云龙
帖子: 117
注册时间: 2005-07-27 18:39

#14

帖子 苍紫云龙 » 2005-12-11 12:00

oliver 写了:我安装了这个扩展,save Page in archive失败,提示arcive operating failed with code 1,选择save Tab in archive倒是成功了,可是我save到了桌面,却找不着文件,纳闷……
这个问题暂时不去解决了,反正长久得不到解决,网友要么不知道,知道的三言两语向我解释也很难说清楚。
就暂时搁置吧。或许某天会豁然开朗的。
这个插件应该可用啊.在终端的~/Desktop目录下ls看看

.mht在windows下也是很方便的保存单一页面元素的格式.
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

#15

帖子 eexpress » 2005-12-12 9:20

就是html2ps。ps2pdf。这样的。我试过,链接都在。htmldoc的没试过,想来就不会很正常。
● 鸣学
回复