(已解决)ubuntu系统能否实现完美保存网页元素?如何操作?
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
(已解决)ubuntu系统能否实现完美保存网页元素?如何操作?
windows系统可以通过acrobat的虚拟打印机将网页打印成为PDF文档格式文件。遗憾的是链接都丢失了。
Ubuntu可以将网页打印成PS文件,遗憾的是同样链接丢失,而且不能通过PDF查看器浏览。oneleaf大侠告知我可以通过ps2pdf命令转换ps文件,但是转换生成的PDF文件面目全非,大部分元素都丢失了。
我为什么需要将网页保存为PDF格式呢? 因为我看到好的文章,有些需要保留整个网页的元素和布局不丢失,不变形,虽然可以另存为HTMl网页或者选择全部保存。可是单单只保存HTML文件,有不少网页元素同样会缺失,但是选择全部保存则会生成一个于HTML文件对应的存放网页素材的文件夹,这给我的文件管理带来不便。
而保存为PDF文档则是理想的。一来单个文件就能保留网页原来风貌,而来可以跨平台查阅。
在windows系统下没有能够完美解决这个问题(好象有些非adobe公司的PDF虚拟打印机程序可以实现连超级链接元素都保存,不过都是商业软件,太贵了……试用还会在文件后头加盖一个“戳记”……)。不知道Ubuntu系统下我能否实现acrobat打印机的功能,或者能够更加完美的解决这个问题呢?
Ubuntu可以将网页打印成PS文件,遗憾的是同样链接丢失,而且不能通过PDF查看器浏览。oneleaf大侠告知我可以通过ps2pdf命令转换ps文件,但是转换生成的PDF文件面目全非,大部分元素都丢失了。
我为什么需要将网页保存为PDF格式呢? 因为我看到好的文章,有些需要保留整个网页的元素和布局不丢失,不变形,虽然可以另存为HTMl网页或者选择全部保存。可是单单只保存HTML文件,有不少网页元素同样会缺失,但是选择全部保存则会生成一个于HTML文件对应的存放网页素材的文件夹,这给我的文件管理带来不便。
而保存为PDF文档则是理想的。一来单个文件就能保留网页原来风貌,而来可以跨平台查阅。
在windows系统下没有能够完美解决这个问题(好象有些非adobe公司的PDF虚拟打印机程序可以实现连超级链接元素都保存,不过都是商业软件,太贵了……试用还会在文件后头加盖一个“戳记”……)。不知道Ubuntu系统下我能否实现acrobat打印机的功能,或者能够更加完美的解决这个问题呢?
上次由 oliver 在 2007-01-08 19:12,总共编辑 3 次。
- freeflying
- 帖子: 521
- 注册时间: 2005-03-26 9:38
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
您是指下载acrobat for linux?我倒是下载了一个老板本的acrobat,至于7.0版本for linux的我没有找到,可是acrobat是商业软件……widnows平台有注册机。但是linux系统我刚接触……各方面还都不熟悉……您给得网址我看了,上头有文章命为“在 KDE 里和 kprinter 一起使用 Adobe Acrobat Reader 7”提到acrobat7.0 for linux,可是,还是似乎还是不能解决我的问题。
eexpress 写了:http://main.linuxfocus.org/有详细的说明。带连接的。我以前试过。
- laborer
- 帖子: 1016
- 注册时间: 2005-10-25 11:15
- 联系:
代码: 全选
wget -E -k -p -H http://www.somewhere.com
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。
eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。
- oneleaf
- 论坛管理员
- 帖子: 10441
- 注册时间: 2005-03-27 0:06
- 系统: Ubuntu 12.04
http://www.htmldoc.org/documentation.ph ... LFile.htmloliver 写了:找到了。您应该就是指这篇文章了:http://main.linuxfocus.org/ChineseGB/Fe ... e366.shtml
ps2pdf的转换存在问题,转换以后元素缺失蛮多的。
htmldoc我通过新立新得安装以后却不懂的如何试用命令操作。看过usage以后尝试着操作了下,都没有成功。不会用……倒是个麻烦事情。eexpress 写了:不是的。找找。就是打印时,可以带链接的文章。
http://www.htmldoc.org/documentation.ph ... tFile.html
htmldoc -t pdf -webpage -f file.pdf file.html
- laborer
- 帖子: 1016
- 注册时间: 2005-10-25 11:15
- 联系:
https://addons.mozilla.org/extensions/m ... on=mozillaoliver 写了:把网页下载了倒是原汁原味的保存了原来网页,但是一个个的文件夹管理起来也真够麻烦的。可是不少网页单单保存个HTML文件是不够的,非得整个保存才能够保证元素不缺失,风格不改变。laborer 写了:代码: 全选
wget -E -k -p -H http://www.somewhere.com
所以我才想着将网页转换为PDF文件保存。
可以试试这个,能支持mht,不过目前还不支持ff1.5。
hreiser@oakland:~$ killall -9 wife
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
police@oakland:~$ sudo find / -user hreiser
court@oakland:~$ sudo mv /home/hreiser /jail/
court@oakland:~$ sudo usermod -d /jail/hreiser -s "/usr/sbin/chroot /jail/" hreiser
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
在终端中输入htmldoc以后打开htmldoc程序窗口,然后我input了一个任意的HTML文件,再output为PDF Format,但是save以后生成的却是一个以.book后缀的纯文本文件。
oneleaf 写了:
http://www.htmldoc.org/documentation.ph ... LFile.html
http://www.htmldoc.org/documentation.ph ... tFile.html
htmldoc -t pdf -webpage -f file.pdf file.html
- oliver
- 帖子: 775
- 注册时间: 2005-10-05 11:31
- 联系:
-
- 帖子: 117
- 注册时间: 2005-07-27 18:39