当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 11 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 10:56 
头像

注册: 2010-01-02 15:49
帖子: 228
地址: QD.China
送出感谢: 0 次
接收感谢: 0 次
说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。

在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深

讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)


_________________
为什么我的10.04网速这么慢?!求教网络配置方法、提速方法。
Xubuntu10.04,新系统,偶尔花屏,“死机”,只能重启。求解!


最后由 qdmala 编辑于 2010-02-03 13:33,总共编辑了 1 次

页首
 用户资料  
 
2 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 11:29 
头像

注册: 2006-10-19 8:43
帖子: 787
地址: 长江口
送出感谢: 1
接收感谢: 2
文本处理 —— sed、awk、……
内码转换 —— iconv

chm可以用p7zip来解压缩成一堆的html;pdf和doc好像都有转换成text的工具可用

再加上shell或perl、python,整个世界都是你的,随你折腾


_________________
好好地做一个碌碌无为的人


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 11:46 
头像

注册: 2007-12-01 14:56
帖子: 249
送出感谢: 0 次
接收感谢: 0 次
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。


我是这么解决的

1 转换
1.1 pdf转换
代码:
pdftohtml

转换成html,记得是安装后自带的

1.2 chm转换
代码:
extract_chmLib

转换成html,需要自己安装libchm_bin

1.3 doc
不知道

1.4 html
最简单的是
代码:
w3m -dump

你也可以自己写个脚本转换(我就是自己写脚本的)。w3m安装后自带

2 3 排版
首先,我不太考虑这个问题,因为我觉得排版是看书软件解决的问题。
不过办法很简单,自己写脚本。

你可能觉得自己写脚本很麻烦,但从我觉得简单。。
脚本写完以后鼠标点两下执行就好了,而且效果可以自己调整,什么样的工作都有办法完成
windows下那些软件还要打开程序后选这个选那个的,麻烦,而且不一定能达到你需要的效果。


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 12:53 
头像

注册: 2008-02-17 23:47
帖子: 22120
地址: 美丽富饶的那啥星球
送出感谢: 11
接收感谢: 84
排版问题,我知道你说那些要求用vi都可以轻易完成,只需要把一串命令存储好,按一个键就可以搞定
不过你必需先花很多时间熟悉vi

总之linux就是这样,几乎没有做不到的事,前提是你必需会用它,比如用楼上几位的方法也都可以

如果你的意思是想找一个类似windows下的Gidot_Typesetter那样的程序的话,我劝你还是别费劲了,不可能有的
因为没有那个linux程序员会喜欢干这种吃力不讨好的事


_________________
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……

---------------------------------------------------------------------------------
[图片版]新手当自强(续)FAQ
[新手进阶]挂载、fstab、调整linux分区
[图片版]E17桌面环境配置手把手


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 13:04 
头像

注册: 2009-04-24 4:07
帖子: 706
地址: 广东肇庆
系统: win8
送出感谢: 0 次
接收感谢: 0 次
像我这种菜岛就 wine 一个排版软件来用 em09


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 13:12 

注册: 2009-06-20 23:53
帖子: 490
送出感谢: 3
接收感谢: 0 次
qdmala 写道:
说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。

在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深


格式转换不懂,但你的txt排版要求用vim完全可以轻松解决 ,你只要花几分钟看下vim的宏录制和正则相关命令,高手的话直接脚本 :em06


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 13:16 
头像

注册: 2010-01-02 15:49
帖子: 228
地址: QD.China
送出感谢: 0 次
接收感谢: 0 次
4楼:
引用:
类似windows下的Gidot_Typesetter那样的程序

同道中人啊,呵呵 :em03
我就是用着这个还算顺手。

感谢3楼,我一般都是
代码:
pdftotext

直接转换成txt文件。
就是排版问题让我害愁,毕竟手机屏幕不大啊~~~

脚本问题有空再研究一下吧,
我的要求很简单(前提是顺利转换成txt文件后):删除空行
这个简单吧?谁给个办法? :em11

讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)


_________________
为什么我的10.04网速这么慢?!求教网络配置方法、提速方法。
Xubuntu10.04,新系统,偶尔花屏,“死机”,只能重启。求解!


最后由 qdmala 编辑于 2010-02-03 13:27,总共编辑了 1 次

页首
 用户资料  
 
8 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 13:25 
头像

注册: 2008-02-17 23:47
帖子: 22120
地址: 美丽富饶的那啥星球
送出感谢: 11
接收感谢: 84
用vim
:%s/^\n//g
:em11


_________________
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……

---------------------------------------------------------------------------------
[图片版]新手当自强(续)FAQ
[新手进阶]挂载、fstab、调整linux分区
[图片版]E17桌面环境配置手把手


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 23:24 
头像

注册: 2008-12-16 14:01
帖子: 1108
地址: 漂在江湖
送出感谢: 13
接收感谢: 13
mark!!!!


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-03 23:30 
头像

注册: 2009-09-20 19:30
帖子: 765
地址: GIS
系统: ubuntu12.04
送出感谢: 0 次
接收感谢: 0 次
不错不错,学习学习。。。


页首
 用户资料  
 
11 楼 
 文章标题 : Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
帖子发表于 : 2010-02-04 10:44 
头像

注册: 2010-01-02 15:49
帖子: 228
地址: QD.China
送出感谢: 0 次
接收感谢: 0 次
8楼的办法好用,呵呵(硬往上套就是了,不理解代码的含义 :em02
可是,LSSSS的大哥,我发现我的文档只转换了一页 :em20 (原PDF文件好长好长的!)
可能是在用
代码:
pdftotext或pdftohtml

这个命令时还要加些什么参数?

以前还没从这方面想过,“xp风格的大脑”总想着点几个按钮就完成任务 :em04

还有哪些文本排版方面的技巧,高手再介绍一下啊?
给个这方面教程的链接也可(不求太复杂的)


_________________
为什么我的10.04网速这么慢?!求教网络配置方法、提速方法。
Xubuntu10.04,新系统,偶尔花屏,“死机”,只能重启。求解!


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 11 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 4 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译