关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

系统安装、升级讨论
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
回复
头像
qdmala
帖子: 229
注册时间: 2010-01-02 15:49
来自: QD.China

关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#1

帖子 qdmala » 2010-02-03 10:56

说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。

在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深

讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
上次由 qdmala 在 2010-02-03 13:33,总共编辑 1 次。
头像
ibear
帖子: 787
注册时间: 2006-10-19 8:43
来自: 长江口

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#2

帖子 ibear » 2010-02-03 11:29

文本处理 —— sed、awk、……
内码转换 —— iconv

chm可以用p7zip来解压缩成一堆的html;pdf和doc好像都有转换成text的工具可用

再加上shell或perl、python,整个世界都是你的,随你折腾
好好地做一个碌碌无为的人
头像
foolegg
帖子: 249
注册时间: 2007-12-01 14:56

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#3

帖子 foolegg » 2010-02-03 11:46

1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。


我是这么解决的

1 转换
1.1 pdf转换

代码: 全选

pdftohtml
转换成html,记得是安装后自带的

1.2 chm转换

代码: 全选

extract_chmLib
转换成html,需要自己安装libchm_bin

1.3 doc
不知道

1.4 html
最简单的是

代码: 全选

w3m -dump
你也可以自己写个脚本转换(我就是自己写脚本的)。w3m安装后自带

2 3 排版
首先,我不太考虑这个问题,因为我觉得排版是看书软件解决的问题。
不过办法很简单,自己写脚本。

你可能觉得自己写脚本很麻烦,但从我觉得简单。。
脚本写完以后鼠标点两下执行就好了,而且效果可以自己调整,什么样的工作都有办法完成
windows下那些软件还要打开程序后选这个选那个的,麻烦,而且不一定能达到你需要的效果。
头像
adagio
论坛版主
帖子: 22110
注册时间: 2008-02-17 23:47
来自: 美丽富饶的那啥星球

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#4

帖子 adagio » 2010-02-03 12:53

排版问题,我知道你说那些要求用vi都可以轻易完成,只需要把一串命令存储好,按一个键就可以搞定
不过你必需先花很多时间熟悉vi

总之linux就是这样,几乎没有做不到的事,前提是你必需会用它,比如用楼上几位的方法也都可以

如果你的意思是想找一个类似windows下的Gidot_Typesetter那样的程序的话,我劝你还是别费劲了,不可能有的
因为没有那个linux程序员会喜欢干这种吃力不讨好的事
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……

---------------------------------------------------------------------------------
[图片版]新手当自强(续)FAQ
[新手进阶]挂载、fstab、调整linux分区
[图片版]E17桌面环境配置手把手
头像
fejich
帖子: 706
注册时间: 2009-04-24 4:07
系统: win8
来自: 广东肇庆

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#5

帖子 fejich » 2010-02-03 13:04

像我这种菜岛就 wine 一个排版软件来用 em09
风间星魂
帖子: 490
注册时间: 2009-06-20 23:53

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#6

帖子 风间星魂 » 2010-02-03 13:12

qdmala 写了:说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。

在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深
格式转换不懂,但你的txt排版要求用vim完全可以轻松解决 ,你只要花几分钟看下vim的宏录制和正则相关命令,高手的话直接脚本 :em06
头像
qdmala
帖子: 229
注册时间: 2010-01-02 15:49
来自: QD.China

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#7

帖子 qdmala » 2010-02-03 13:16

4楼:
类似windows下的Gidot_Typesetter那样的程序
同道中人啊,呵呵 :em03
我就是用着这个还算顺手。

感谢3楼,我一般都是

代码: 全选

pdftotext
直接转换成txt文件。
就是排版问题让我害愁,毕竟手机屏幕不大啊~~~

脚本问题有空再研究一下吧,
我的要求很简单(前提是顺利转换成txt文件后):删除空行
这个简单吧?谁给个办法? :em11

讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
上次由 qdmala 在 2010-02-03 13:27,总共编辑 1 次。
头像
adagio
论坛版主
帖子: 22110
注册时间: 2008-02-17 23:47
来自: 美丽富饶的那啥星球

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#8

帖子 adagio » 2010-02-03 13:25

用vim
:%s/^\n//g
:em11
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……

---------------------------------------------------------------------------------
[图片版]新手当自强(续)FAQ
[新手进阶]挂载、fstab、调整linux分区
[图片版]E17桌面环境配置手把手
头像
男菜鸟
帖子: 1365
注册时间: 2008-12-16 14:01
来自: 漂在江湖

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#9

帖子 男菜鸟 » 2010-02-03 23:24

mark!!!!
头像
luofeng1989
帖子: 766
注册时间: 2009-09-20 19:30
系统: ubuntu12.04
来自: GIS

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#10

帖子 luofeng1989 » 2010-02-03 23:30

不错不错,学习学习。。。
头像
qdmala
帖子: 229
注册时间: 2010-01-02 15:49
来自: QD.China

Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下

#11

帖子 qdmala » 2010-02-04 10:44

8楼的办法好用,呵呵(硬往上套就是了,不理解代码的含义 :em02
可是,LSSSS的大哥,我发现我的文档只转换了一页 :em20 (原PDF文件好长好长的!)
可能是在用

代码: 全选

pdftotext或pdftohtml
这个命令时还要加些什么参数?

以前还没从这方面想过,“xp风格的大脑”总想着点几个按钮就完成任务 :em04

还有哪些文本排版方面的技巧,高手再介绍一下啊?
给个这方面教程的链接也可(不求太复杂的)
回复