关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
- qdmala
- 帖子: 229
- 注册时间: 2010-01-02 15:49
- 来自: QD.China
关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。
在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深
讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。
在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深
讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
上次由 qdmala 在 2010-02-03 13:33,总共编辑 1 次。
- ibear
- 帖子: 787
- 注册时间: 2006-10-19 8:43
- 来自: 长江口
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
文本处理 —— sed、awk、……
内码转换 —— iconv
chm可以用p7zip来解压缩成一堆的html;pdf和doc好像都有转换成text的工具可用
再加上shell或perl、python,整个世界都是你的,随你折腾
内码转换 —— iconv
chm可以用p7zip来解压缩成一堆的html;pdf和doc好像都有转换成text的工具可用
再加上shell或perl、python,整个世界都是你的,随你折腾
好好地做一个碌碌无为的人
- foolegg
- 帖子: 249
- 注册时间: 2007-12-01 14:56
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。
我是这么解决的
1 转换
1.1 pdf转换
转换成html,记得是安装后自带的
1.2 chm转换
转换成html,需要自己安装libchm_bin
1.3 doc
不知道
1.4 html
最简单的是
你也可以自己写个脚本转换(我就是自己写脚本的)。w3m安装后自带
2 3 排版
首先,我不太考虑这个问题,因为我觉得排版是看书软件解决的问题。
不过办法很简单,自己写脚本。
你可能觉得自己写脚本很麻烦,但从我觉得简单。。
脚本写完以后鼠标点两下执行就好了,而且效果可以自己调整,什么样的工作都有办法完成
windows下那些软件还要打开程序后选这个选那个的,麻烦,而且不一定能达到你需要的效果。
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。
我是这么解决的
1 转换
1.1 pdf转换
代码: 全选
pdftohtml
1.2 chm转换
代码: 全选
extract_chmLib
1.3 doc
不知道
1.4 html
最简单的是
代码: 全选
w3m -dump
2 3 排版
首先,我不太考虑这个问题,因为我觉得排版是看书软件解决的问题。
不过办法很简单,自己写脚本。
你可能觉得自己写脚本很麻烦,但从我觉得简单。。
脚本写完以后鼠标点两下执行就好了,而且效果可以自己调整,什么样的工作都有办法完成
windows下那些软件还要打开程序后选这个选那个的,麻烦,而且不一定能达到你需要的效果。
- adagio
- 论坛版主
- 帖子: 22110
- 注册时间: 2008-02-17 23:47
- 来自: 美丽富饶的那啥星球
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
排版问题,我知道你说那些要求用vi都可以轻易完成,只需要把一串命令存储好,按一个键就可以搞定
不过你必需先花很多时间熟悉vi
总之linux就是这样,几乎没有做不到的事,前提是你必需会用它,比如用楼上几位的方法也都可以
如果你的意思是想找一个类似windows下的Gidot_Typesetter那样的程序的话,我劝你还是别费劲了,不可能有的
因为没有那个linux程序员会喜欢干这种吃力不讨好的事
不过你必需先花很多时间熟悉vi
总之linux就是这样,几乎没有做不到的事,前提是你必需会用它,比如用楼上几位的方法也都可以
如果你的意思是想找一个类似windows下的Gidot_Typesetter那样的程序的话,我劝你还是别费劲了,不可能有的
因为没有那个linux程序员会喜欢干这种吃力不讨好的事
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……
---------------------------------------------------------------------------------
★ [图片版]新手当自强(续)FAQ
★ [新手进阶]挂载、fstab、调整linux分区
★ [图片版]E17桌面环境配置手把手
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……
---------------------------------------------------------------------------------
★ [图片版]新手当自强(续)FAQ
★ [新手进阶]挂载、fstab、调整linux分区
★ [图片版]E17桌面环境配置手把手
- fejich
- 帖子: 706
- 注册时间: 2009-04-24 4:07
- 系统: win8
- 来自: 广东肇庆
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
像我这种菜岛就 wine 一个排版软件来用 em09
-
- 帖子: 490
- 注册时间: 2009-06-20 23:53
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
格式转换不懂,但你的txt排版要求用vim完全可以轻松解决 ,你只要花几分钟看下vim的宏录制和正则相关命令,高手的话直接脚本qdmala 写了:说实话,我主要是在手机上看电子书,linux的书也不少,在手机上有的看了2遍了都。
但是,关于txt排版的问题,一直困惑着我。(现在主要是在xp下做这个工作)
一般来说,关于文本转换与排版的步骤是:
1.转换(pdf、chm、doc、html等文件转换为txt格式。)
2.对txt格式排版(简单的有:a、段落开头空出两格,b、删除文中空行、空段,c、小的txt批量合并成一个txt文件)
3.稍微高级点的有:a、汉字标点符号的转换匹配,b、内码的转换
再就查找替换之类的这都可以。
在xp下,几个很小的软件稍微一操作,很快,一个漂亮的、整齐的手机或mp4可阅读的txt文本文件就搞定了。
但是,在linux下,好像要复杂一些。
目前,pdf转txt可以做到,doc、html也可以,chm还没试过。内码应该也可以。
对中文段落的排版,一直没发现个好的(别叫我手动去完成昂!)
感觉在这方面好像也没人问这个事~~
LATEX只是听说,没用过,好像太复杂,能像我这样2分钟就可以在xp下搞定么?
请高手推荐一下这类的小软件
或者说说在linux下是怎样制作txt电子书的?
也可能是我xp中毒太深
- qdmala
- 帖子: 229
- 注册时间: 2010-01-02 15:49
- 来自: QD.China
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
4楼:
我就是用着这个还算顺手。
感谢3楼,我一般都是
直接转换成txt文件。
就是排版问题让我害愁,毕竟手机屏幕不大啊~~~
脚本问题有空再研究一下吧,
我的要求很简单(前提是顺利转换成txt文件后):删除空行
这个简单吧?谁给个办法?
讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
同道中人啊,呵呵类似windows下的Gidot_Typesetter那样的程序
我就是用着这个还算顺手。
感谢3楼,我一般都是
代码: 全选
pdftotext
就是排版问题让我害愁,毕竟手机屏幕不大啊~~~
脚本问题有空再研究一下吧,
我的要求很简单(前提是顺利转换成txt文件后):删除空行
这个简单吧?谁给个办法?
讨论时注意我们的目的是:在linux(ubuntu)下制作可以在手机等上阅读的txt文件。
要求是制作简便(最好能批量)、格式美观(符合中文文档一般要求)、内码不限(utf8、ansi等均可)
上次由 qdmala 在 2010-02-03 13:27,总共编辑 1 次。
- adagio
- 论坛版主
- 帖子: 22110
- 注册时间: 2008-02-17 23:47
- 来自: 美丽富饶的那啥星球
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
用vim
:%s/^\n//g
:%s/^\n//g
明天就换大三八!
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……
---------------------------------------------------------------------------------
★ [图片版]新手当自强(续)FAQ
★ [新手进阶]挂载、fstab、调整linux分区
★ [图片版]E17桌面环境配置手把手
——8核CPU、8G内存、8T硬盘……
8卡交火,80寸大屏放8个……
IPv8的光纤要8条……
---------------------------------------------------------------------------------
★ [图片版]新手当自强(续)FAQ
★ [新手进阶]挂载、fstab、调整linux分区
★ [图片版]E17桌面环境配置手把手
- 男菜鸟
- 帖子: 1365
- 注册时间: 2008-12-16 14:01
- 来自: 漂在江湖
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
mark!!!!
- luofeng1989
- 帖子: 766
- 注册时间: 2009-09-20 19:30
- 系统: ubuntu12.04
- 来自: GIS
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
不错不错,学习学习。。。
- qdmala
- 帖子: 229
- 注册时间: 2010-01-02 15:49
- 来自: QD.China
Re: 关于linux下文本排版问题的讨论,txt电子书爱好者讨论下
8楼的办法好用,呵呵(硬往上套就是了,不理解代码的含义 )
可是,LSSSS的大哥,我发现我的文档只转换了一页 (原PDF文件好长好长的!)
可能是在用
这个命令时还要加些什么参数?
以前还没从这方面想过,“xp风格的大脑”总想着点几个按钮就完成任务
还有哪些文本排版方面的技巧,高手再介绍一下啊?
给个这方面教程的链接也可(不求太复杂的)
可是,LSSSS的大哥,我发现我的文档只转换了一页 (原PDF文件好长好长的!)
可能是在用
代码: 全选
pdftotext或pdftohtml
以前还没从这方面想过,“xp风格的大脑”总想着点几个按钮就完成任务
还有哪些文本排版方面的技巧,高手再介绍一下啊?
给个这方面教程的链接也可(不求太复杂的)