发个自己写的中文简繁转换的程序,只是简单的将相应的简繁体字替换。
linux下一直没找到个好的中文简繁转换程序,openoffice和永中office小文章还可以,只要超过大概500k就假死,没办法自己爱看小说,但是繁体字mp4显示乱码,网上有个zh-autoconvert,但是只闻其鼎鼎大名,就是找不到下载包,郁闷!
真好这两天学习c51,以前c语言学的不好,顺便复习一下。
另外哪位高手知道从编码转换的思路,和比较详细的资料,说一下,不胜感激。
zw-convert.c 是源代码,写的不好请高手别笑。
ft.txt 是繁体字码表
jt.txt 是简体字码表
zw-convert 是编译好的程序。
运行时zw-convert jt.txt ft.txt三个文件必须在同一目录下,
命令: zw-convert cn/tw 文件名 选参数时cn为繁体转换简体,选参数时tw为简体转换繁体。
哈哈! 谢谢 eexpress 了,enac源里就有,我找了他的说明,附上来:
介绍一个
linux
下查看文件编码的工具
enca
在debian下通过apt-get install
enca
就可以安装
它的说明如下:
Enca
is an Extremely 囗囗囗囗囗 Charset Analyser. It detects character set and
encoding of text files and can also convert them to other encodings using
either a built-in converter or external libraries and tools like libiconv,
librecode, or cstocs.
Currently it supports Belarussian, Bulgarian, Croatian, Czech,
Estonian, Hungarian, Latvian, Lithuanian, Polish, Russian, Slovak,
Slovene, Ukrainian, Chinese, and some multibyte encodings independently
on language.
使用方法举例:
# root@debian:~:0# enca blog.sqlUniversal transformation format 8 bits; UTF-8
# root@debian:~:0#
root@debian:~:0# enca abcd.txt
# Simplified Chinese National Standard; GB2312
# root@debian:~:0#
-------------------------------------------------------------------------------------------------------------------
linux下识别编码的小程序(enca)
enca命令专门用于识别编码的软件。
使用方法:
enca -L zh_CN file 检查文件的编码
enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
发个自己写的中文简繁转换的程序
-
- 帖子: 98
- 注册时间: 2007-03-19 19:15
发个自己写的中文简繁转换的程序
- 附件
-
- zw-convert0.2.zip
- (26.85 KiB) 已下载 146 次
上次由 starster888 在 2008-11-07 12:39,总共编辑 2 次。
- eexpress
- 帖子: 58428
- 注册时间: 2005-08-14 21:55
- 来自: 长沙
- highwind
- 帖子: 1362
- 注册时间: 2008-09-05 23:31
- 系统: LinuxMint17
Re: 发个自己写的中文简繁转换的程序
看了这么多,这个帖子好。
代码: 全选
使用方法:
enca -L zh_CN file 检查文件的编码
enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en
- wangdu2002
- 帖子: 13284
- 注册时间: 2008-12-13 19:39
- 来自: 物华天宝人杰地灵
Re: 发个自己写的中文简繁转换的程序
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
海内生明月,天涯共此夕。
--------------------吾本独!
-
- 帖子: 403
- 注册时间: 2007-10-27 1:04
Re: 发个自己写的中文简繁转换的程序
楼主的繁简对照表比较全,有效字对有2361个!基本是我原来用的那个表的两倍大了!
感谢!
不过,楼主,繁简字对间可不是一一映射的关系。就是说繁体->简体->繁体这样的两次转换,不能保证得到原文哦!
感谢!
不过,楼主,繁简字对间可不是一一映射的关系。就是说繁体->简体->繁体这样的两次转换,不能保证得到原文哦!
- BigSnake.NET
- 帖子: 12522
- 注册时间: 2006-07-02 11:16
- 来自: 廣州
- 联系:
Re: 发个自己写的中文简繁转换的程序
LZ 说的是简繁...eexpress 写了:源里面有enca / iconv
^_^ ~~~
要理解递归,首先要理解递归。
地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。
要理解递归,首先要理解递归。
地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。
-
- 帖子: 6
- 注册时间: 2008-09-21 22:25
Re: 发个自己写的中文简繁转换的程序
我顶,挺好用的