发个自己写的中文简繁转换的程序
发表于 : 2008-11-06 22:54
发个自己写的中文简繁转换的程序,只是简单的将相应的简繁体字替换。
linux下一直没找到个好的中文简繁转换程序,openoffice和永中office小文章还可以,只要超过大概500k就假死,没办法自己爱看小说,但是繁体字mp4显示乱码,网上有个zh-autoconvert,但是只闻其鼎鼎大名,就是找不到下载包,郁闷!
真好这两天学习c51,以前c语言学的不好,顺便复习一下。
另外哪位高手知道从编码转换的思路,和比较详细的资料,说一下,不胜感激。
zw-convert.c 是源代码,写的不好请高手别笑。
ft.txt 是繁体字码表
jt.txt 是简体字码表
zw-convert 是编译好的程序。
运行时zw-convert jt.txt ft.txt三个文件必须在同一目录下,
命令: zw-convert cn/tw 文件名 选参数时cn为繁体转换简体,选参数时tw为简体转换繁体。
哈哈! 谢谢 eexpress 了,enac源里就有,我找了他的说明,附上来:
介绍一个
linux
下查看文件编码的工具
enca
在debian下通过apt-get install
enca
就可以安装
它的说明如下:
Enca
is an Extremely 囗囗囗囗囗 Charset Analyser. It detects character set and
encoding of text files and can also convert them to other encodings using
either a built-in converter or external libraries and tools like libiconv,
librecode, or cstocs.
Currently it supports Belarussian, Bulgarian, Croatian, Czech,
Estonian, Hungarian, Latvian, Lithuanian, Polish, Russian, Slovak,
Slovene, Ukrainian, Chinese, and some multibyte encodings independently
on language.
使用方法举例:
# root@debian:~:0# enca blog.sqlUniversal transformation format 8 bits; UTF-8
# root@debian:~:0#
root@debian:~:0# enca abcd.txt
# Simplified Chinese National Standard; GB2312
# root@debian:~:0#
-------------------------------------------------------------------------------------------------------------------
linux下识别编码的小程序(enca)
enca命令专门用于识别编码的软件。
使用方法:
enca -L zh_CN file 检查文件的编码
enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
linux下一直没找到个好的中文简繁转换程序,openoffice和永中office小文章还可以,只要超过大概500k就假死,没办法自己爱看小说,但是繁体字mp4显示乱码,网上有个zh-autoconvert,但是只闻其鼎鼎大名,就是找不到下载包,郁闷!
真好这两天学习c51,以前c语言学的不好,顺便复习一下。
另外哪位高手知道从编码转换的思路,和比较详细的资料,说一下,不胜感激。
zw-convert.c 是源代码,写的不好请高手别笑。
ft.txt 是繁体字码表
jt.txt 是简体字码表
zw-convert 是编译好的程序。
运行时zw-convert jt.txt ft.txt三个文件必须在同一目录下,
命令: zw-convert cn/tw 文件名 选参数时cn为繁体转换简体,选参数时tw为简体转换繁体。
哈哈! 谢谢 eexpress 了,enac源里就有,我找了他的说明,附上来:
介绍一个
linux
下查看文件编码的工具
enca
在debian下通过apt-get install
enca
就可以安装
它的说明如下:
Enca
is an Extremely 囗囗囗囗囗 Charset Analyser. It detects character set and
encoding of text files and can also convert them to other encodings using
either a built-in converter or external libraries and tools like libiconv,
librecode, or cstocs.
Currently it supports Belarussian, Bulgarian, Croatian, Czech,
Estonian, Hungarian, Latvian, Lithuanian, Polish, Russian, Slovak,
Slovene, Ukrainian, Chinese, and some multibyte encodings independently
on language.
使用方法举例:
# root@debian:~:0# enca blog.sqlUniversal transformation format 8 bits; UTF-8
# root@debian:~:0#
root@debian:~:0# enca abcd.txt
# Simplified Chinese National Standard; GB2312
# root@debian:~:0#
-------------------------------------------------------------------------------------------------------------------
linux下识别编码的小程序(enca)
enca命令专门用于识别编码的软件。
使用方法:
enca -L zh_CN file 检查文件的编码
enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样