发个自己写的中文简繁转换的程序

软件和网站开发以及相关技术探讨
回复
starster888
帖子: 98
注册时间: 2007-03-19 19:15

发个自己写的中文简繁转换的程序

#1

帖子 starster888 » 2008-11-06 22:54

发个自己写的中文简繁转换的程序,只是简单的将相应的简繁体字替换。

linux下一直没找到个好的中文简繁转换程序,openoffice和永中office小文章还可以,只要超过大概500k就假死,没办法自己爱看小说,但是繁体字mp4显示乱码,网上有个zh-autoconvert,但是只闻其鼎鼎大名,就是找不到下载包,郁闷!
真好这两天学习c51,以前c语言学的不好,顺便复习一下。


另外哪位高手知道从编码转换的思路,和比较详细的资料,说一下,不胜感激。

zw-convert.c 是源代码,写的不好请高手别笑。

ft.txt 是繁体字码表

jt.txt 是简体字码表

zw-convert 是编译好的程序。

运行时zw-convert jt.txt ft.txt三个文件必须在同一目录下,

命令: zw-convert cn/tw 文件名 选参数时cn为繁体转换简体,选参数时tw为简体转换繁体。




哈哈! 谢谢 eexpress 了,enac源里就有,我找了他的说明,附上来:
介绍一个
linux
下查看文件编码的工具
enca
在debian下通过apt-get install
enca
就可以安装
它的说明如下:
Enca
is an Extremely 囗囗囗囗囗 Charset Analyser. It detects character set and
encoding of text files and can also convert them to other encodings using
either a built-in converter or external libraries and tools like libiconv,
librecode, or cstocs.
Currently it supports Belarussian, Bulgarian, Croatian, Czech,
Estonian, Hungarian, Latvian, Lithuanian, Polish, Russian, Slovak,
Slovene, Ukrainian, Chinese, and some multibyte encodings independently
on language.
使用方法举例:
# root@debian:~:0# enca blog.sqlUniversal transformation format 8 bits; UTF-8
# root@debian:~:0#
root@debian:~:0# enca abcd.txt
# Simplified Chinese National Standard; GB2312
# root@debian:~:0#

-------------------------------------------------------------------------------------------------------------------
linux下识别编码的小程序(enca)

enca命令专门用于识别编码的软件。

使用方法:
 
  enca -L zh_CN file 检查文件的编码
 
  enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
 
  enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
附件
zw-convert0.2.zip
(26.85 KiB) 已下载 146 次
上次由 starster888 在 2008-11-07 12:39,总共编辑 2 次。
头像
eexpress
帖子: 58428
注册时间: 2005-08-14 21:55
来自: 长沙

Re: 发个自己写的中文简繁转换的程序

#2

帖子 eexpress » 2008-11-06 22:57

源里面有enca / iconv
● 鸣学
头像
highwind
帖子: 1362
注册时间: 2008-09-05 23:31
系统: LinuxMint17

Re: 发个自己写的中文简繁转换的程序

#3

帖子 highwind » 2009-06-13 21:49

:em11
看了这么多,这个帖子好。

代码: 全选

使用方法:
 
  enca -L zh_CN file 检查文件的编码
 
  enca -L zh_CN -x UTF-8 file 将文件编码转换为"UTF-8"编码
 
  enca -L zh_CN -x UTF-8 < file1 > file2 如果不想覆盖原文件可以这样
适合懒人。
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 发个自己写的中文简繁转换的程序

#4

帖子 wangdu2002 » 2009-06-13 21:51

:em09
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
sarrow
帖子: 403
注册时间: 2007-10-27 1:04

Re: 发个自己写的中文简繁转换的程序

#5

帖子 sarrow » 2009-06-14 19:45

楼主的繁简对照表比较全,有效字对有2361个!基本是我原来用的那个表的两倍大了!

感谢!

不过,楼主,繁简字对间可不是一一映射的关系。就是说繁体->简体->繁体这样的两次转换,不能保证得到原文哦!
头像
BigSnake.NET
帖子: 12522
注册时间: 2006-07-02 11:16
来自: 廣州
联系:

Re: 发个自己写的中文简繁转换的程序

#6

帖子 BigSnake.NET » 2009-06-14 19:56

eexpress 写了:源里面有enca / iconv
LZ 说的是简繁...
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。
ljazx
帖子: 6
注册时间: 2008-09-21 22:25

Re: 发个自己写的中文简繁转换的程序

#7

帖子 ljazx » 2009-06-20 11:58

我顶,挺好用的 :em11
回复