zh_CN、UTF-8之类的关于字符集的疑惑

系统安装、升级讨论
版面规则
我们都知道新人的确很菜,也喜欢抱怨,并且带有浓厚的Windows习惯,但既然在这里询问,我们就应该有责任帮助他们解决问题,而不是直接泼冷水、简单的否定或发表对解决问题没有任何帮助的帖子。乐于分享,以人为本,这正是Ubuntu的精神所在。
回复
头像
rob2468
帖子: 185
注册时间: 2009-03-19 8:39
联系:

zh_CN、UTF-8之类的关于字符集的疑惑

#1

帖子 rob2468 » 2009-10-01 21:59

经常有遇到一些字符编码的问题,比如UTF-8,GB2312,Unicode,GBK等,这些是叫什么,字符集吗?
还有遇到zh_CN这样的,这是什么,还有与它对应的什么吗?
在设置环境变量的时候有这样的语句,zh_CN.UTF-8,那么UTF-8是属于zh_CN中的吗?“.”是不是相当于C++类中的运算符(指针访问类数据成员和函数)?
希望有人帮我释疑,谢谢了
头像
jxhow
帖子: 5859
注册时间: 2008-10-24 22:02
来自: 浙江

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#2

帖子 jxhow » 2009-10-01 22:14

UTF-8、GB2312、Unicode、GBK
分别在后面加上“百科“二字 进行搜索
答案比我们写出的会详尽很多
http://sb.google.com/ 提问前 请在右上角搜索一下
头像
rob2468
帖子: 185
注册时间: 2009-03-19 8:39
联系:

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#3

帖子 rob2468 » 2009-10-01 22:17

JXHOW 写了:UTF-8、GB2312、Unicode、GBK
分别在后面加上“百科“二字 进行搜索
答案比我们写出的会详尽很多
其实我更想知道的是zh_CN跟UTF-8之间的关系
头像
wzssyqa
帖子: 4010
注册时间: 2008-04-07 17:36
来自: 泰安人在阜新

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#4

帖子 wzssyqa » 2009-10-01 22:18

世界上有很多种语言,有很多一定程度上自我管理的国际和地区

zh是汉语的意思,使用zh的有中国大陆,新加坡,香港,澳门,台湾
CN是中国大陆的编号

zh_CN就是中国大陆的汉语的意思

当然也可以 (比如藏语)_CN


这很多中语言使用很多符号,开始时,各自有自己的编码,如ascii,gb2312等,由于是区域性编码,在交流中产生了很多问题。

于是出现了unicode,世界上的所有符号统一编号,可以使用两个字节或四个字节表示一个字符。

unicode主要有三种实现utf8,utf16(ucs2,java内码),utf32(ucs4)

但是只有utf8和ascii码兼容,所以,utf8进可攻退可守的特性得到了大家的肯定,所以就火起来了

其实utf8不是纯粹的unicode,它是一种可变长的编码,可以从1个字节到6个字节
上次由 wzssyqa 在 2009-10-01 22:28,总共编辑 1 次。
头像
rob2468
帖子: 185
注册时间: 2009-03-19 8:39
联系:

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#5

帖子 rob2468 » 2009-10-01 22:26


那zh_CN.UTF-8意思就是使用“中国大陆的中国大陆汉语”中的UTF-8编码吧(我的说法不一定对,只是为了表达他们之间关系)
头像
wzssyqa
帖子: 4010
注册时间: 2008-04-07 17:36
来自: 泰安人在阜新

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#6

帖子 wzssyqa » 2009-10-01 22:27

你多说了个 中国大陆

对不起是我多说了
头像
zhousiyv
帖子: 18
注册时间: 2008-02-12 20:43

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#7

帖子 zhousiyv » 2009-10-01 22:31

UNICODE只有一个,就是为世界上所有已知的符号每人分配一个ID,
UTF8是unicode的一种实现方式,表示的是每个字符在内存里的二进制表示,
zh_CN是区域设置, 设置了区域,机器就知道要显示中文,
UTF-8是字符集,设置了字符集,机器就知道用那种内部表示来显示硬盘/内存中的东东
头像
男菜鸟
帖子: 1351
注册时间: 2008-12-16 14:01
来自: 漂在江湖

Re: zh_CN、UTF-8之类的关于字符集的疑惑

#8

帖子 男菜鸟 » 2009-10-01 22:53

mark
回复