当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 8 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 21:59 
头像

注册: 2009-03-19 8:39
帖子: 185
送出感谢: 0 次
接收感谢: 0 次
经常有遇到一些字符编码的问题,比如UTF-8,GB2312,Unicode,GBK等,这些是叫什么,字符集吗?
还有遇到zh_CN这样的,这是什么,还有与它对应的什么吗?
在设置环境变量的时候有这样的语句,zh_CN.UTF-8,那么UTF-8是属于zh_CN中的吗?“.”是不是相当于C++类中的运算符(指针访问类数据成员和函数)?
希望有人帮我释疑,谢谢了


页首
 用户资料  
 
2 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:14 
头像

注册: 2008-10-24 22:02
帖子: 5853
地址: 浙江
送出感谢: 0 次
接收感谢: 3
UTF-8、GB2312、Unicode、GBK
分别在后面加上“百科“二字 进行搜索
答案比我们写出的会详尽很多


_________________
http://sb.google.com/ 提问前 请在右上角搜索一下
请不要跨省追捕!水表在门外。谢谢! 大家一起twitter


页首
 用户资料  
 
3 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:17 
头像

注册: 2009-03-19 8:39
帖子: 185
送出感谢: 0 次
接收感谢: 0 次
JXHOW 写道:
UTF-8、GB2312、Unicode、GBK
分别在后面加上“百科“二字 进行搜索
答案比我们写出的会详尽很多

其实我更想知道的是zh_CN跟UTF-8之间的关系


页首
 用户资料  
 
4 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:18 
头像

注册: 2008-04-07 17:36
帖子: 4010
地址: 泰安人在阜新
送出感谢: 0 次
接收感谢: 0 次
世界上有很多种语言,有很多一定程度上自我管理的国际和地区

zh是汉语的意思,使用zh的有中国大陆,新加坡,香港,澳门,台湾
CN是中国大陆的编号

zh_CN就是中国大陆的汉语的意思

当然也可以 (比如藏语)_CN


这很多中语言使用很多符号,开始时,各自有自己的编码,如ascii,gb2312等,由于是区域性编码,在交流中产生了很多问题。

于是出现了unicode,世界上的所有符号统一编号,可以使用两个字节或四个字节表示一个字符。

unicode主要有三种实现utf8,utf16(ucs2,java内码),utf32(ucs4)

但是只有utf8和ascii码兼容,所以,utf8进可攻退可守的特性得到了大家的肯定,所以就火起来了

其实utf8不是纯粹的unicode,它是一种可变长的编码,可以从1个字节到6个字节


_________________
宇宙数学物理 sssssssss Ubuntu 桌面培训 sssssssss 问打包的问题之前先看
和我一样的新手请看,我看过了,腰不酸了,腿不疼了,上楼也有劲了
想去IRC的点这里——一个比QQ群好N多的东西


最后由 wzssyqa 编辑于 2009-10-01 22:28,总共编辑了 1 次

页首
 用户资料  
 
5 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:26 
头像

注册: 2009-03-19 8:39
帖子: 185
送出感谢: 0 次
接收感谢: 0 次

那zh_CN.UTF-8意思就是使用“中国大陆的中国大陆汉语”中的UTF-8编码吧(我的说法不一定对,只是为了表达他们之间关系)


页首
 用户资料  
 
6 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:27 
头像

注册: 2008-04-07 17:36
帖子: 4010
地址: 泰安人在阜新
送出感谢: 0 次
接收感谢: 0 次
你多说了个 中国大陆

对不起是我多说了


_________________
宇宙数学物理 sssssssss Ubuntu 桌面培训 sssssssss 问打包的问题之前先看
和我一样的新手请看,我看过了,腰不酸了,腿不疼了,上楼也有劲了
想去IRC的点这里——一个比QQ群好N多的东西


页首
 用户资料  
 
7 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:31 
头像

注册: 2008-02-12 20:43
帖子: 18
送出感谢: 0 次
接收感谢: 0 次
UNICODE只有一个,就是为世界上所有已知的符号每人分配一个ID,
UTF8是unicode的一种实现方式,表示的是每个字符在内存里的二进制表示,
zh_CN是区域设置, 设置了区域,机器就知道要显示中文,
UTF-8是字符集,设置了字符集,机器就知道用那种内部表示来显示硬盘/内存中的东东


页首
 用户资料  
 
8 楼 
 文章标题 : Re: zh_CN、UTF-8之类的关于字符集的疑惑
帖子发表于 : 2009-10-01 22:53 
头像

注册: 2008-12-16 14:01
帖子: 1080
地址: 漂在江湖
送出感谢: 12
接收感谢: 13
mark


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 8 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 4 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译