当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 5 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : windows和Linux中文本编码的疑惑,请高人指教
帖子发表于 : 2010-12-22 12:40 

注册: 2009-11-02 21:56
帖子: 86
送出感谢: 0 次
接收感谢: 0 次
先列举以下事实(不对之处还请指教,在此学习了):
1. windows下,用记事本创建的文本文件默认为ANSI编码,在大陆当然就是用的GB2321编码了。
2.记事本创建的ANSI文件是不具有文件识别头的(不知道叫什么,反正就是插入在文件开头区别不不同编码方式的几个字节),自第一个字节起便是文件内容。
3.用记事本另存为创建的UTF-8编码方式的文件是具有EF BB BF三个字节的文件识别头的。因此自第四个字节起的编码才是真正的文件内容。
4.用记事本另存为创建的Unicode编码方式的文件是具有FF FE两个字节的文件识别头的。因此自第三个字节起的编码才是真正的文件内容。
5.显然,记事本读取文件时自动把文件头信息滤去,只显示其后的文本。
(空一行,下面是Linux的:)
6.Linux下的默认编码通通为UTF-8编码。
7.在Ubuntu环境下,用gedit创建的文件默认是UTF-8编码,而且不具有文件头。特别强调,不具有EF BB BF的文件识别头。
(联系:)
8.Linux下文件在windows中记事本都能正常显示
9.Linux下创建的UTF-8文件在记事本中能正常显示。(虽然不具有EF BB BF的文件头)
问题是,记事本是怎么识别出Linux下创建的不具有文件头的UTF-8文件(UTF-8编码)和自己创建的ANSI文件(GB2321编码)并用正确的编码去正常显示的呢?
补充:
10.用gedit打开记事本保存的ANSI文件时不能正常识别,提示选编码,选则GB2321后正常显示。
11.用gedit打开记事本保存的UTF-8文件(含文件头信息),正常显示,无提示。
12.用gedit打开记事本保存的Unicode文件正常显示,但是图标预览上头两个字节确实乱码,呵呵,这一点很怪,难道图标预览上显示时是用UTF-8去解码的,而打开时自动滤去文件头?。


最后由 智上思下 编辑于 2010-12-22 12:55,总共编辑了 1 次

页首
 用户资料  
 
2 楼 
 文章标题 : Re: windows和Linux中文本编码的疑惑,请高人指教
帖子发表于 : 2010-12-22 12:47 
头像

注册: 2006-07-02 11:16
帖子: 12522
地址: 廣州
送出感谢: 0 次
接收感谢: 8
xp 下的记事本识别不出的
中文会乱码


_________________
^_^ ~~~
要理解递归,首先要理解递归。

地球人都知道,理论上,理论跟实际是没有差别的,但实际上,理论跟实际的差别是相当大滴。


页首
 用户资料  
 
3 楼 
 文章标题 : Re: windows和Linux中文本编码的疑惑,请高人指教
帖子发表于 : 2010-12-22 12:53 
头像

注册: 2010-09-13 19:04
帖子: 1404
地址: 0xFF00EE
送出感谢: 1
接收感谢: 3
一个vim全部搞定

:em11 :em11 :em11


_________________
qq旋风离线空间下载程序
漂亮的fcitx皮肤
Fcitx皮肤合集


页首
 用户资料  
 
4 楼 
 文章标题 : Re: windows和Linux中文本编码的疑惑,请高人指教
帖子发表于 : 2010-12-22 12:56 

注册: 2009-11-02 21:56
帖子: 86
送出感谢: 0 次
接收感谢: 0 次
引用:
xp 下的记事本识别不出的
中文会乱码

xp?没试过,至少Windows 7是这样。


页首
 用户资料  
 
5 楼 
 文章标题 : Re: windows和Linux中文本编码的疑惑,请高人指教
帖子发表于 : 2010-12-22 13:00 

注册: 2009-11-02 21:56
帖子: 86
送出感谢: 0 次
接收感谢: 0 次
附件:
Selection_001.png
Selection_001.png [ 4.17 KiB | 被浏览 892 次 ]

上图,头两个字节乱码,其实是Unicode编码的文件头FF FE而已


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 5 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 1 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
cron
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译