我也是太天真了,竟然认为一个能把本帖讨论的unicode理解成微软记事本上写的unicode的人能搞懂我的意思。
为了照顾像你这样有理解障碍的人,我详细解释一下:
老黄历:指那些过了时的制度或规定,也指以前的一些老办法或做法
2个字节已经是老黄历了:指“...UTF-16,不论英文还是汉字每个字符都是两个字节”这种认为utf16就是两个字节的看法已经过时了,因为utf16已经随unicode标准的发展,需要用4个字节来表示unicode标准中的部分字符了。所以正确的认知是,utf16(目前)是用2个或4个字节来编码一个字符。
自己去查一下ucs-2和utf16的关系 :以前只用两个字节来编码的方案,现在称为ucs-2,是utf16的子集。
至于浪费空间英文国家不会用就更可笑了,微软自从开发了nt内核,就把utf16作为内部字符串编码的标准,所以英文国家如果用windows,一样是在大量使用utf16
笑死,和下面的话真是相映成趣i990049 写了: ↑2022-03-04 2:35 https://www.cnblogs.com/chendc/p/9298832.html
所以目前雅黑对应的字符是GB18030-2000,不是GB18030-2005,因为在 GB18030 中扩展 B 部分并不是强制标准,所以已经有了8万个字符的雅黑没有GB18030-2005的B 部分。请问你说的雅黑不兼容GB18030是什么意思?因为不包含非强制标准所以不兼容?先搞清楚雅黑对应GB18030哪个标准再说。
另外,你口口声声说扩展B,你知道扩展B是从哪里来的吗?如果能搞明白,看你写的下面这段话就更好笑了