debian中输入偏旁部首,候选词会显示方块

系统字体配置、中文显示和输入法问题
头像
astolia
论坛版主
帖子: 6703
注册时间: 2008-09-18 13:11

Re: debian中输入偏旁部首,候选词会显示方块

#46

帖子 astolia »

i990049 写了: 2022-03-04 2:35
astolia 写了: 2022-03-03 17:24 2个字节已经是老黄历了,自己去查一下ucs-2和utf16的关系
说得好像usc2很优秀似的,既然你说两个字节的utf16过时了,那ucs2编码英文字符也是用两个字节,用英文的国家凭什么用这种浪费空间的编码?
我也是太天真了,竟然认为一个能把本帖讨论的unicode理解成微软记事本上写的unicode的人能搞懂我的意思。
为了照顾像你这样有理解障碍的人,我详细解释一下:
老黄历:指那些过了时的制度或规定,也指以前的一些老办法或做法
2个字节已经是老黄历了:指“...UTF-16,不论英文还是汉字每个字符都是两个字节”这种认为utf16就是两个字节的看法已经过时了,因为utf16已经随unicode标准的发展,需要用4个字节来表示unicode标准中的部分字符了。所以正确的认知是,utf16(目前)是用2个或4个字节来编码一个字符。
自己去查一下ucs-2和utf16的关系 :以前只用两个字节来编码的方案,现在称为ucs-2,是utf16的子集。
至于浪费空间英文国家不会用就更可笑了,微软自从开发了nt内核,就把utf16作为内部字符串编码的标准,所以英文国家如果用windows,一样是在大量使用utf16

i990049 写了: 2022-03-04 2:35 https://www.cnblogs.com/chendc/p/9298832.html
所以目前雅黑对应的字符是GB18030-2000,不是GB18030-2005,因为在 GB18030 中扩展 B 部分并不是强制标准,所以已经有了8万个字符的雅黑没有GB18030-2005的B 部分。请问你说的雅黑不兼容GB18030是什么意思?因为不包含非强制标准所以不兼容?先搞清楚雅黑对应GB18030哪个标准再说。
笑死,和下面的话真是相映成趣
i990049 写了: 2022-03-03 0:27 上面已经有人说了用微软雅黑就能打出7万多个字库,其实就是因为雅黑完整携带了GB 18030全部7万多个字库,另外的还有方正和汉仪,至于文泉驿和思源是不是包括完整的GB 18030,你自己找冷僻字和少数民族语言去测试好了。

另外,你口口声声说扩展B,你知道扩展B是从哪里来的吗?如果能搞明白,看你写的下面这段话就更好笑了
i990049 写了: 2022-03-04 2:35 这就是前面有人回帖说用宋体SimSun-ExtB打出了特殊符号的原因,因为他那个符号就在宋体SimSun-ExtB里面,别的字体都没这个字符,你要是觉得ucs2可以取代别的编码,先把SimSun-ExtB里面的字符收了再说,哪位同学研究过最新版Unicode的可以说说跟SimSun-ExtB里面的字符对应的Unicode编码具体在哪个位置。
头像
i990049
帖子: 525
注册时间: 2006-06-05 13:26

Re: debian中输入偏旁部首,候选词会显示方块

#47

帖子 i990049 »

astolia 写了: 2022-03-04 10:58
i990049 写了: 2022-03-04 2:35
astolia 写了: 2022-03-03 17:24 2个字节已经是老黄历了,自己去查一下ucs-2和utf16的关系
说得好像usc2很优秀似的,既然你说两个字节的utf16过时了,那ucs2编码英文字符也是用两个字节,用英文的国家凭什么用这种浪费空间的编码?
我也是太天真了,竟然认为一个能把本帖讨论的unicode理解成微软记事本上写的unicode的人能搞懂我的意思。
为了照顾像你这样有理解障碍的人,我详细解释一下:
老黄历:指那些过了时的制度或规定,也指以前的一些老办法或做法
2个字节已经是老黄历了:指“...UTF-16,不论英文还是汉字每个字符都是两个字节”这种认为utf16就是两个字节的看法已经过时了,因为utf16已经随unicode标准的发展,需要用4个字节来表示unicode标准中的部分字符了。所以正确的认知是,utf16(目前)是用2个或4个字节来编码一个字符。
自己去查一下ucs-2和utf16的关系 :以前只用两个字节来编码的方案,现在称为ucs-2,是utf16的子集。
至于浪费空间英文国家不会用就更可笑了,微软自从开发了nt内核,就把utf16作为内部字符串编码的标准,所以英文国家如果用windows,一样是在大量使用utf16

i990049 写了: 2022-03-04 2:35 https://www.cnblogs.com/chendc/p/9298832.html
所以目前雅黑对应的字符是GB18030-2000,不是GB18030-2005,因为在 GB18030 中扩展 B 部分并不是强制标准,所以已经有了8万个字符的雅黑没有GB18030-2005的B 部分。请问你说的雅黑不兼容GB18030是什么意思?因为不包含非强制标准所以不兼容?先搞清楚雅黑对应GB18030哪个标准再说。
笑死,和下面的话真是相映成趣
i990049 写了: 2022-03-03 0:27 上面已经有人说了用微软雅黑就能打出7万多个字库,其实就是因为雅黑完整携带了GB 18030全部7万多个字库,另外的还有方正和汉仪,至于文泉驿和思源是不是包括完整的GB 18030,你自己找冷僻字和少数民族语言去测试好了。

另外,你口口声声说扩展B,你知道扩展B是从哪里来的吗?如果能搞明白,看你写的下面这段话就更好笑了
i990049 写了: 2022-03-04 2:35 这就是前面有人回帖说用宋体SimSun-ExtB打出了特殊符号的原因,因为他那个符号就在宋体SimSun-ExtB里面,别的字体都没这个字符,你要是觉得ucs2可以取代别的编码,先把SimSun-ExtB里面的字符收了再说,哪位同学研究过最新版Unicode的可以说说跟SimSun-ExtB里面的字符对应的Unicode编码具体在哪个位置。
我更笑死了,你根本没看我写什么,我前面的图片下面写了用Unicode保存文档指的是utf16,你没看见就说别人理解不了,那前面还有人说用Unicode utf16保存文档会出现乱码,那你理解了吗?前面的文章说了用四个字节的是ucs4,ucs2什么时候变成四个字节?就算现在的ucs2可以用两个字节或者四个字节储存字符,跟ucs2保存文档会不会乱码有关系吗?用两个字节和四个字节保存英文字母的做法很优秀?微软nt内核采用的编码就是好的?那微软还用了BOM,保存的utf8字幕文档在我的机顶盒上面特殊符号全是问号,所以微软用的编码就是好编码?你始终没有回应SimSun-ExtB打出来的字符用utf16或者ucs2保存文档会不会出现乱码,更没有理解Windows 10上面接近9万的雅黑为什么有199个新汉字却没有GB18030-2005的B 部分,就直接认为雅黑不兼容GB18030,那你找个不是SimSun-ExtB的字体打出B 部分给大家看看?
头像
astolia
论坛版主
帖子: 6703
注册时间: 2008-09-18 13:11

Re: debian中输入偏旁部首,候选词会显示方块

#48

帖子 astolia »

i990049 写了: 2022-03-04 2:35 那前面还有人说用Unicode utf16保存文档会出现乱码,那你理解了吗?
有人说过,等我来找找看……喔,是你自己对这楼里讨论的unicode的含义理解错误脑补出来的啊

i990049 写了: 2022-03-04 2:35
astolia 写了: 2022-03-04 10:58 因为utf16已经随unicode标准的发展,需要用4个字节来表示unicode标准中的部分字符了。所以正确的认知是,utf16(目前)是用2个或4个字节来编码一个字符。
astolia 写了: 2022-03-04 10:58 以前只用两个字节来编码的方案,现在称为ucs-2,是utf16的子集。
前面的文章说了用四个字节的是ucs4,ucs2什么时候变成四个字节?就算现在的ucs2可以用两个字节或者四个字节储存字符,跟ucs2保存文档会不会乱码有关系吗?
我只能认为要么是你理解能力低下,要么就是你脑子被错误信息先入为主后装不下其他东西了。个人感觉是前者。

i990049 写了: 2022-03-04 2:35 你始终没有回应SimSun-ExtB打出来的字符用utf16或者ucs2保存文档会不会出现乱码
跟编码有个屁关系,我为什么要回应?你连unicode标准、文本编码、字体之间的关系都没弄清楚。楼上yq-ysy搞的输入法码表,是用utf8保存的,只要选择用合适的字体,一样不会有乱码。至于ucs2嘛,就呵呵了

i990049 写了: 2022-03-04 2:35 更没有理解Windows 10上面接近9万的雅黑为什么有199个新汉字却没有GB18030-2005的B 部分,就直接认为雅黑不兼容GB18030,那你找个不是SimSun-ExtB的字体打出B 部分给大家看看?
i990049 写了: 2022-03-03 0:27 上面已经有人说了用微软雅黑就能打出7万多个字库,其实就是因为雅黑完整携带了GB 18030全部7万多个字库
astolia 写了: 2022-03-03 17:24 你放的这个链接,不就正好证明了微软雅黑没有做私人使用区的字,导致无法完全兼容gb18030标准?
所以说跟理解能力低下的人交流就是费劲,是你先说雅黑完整的,我说没有完全兼容,你给我滑坡到不兼容??还是说你不懂“完全”这个词的意思?早说嘛
完全wán quán
词典解释
①齐全,没有缺少或缺损:这本书的版本是最好最完全的本子。
②副词。表示全部:完全正确|完全相同。
懂了吗?这位疑似理解能力低下的同学?

i990049 写了: 2022-03-04 2:35 因为在 GB18030 中扩展 B 部分并不是强制标准,所以已经有了8万个字符的雅黑没有GB18030-2005的B 部分。
不好意思,GB18030-2005标准中没有扩展B部分这个东西。gb18030-2000/2005中提到的扩展B来自于gb13000.1-93,而gb13000.1-93实际就是同年发布的unicode 1.1版标准。这样就可以回答你这个问题了
i990049 写了: 2022-03-03 0:27 哪位同学研究过最新版Unicode的可以说说跟SimSun-ExtB里面的字符对应的Unicode编码具体在哪个位置。
懂了吗?这位疑似理解能力低下的同学?
头像
i990049
帖子: 525
注册时间: 2006-06-05 13:26

Re: debian中输入偏旁部首,候选词会显示方块

#49

帖子 i990049 »

astolia 写了: 2022-03-04 13:41
i990049 写了: 2022-03-04 2:35 那前面还有人说用Unicode utf16保存文档会出现乱码,那你理解了吗?
有人说过,等我来找找看……喔,是你自己对这楼里讨论的unicode的含义理解错误脑补出来的啊

i990049 写了: 2022-03-04 2:35
astolia 写了: 2022-03-04 10:58 因为utf16已经随unicode标准的发展,需要用4个字节来表示unicode标准中的部分字符了。所以正确的认知是,utf16(目前)是用2个或4个字节来编码一个字符。
astolia 写了: 2022-03-04 10:58 以前只用两个字节来编码的方案,现在称为ucs-2,是utf16的子集。
前面的文章说了用四个字节的是ucs4,ucs2什么时候变成四个字节?就算现在的ucs2可以用两个字节或者四个字节储存字符,跟ucs2保存文档会不会乱码有关系吗?
我只能认为要么是你理解能力低下,要么就是你脑子被错误信息先入为主后装不下其他东西了。个人感觉是前者。

i990049 写了: 2022-03-04 2:35 你始终没有回应SimSun-ExtB打出来的字符用utf16或者ucs2保存文档会不会出现乱码
跟编码有个屁关系,我为什么要回应?你连unicode标准、文本编码、字体之间的关系都没弄清楚。楼上yq-ysy搞的输入法码表,是用utf8保存的,只要选择用合适的字体,一样不会有乱码。至于ucs2嘛,就呵呵了

i990049 写了: 2022-03-04 2:35 更没有理解Windows 10上面接近9万的雅黑为什么有199个新汉字却没有GB18030-2005的B 部分,就直接认为雅黑不兼容GB18030,那你找个不是SimSun-ExtB的字体打出B 部分给大家看看?
i990049 写了: 2022-03-03 0:27 上面已经有人说了用微软雅黑就能打出7万多个字库,其实就是因为雅黑完整携带了GB 18030全部7万多个字库
astolia 写了: 2022-03-03 17:24 你放的这个链接,不就正好证明了微软雅黑没有做私人使用区的字,导致无法完全兼容gb18030标准?
所以说跟理解能力低下的人交流就是费劲,是你先说雅黑完整的,我说没有完全兼容,你给我滑坡到不兼容??还是说你不懂“完全”这个词的意思?早说嘛
完全wán quán
词典解释
①齐全,没有缺少或缺损:这本书的版本是最好最完全的本子。
②副词。表示全部:完全正确|完全相同。
懂了吗?这位疑似理解能力低下的同学?

i990049 写了: 2022-03-04 2:35 因为在 GB18030 中扩展 B 部分并不是强制标准,所以已经有了8万个字符的雅黑没有GB18030-2005的B 部分。
不好意思,GB18030-2005标准中没有扩展B部分这个东西。gb18030-2000/2005中提到的扩展B来自于gb13000.1-93,而gb13000.1-93实际就是同年发布的unicode 1.1版标准。这样就可以回答你这个问题了
i990049 写了: 2022-03-03 0:27 哪位同学研究过最新版Unicode的可以说说跟SimSun-ExtB里面的字符对应的Unicode编码具体在哪个位置。
懂了吗?这位疑似理解能力低下的同学?
兼不兼容是你自己开的头,怎么变成我说的了?你在这里扯编码问题,扯ucs2用两个还是四个字节保存,跟文档会不会乱码有半毛钱关系?ucs2根本就不是100%覆盖Unicode的全部字符,你还指望它取代你所谓的过时的utf16?ucs2没有覆盖的字符它能显示出来?是谁理解能力底下呢?
image-20200220142422832.png
头像
astolia
论坛版主
帖子: 6703
注册时间: 2008-09-18 13:11

Re: debian中输入偏旁部首,候选词会显示方块

#50

帖子 astolia »

i990049 写了: 2022-03-04 16:23 兼不兼容是你自己开的头,怎么变成我说的了?你在这里扯编码问题,扯ucs2用两个还是四个字节保存,跟文档会不会乱码有半毛钱关系?ucs2根本就不是100%覆盖Unicode的全部字符,你还指望它取代你所谓的过时的utf16?ucs2没有覆盖的字符它能显示出来?是谁理解能力底下呢?
image-20200220142422832.png
我最后说几句,你爱听不听。像你这样缺乏技术背景,临时抱佛脚从网上看了些别人的只言片语,以为自己懂了,就跑来讨论技术问题,只会闹出一个又一个笑话。当然了,你要么脸皮厚要么不要脸,每次被我打脸后都东拉西扯满地打滚死不认错,我现在也只能把你的帖子留在这里让大家看看傻子撒泼乐上一乐。自己好自为之吧,说不定下次我就直接动手不动口了
头像
i990049
帖子: 525
注册时间: 2006-06-05 13:26

Re: debian中输入偏旁部首,候选词会显示方块

#51

帖子 i990049 »

astolia 写了: 2022-03-06 0:38
i990049 写了: 2022-03-04 16:23 兼不兼容是你自己开的头,怎么变成我说的了?你在这里扯编码问题,扯ucs2用两个还是四个字节保存,跟文档会不会乱码有半毛钱关系?ucs2根本就不是100%覆盖Unicode的全部字符,你还指望它取代你所谓的过时的utf16?ucs2没有覆盖的字符它能显示出来?是谁理解能力底下呢?
image-20200220142422832.png
我最后说几句,你爱听不听。像你这样缺乏技术背景,临时抱佛脚从网上看了些别人的文章,以为自己懂了,就跑来讨论技术问题,只会闹出一个又一个笑话。当然了,你要么脸皮厚要么不要脸,每次被人打脸后都东拉西扯满地打滚死不认错,我也奈何不了你,只能留在这里让大家看看傻子撒泼乐上一乐。自己好自为之吧。
永中office只是作为软件介绍,你要是觉得难用,没人逼你用,就像微软雅黑和宋体,人家字库就是比Ubuntu自带的字体多,你爱用不用,用Windows和用Linux不也是一个道理吗?用了永中office和Windows就是傻子?你自己去别的地方秀优越感吧
回复