五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

系统字体配置、中文显示和输入法问题
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#16

帖子 wangdu2002 » 2009-10-07 20:32

,zz这个设计太麻烦了
打五笔的小指一般少用啊,小指敲一下z,“句法输入”,再敲一下z,或两下zz又回到了“字词模式”----说实话,不足五个字的,能好意思叫句子吗? :em05
ps:lz头像怎么换来换去的啊 ,前几天还是个女人,现在怎么变日头了 ?外加河蟹,有何深意?还望明示!
看来这位t3swing兄弟没泡过水区,某家顶顶有名的红朝牌三表河蟹竟然不解其意----感谢大三八为某家精心制作的河蟹戴表作。 :em05
其实,这是最初的第一版本。因为第二版的多此一女,财太露白;第三版的太明白,太呆板----某可是屁民。。。目前将就着用吧 :em02
除前幢的黑手所描述的含义外,还有:
----红朝大庆刚过,兄弟你不会这么快就忘记了吧?旗帜就是形象,旗帜就是方向----血火红潮哟。 :em04
----汝生活在当前河蟹横行、钳制一切的时代,难道尔不上天朝局域网,竟敢擅自穿墙出户。 :em02
----戴表朝廷,戴表官府,戴表老爷,只要完成九年义务教育的公民们母民们,应该都从教科书上学到手了喔。 :em06
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
头像
jarryson
帖子: 4002
注册时间: 2005-08-14 19:53

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#17

帖子 jarryson » 2009-10-07 22:29

额。。顶多加大些词库补全啥的。

五笔整句输入,顶多输入词组,不然才4个键输入整句哪重复率多高啊。
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#18

帖子 wangdu2002 » 2009-10-08 20:12

jarryson 写了:额。。顶多加大些词库补全啥的。

五笔整句输入,顶多输入词组,不然才4个键输入整句哪重复率多高啊。
这位兄弟没明白某家的意思,某是指扩充真正的整句输入功能,不再是四码,是从5码--15码,更长的码原则上应该也行,一个短句里各个字只取首字元编码。
例如:
rmslm----------看贴要回贴
gtsqlr-----------五笔整句输入
wggrdq--------今天天气不错
mgwttgi--------见到你我很高兴
mkfq,cgifbb---刚吃过饭,又来泡坛子了
srikryj----------查看活跃的主题
wttydnc--------人生得意须尽欢
。。。。。。。。。。。。。。。。。
因为只是利用现有五笔编码方法中基本不用的z键来随意切换,完全不影响正常的字词输入,而且用的是单独的句表,而不是字词码表。重码接近于零。 :em05
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
头像
leeaman
帖子: 30702
注册时间: 2007-02-02 18:14
系统: debian sid

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#19

帖子 leeaman » 2009-10-08 20:19

不用分字符的话只是首笔画恐怕准确率很难搞高,到时候恐怕一个一个子选恐怕更加烦 :em06
醉了星星,醉月亮●●●●●The Long Way To Go(*^_^*)
头像
pityonline
帖子: 3864
注册时间: 2008-12-09 12:44
来自: 北京
联系:

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#20

帖子 pityonline » 2009-10-08 20:32

想法不错,无知群众路过胡乱支持一下……

我现在用的万能五笔的码表,有待完善,尤其在标点符号输入时,一直没发现有全角的双引号,不过zz还好,会出现在些汉字的标点符号,并且现在我用shift+引号键会出现@这个符号,shift+2会出现“”,好在输入法是开放的,可以自己改码表,期待楼主有新的突破,做一个wangdu.bin给大家学习一下,或者做一个wangdu.jb让scim调用,大家用开了,也就推广开了……
Pity is the bomp!
活着就是折腾!生命不息,折腾不止!
看这帮家伙在干什么?@pityonline/u
Dropbox+Vps+PC 跑起来了!这是邀请链接
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#21

帖子 wangdu2002 » 2009-10-08 20:35

leeaman 写了:不用分字符的话只是首笔画恐怕准确率很难搞高,到时候恐怕一个一个子选恐怕更加烦 :em06
打五笔的如果连一个字的首字元都拆不出,还玩个屁五笔啊,某连拆百字,难得碰到第一字元拆不出来的情况----另,是首字元,不是首笔画。 :em04
既然是搜索“句表”,当然是不能象搜索“码表”那样,才键入一码就急着匹配“句表”,至少也得键入4、5码后才开始智能匹配吧。。。 :em02

某目前只是构想而已,所以发贴探讨其可能性。
如果三、五年后,某编程水平提高了,但还没有输入法提供这个功能,某自个拿Fcitx的源码改改看,也许能做一套自己满意的整句五笔输入法出来。 :em05
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
头像
smallapple
论坛版主
帖子: 7868
注册时间: 2009-03-28 15:12

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#22

帖子 smallapple » 2009-10-08 20:40

如果三、五年后,某编程水平提高了,但还没有输入法提供这个功能,某自个拿Fcitx的源码改改看,也许能做一套自己满意的整句五笔输入法出来。
期待 ing。。。
头像
leeaman
帖子: 30702
注册时间: 2007-02-02 18:14
系统: debian sid

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#23

帖子 leeaman » 2009-10-08 20:43

嘟嘟你都不明白我的意思的,我是说你只打首字元然后靠输入法组成的句子的准确率很难达到一句只是修改一俩个字就可以了,而且很难通过词库的提高来提高组句的成功率的
醉了星星,醉月亮●●●●●The Long Way To Go(*^_^*)
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#24

帖子 wangdu2002 » 2009-10-08 20:55

leeaman 写了:嘟嘟你都不明白我的意思的,我是说你只打首字元然后靠输入法组成的句子的准确率很难达到一句只是修改一俩个字就可以了,而且很难通过词库的提高来提高组句的成功率的
Leeaman说得有理,不过某的意思并不是用“句表”取代“码表”,而仅仅是在“码表”之外再扩充“句表”。在句表中把常用短句,个人习惯用的短句搞到“句表”里去。
实际的输入文字的过程仍然是常规的字词输入为主,只是多了个句表功能而已(很容易切换,小指一动用句,再动用字)。 :em02
之所以这样考虑,正是不想仅用四码和字词搞在一起,增加了重码率,选择是很费时间的,大大降低了击键效率,而形码输入的优点本就是重码低,不用选择。
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
billbear
帖子: 3681
注册时间: 2008-05-03 23:42

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#25

帖子 billbear » 2009-10-09 0:35

觉得好像不是“句表”能够解决的。现有的拼音整句输入法里应该都不存在“句表”这样的元件。
词组能做成词库,但是句子有无限的可能性,整句输入应该是基于另一套理论,基于词和语法分析的智能择优算法,比较复杂,在无限的可能性面前还经常败下阵来,感觉还不是很好用。但是拼音整句输入的错误经常可以容忍,在很长的一句话里用个把错误的同音字替换而不去纠正可以不很影响可读性,五笔出错可能会完全看不懂。

另外,拼音的整句输入通常每个字的编码是输入全了的,只是减少了选字的时间。以信息量最大的双拼为例,每字编码达到两个。如果仅仅键入声母,整句输入的正确性就会极其糟糕。你试试每个字只说辅音有没有人能够听懂。计算机做这件事的能力不会超过人类。按照概率论,你的每字一码的整句输入方案一定同样不可用。要具备基本的可用性至少要取两码。这还要看五笔中两码包含的信息量会不会比双拼中两码的信息量少(应该不会),就是说五笔中所有可能的两码组合总数是不是比双拼中所有可能的两码组合总数少,以及每一个两码对应的汉字数量分布的均匀程度。

理论上一个理想状态的输入法,单字只需要 3 码就足够了,因为 26*26*26=17576,已经远远超过了你我认识的汉字总数。刚才特地查了一下,毛泽东所有的文章仅含3136个汉字。关键就是要尽可能地使用所有的字母组合。但是这样的编码要考虑学习的难度,在拼音下不太好搞。高中时候我有一个方案就是结合一点形码思想,每个字取声母(用双拼写法的声母)并且如果能拆成两个部分的,再取这两个字的声母,规定一些偏旁的发音,拆成的两部分如果实在没法念就敲v。有多种拆法的都承认,如果完全不能拆就用完整的双拼。这件事情我没有热情做完,不过从我完成的部分看好像效果是不赖的,无须学习重码率低。(评估无须待全部完成,如果我完成了 C 打头的字剩下的部分就不可能再与完成部分重码) 但是这样的输入法违背了人的自然习惯,用起来不舒服,我果断地放弃了。我对形码也是这样的看法,也许是还没到习惯成自然吧。至今都还在使用拼音,我一直觉得形码会使我异化。今天的拼音已经很好用了。

对于形码来说,朝 3 码的方向优化是可以做到的。80年代我初中第一次上五笔课的时候计算了 26*26*26 的值并据此认定这是一个并不高明的设计,于是拒绝背诵那首令人费解的诗。后来出现的很多更加优秀却并不流行的输入法也证明五笔的成功在于它的早期推出,王很会做广告和营销,及时培养了一批用户的习惯,那时候还打民族悲情牌,什么汉字即将被信息时代淘汰啦,王把自己包装成捍卫汉字拯救民族的英雄,继仓颉造字蒙恬造笔之后的又一位神,纠集了一批不明真相的群众吹拉弹唱。扯远了。
上次由 billbear 在 2009-10-09 0:44,总共编辑 2 次。
billbear
帖子: 3681
注册时间: 2008-05-03 23:42

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#26

帖子 billbear » 2009-10-09 0:37

再多说一句,你要想真正做到自己满意,就应该把五笔扔到垃圾堆另起炉灶
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#27

帖子 wangdu2002 » 2009-10-09 9:51

十分感谢熊哥的详细回复。。。顺便恭喜熊哥挂上了可爱的新熊头像了。 :em05

某没有那么强的对汉字的认识和总结能力,也没有这个水平抛开五笔另搞一套更好的输入法编码方案。某只是想在五笔输入法(或其他形码)的框架之下扩充整句输入功能,而且也不是无限的句子和长句处理。只是“短句”处理而已,由于形码的特点,根本不需要复杂的智能算法,只是简单匹配而已。 :em04

四个字以内的情况下,五笔的字词兼容已经做得很好,重码率很低。对于五字以上的短句,如果“句表”和“码表”分开处理(已经用z切换模式了),重码率非
常低,当写文章时,句子从脑里浮现,手指会自然地击中首字元编码,肯定可以大大提高击键效率,又符合自然的书写习惯。

也许熊哥的教师水平不行,或许是过于排斥形码了,所以不能掌握形码或类似的五笔编码方案。某写过一本五笔98培训教材(没有公开发表),某按此教材曾指导过一个初中毕业生学练五笔(以前只会拼音),几个小时(上午一段时间,下午一段时间)就记住了字元键位表(某有一套速记法),每天稍加练习,三四天后就可以顺利的使用五笔打字了,一分钟能打四十字左右,如果有整句输入功能,想来一周的练习,一个生手就可以轻松达到每分钟60字以上。

学习形码好比学习vim,开始略有难度,但只要上手了,确实是可以提高打字速度,而且不依赖于拼音,对于不会读音的字照打不误,专业录入员更快。

顺便提下,实践证明,音形结合的方案不理想,要么形码,要么音码。就现在看,音码成主流(学习成本低,小学已会),形码是小众,但仍然有存在价值。
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
knowfarway
帖子: 877
注册时间: 2007-08-25 10:37

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#28

帖子 knowfarway » 2009-10-09 19:35

这想法不错啊,哪位高人能出来写写看。
头像
大宝
帖子: 3077
注册时间: 2008-06-30 22:32
联系:

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#29

帖子 大宝 » 2009-10-09 20:20

感觉点子还是不错的
就是同样为重码感到担忧
这个既得考虑习惯用语,还得考虑单字能力,此外还有自造词的问题,若再考虑进语句联想(不在是词组了),这种新型输入法需更多的智能支持,换言之,得有类似自动组词但又超过自动组词的自动学习、智能推测的本领(应该叫人工智能了),好像当年IBM的语音识别一样,一来得对输入法训练一番,之后还要不断地为其添加、修正个性化语句库,直至最终形成个人方案~
WOW,想想都不容易~,而且这样一个智能语句五笔,得有多大呀?
长路漫漫啊~
头像
wangdu2002
帖子: 13284
注册时间: 2008-12-13 19:39
来自: 物华天宝人杰地灵

Re: 五笔的整句输入法构想----特别希望能得到Yuking等输入法开发者们的意见

#30

帖子 wangdu2002 » 2009-10-09 20:54

大宝兄弟也来共同探讨了,非常好啊。 :em09
大宝兄弟的要求比某需要高级的太多。。。 :em03
某想的比较简单:
1、字词已经不用考虑了----z切换模式已经把码表和句表分离了,字词(四字以内的)属码表,五字以上的才能进句表,码表和句表的重码丝毫不相干。
2、自造词与码表无关-------词表属码表,与句表无关。而且最初只要提供一个初级系统句表就行了,用户句表根据需要才增加功能,也不存在训练问题。
3、智能支持和联想----------没想象中的复杂,句表与码表不同,只有键入4码、5码后才与句表中存在的短句匹配,没啥智能可以考虑。
4、句库的大小问题----------需要多大的句库,可以尝试,在实用性和处理效率间测试之,简单的短句库,十几MB足矣,内存数据库查询瞬间完成。
行到水穷处,坐看云起时。
海内生明月,天涯共此夕。
--------------------吾本独!
回复