梦幻词库V1.2(86优化版)for fcitx(第四次更新)

系统字体配置、中文显示和输入法问题
头像
petrele.chen
帖子: 261
注册时间: 2008-09-11 17:41

梦幻词库V1.2(86优化版)for fcitx(第四次更新)

#1

帖子 petrele.chen » 2009-04-16 11:57

我已经跟fcitx的开发人员联系过了,现在正打算为fctix更新一个合适的五笔码表。

最近几天找了几个不错的词库,如极点五万精品词库、梦幻词库等。现在正联系各位作者进行版权确认。

附件是本人根据wybcn的梦幻词库V1.2制作的fctix码表。

现在发上来,请各位五笔爱好者能够测试一下。如遇什么问题请及时提出来
(原词库中有问号,转换时被我删除。在急时与作者取得联系之后,作者给我发了一份更新版本,现重新传上来了。。)

极点五笔梦幻词库(86优化)V1.2说明: <------摘自五笔爱好者论坛
1、梦幻词库V1.2收录词组35288组,为一剑流畅词库V1.4、窝子极爽词库6.0、海峰词库9.5、物理中国五万精品词库3.3最终版共同收录的词组;

2、极点五笔梦幻词库大字符集版(86优化)V1.2,支持CJK基本、CJK扩展A、CJK扩展B、CJK扩展C、CJK兼容扩展、CJK部首扩展、CJK康熙部首、CJK笔画、CJK兼容。这也是本次词库版本升级中所做的最主要的工作;

3、字词重码时的排序:引用了“重码时有简码字置后”这一规则,并严格按照这一规则制作;

4、词组与词组之间重码的处理:与他们在一剑流畅词库V1.4中的排序相同;

5、二重一级简码的处理方案与一剑词库相同;

menghuanV1.2_3.tar.gz
忘记删除梦幻词库中的拼音区了,这是删除拼音区后的版本。
(372.92 KiB) 已下载 221 次
更新:

在上一版本的基本上添加了符号输入。符号按其分类以拼音进行编码。末两位均为符号的拼音fh,方便记忆。
书名符号:smfh 「 」 『 』 【 】 〖 〗 …

点数符号:dsfh ⒈ ⒉ ⒊ ⒋ ⒌ ⒍ ⒎ ⒏ ⒐ ⒑ ⒒ ⒓ ⒔ ⒕ ⒖ ⒗ ⒘ ⒙ ⒚ ⒛

大写罗马数字(符号):dlfh Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ Ⅵ Ⅶ Ⅷ Ⅸ Ⅹ Ⅺ Ⅻ

单位符号:dwfh ㎎ ㎏ ㎜ ㎝ ㎞ ㎡ ㏄ ㏎ ㏑ ㏒ ㏕

大写希腊字母(符号):dxfh Α Β Γ Δ Ε Ζ Η Θ Ι Κ Λ Μ Ν Ξ Ο Π Ρ Σ Τ Υ Φ Χ Ψ Ω

括号数字符号:ksfh ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ ⑻ ⑼ ⑽ ⑾ ⑿ ⒀ ⒁ ⒂ ⒃ ⒄ ⒅ ⒆ ⒇

货币符号:hbfh € $ ¢ £ ¥ ¤

箭头符号:jtfh → ↑ ← ↓ ↖ ↗ ↘ ↙

日文(平假名)符号:jpfh ァ ア ィ イ ゥ ウ ェ エ ォ オ カ ガ キ ギ ク グ ケ ゲ コ ゴ サ ザ シ ジ ス ズ セ ゼ ソ ゾ タ ダ チ ヂ ッ ツ ヅ テ デ ト ド ナ ニ ヌ ネ ノ ハ バ パ ヒ ビ ピ フ ブ プ ヘ ベ ペ ホ ボ ポ マ ミ ム メ モ ャ ヤ ュ ユ ョ ヨ ラ リ ル レ ロ ヮ ワ ヰ ヱ ヲ ン ヴ ヵ ヶ ー ヽ ヾ

片假名符号:pjfh ぁ あ ぃ い ぅ う ぇ え ぉ お か が き ぎ ぱ く ぐ け げ こ ご さ ざ し じ す ず せ ぜ そ ぞ た だ ち ぢ っ つ づ て で と ど な に ぬ ね の は ば ひ び ぴ ふ ぶ ぷ へ べ ぺ ほ ぼ ぽ ま み む め も ゃ や ゅ ゆ ょ よ ら り る れ ろ ゎ わ ゐ ゑ を ん ゛ ゜ ゝ ゞ

数学符号:sxfh ± × ÷ ∈ ∏ ∑ √ ∝ ∞ ∟ ∠ ∣ ∥ ∧ ∨ ∩ ∪ ∫ ∮ ∴ ∵ ∶ ∷ ∽ ≈ ≌ ≒ ≠ ≡ ≤ ≥ ≦ ≧ ≮ ≯ ⊕ ⊙ ⊥ ⊿

特殊符号:tsfh ℃ ° ‰ ♂ ♀ § № ☆ ★ ○ ● ◎ ◇ ◆ □ ■ △ ▲ ※ 〓 # & @ \ ^ _  ̄

小写罗马数字(符号):xlfh ⅰ ⅱ ⅲ ⅳ ⅴ ⅵ ⅶ ⅷ ⅸ ⅹ

小写希腊字母(符号):xxfh β γ δ ε ζ η α ι κ λ μ ν ξ ο π ρ σ τ υ φ θ ψ ω

圆圈数字符号:ysfh ① ② ③ ④ ⑤ ⑥ ⑦ ⑧ ⑨ ⑩
有什么遗漏或不合理之处,欢迎大家提出来 (标点符号在键盘上都有,所以未添上)
menghuanV1.2_4.tar.gz
在上一版本中添加符号输入。同时包含码表及其源文件
(689.38 KiB) 已下载 168 次
tsfh
tsfh
screenshot-2009-04-18-16-55-08.png (4.86 KiB) 查看 3897 次
dxfh
dxfh
screenshot-2009-04-18-16-53-01.png (4.09 KiB) 查看 3893 次
dsfh
dsfh
screenshot-2009-04-18-16-52-02.png (4.29 KiB) 查看 3895 次
ysfh
ysfh
screenshot-2009-04-18-16-51-33.png (6 KiB) 查看 3900 次



特别提示:(在五笔中如何输入拼音)
对于五笔用户来说最烦的事就是提笔忘字。在fcitx中用一个很好的办法来解决这一问题:

首先保证在五笔的配置中开启了拼音、设置好了拼音键。(不知道怎么设置?认真看看下面的如何添加码表吧)

然后,当提笔忘字时,先敲一下拼音键,然后就是拼音输入了,爽吧。


所以,在五笔码表中不需要拼音了。但是同时也带来了一个问题,即下面提到的符号输入的第三种办法,zz键用不了,我现在正想用什么键代替呢,毕竟这方法省去了切换小键盘的痛苦。


同时转换了一份物理中国的五万精品词库V3.3,现也上传一份供大家选择

词库特点: <------- 同样引用作者(物理中国)的原话
本词库共收词50187条。其中:二字词36425条,三字词4030条,四字词9098条,四字以上634条。词组重码率:13.75%,总重码率:14.06%。

五笔及拼音词库全部采用最新Google词频,感谢AhMan先生援手!

词库优点:

⒈ 词库词序非常合理:所有词条词频取自最新Google!

⒉ 配套五万拼音词库:解决提笔忘字困扰; <----- 本人转过来的词库仅为五笔

⒊ 协调单字与词组的关系:词频百万以上词居单字前;

⒋ 对二重码手工优化,力争“行云流水”般的感觉;

⒌ 词库容量大,在一定程序上可防止“打空”现象;

⒍ 词库选词精,错词极少(保留56个高频错词)。
wlzg.tar.gz
物理中国五万精品词库
(575.72 KiB) 已下载 99 次
希望大家积极反馈意见

如有需要,下次将上传奇境V2.0小词库(只有1.2万)。。。

补充:
码表使用方法:
1、将下载的码表文件复制到~/.fcitx目录下
2、从/usr/share/fcitx/data/目录复制tables.conf到~/.fcitx目录下
3、修改tables.conf文件,新建如下一段文件或仅将其“码表=”字段修改为你要使用的码表名字

代码: 全选

[码表]
名称=五笔字型
码表=wbx.mb           --------------->        码表啦
调频=0
拼音=1         ------>              就是这里了
拼音键=z       --------->           还有这里
自动上屏=-1
空码自动上屏=0
模糊=1
模糊键=z
自动词组=1
自动词组长度=4
词组参与自动造词=1
保存自动词组=3
精确匹配=0
提示编码=0
符号=zzzz
请求援助 一:

有位网友提到了符号的输入,我知道有多少人用地fcitx默认的符号输入。

我粗略地看了一下fcitx默认的码表源文件,里面对符号的编码是这样的:
例如: △ 的编码为dqga,即三角形的五笔编码。
但是也有些符号我完全看不懂编码怎么来的,例如drkg {和 drkg }。

我粗略地查了一下,现在网络上比较流形的符号编码方法有:
1. 根据符号名称的五笔编码
2. 根据符号名称的拼音编码
3. 根据符号分类来编码,一般以zz开头,例如:数学符号的编码均为zzsx


我个人觉得第三种方法比较不错,但重码率太高。同时,可以将一些最常用的符号,如大于号,用五笔或拼音来编码。

欢迎大家提出自己的意见。。。

请求援助 二:

我这传上来一份fcitx五笔码表源文件(GBK编码),希望哪位网友有时间能够找出其中所有的符号的行。并以一个文件发上来,或直接发我邮箱里面:petrele.chen@gmail.com

这个文件有几万行,要花点时间。或谁有更好的办法也行。
wbx.tar.gz
fcitx默认五笔码表源文件
(437.56 KiB) 已下载 52 次
上次由 petrele.chen 在 2009-04-18 16:59,总共编辑 9 次。
头像
南风夜雨
帖子: 840
注册时间: 2007-01-04 9:49
系统: ubuntu-gnome

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#2

帖子 南风夜雨 » 2009-04-16 16:02

我是简单的拿来就用的菜鸟,更是一直使用fcitx的受益者。感谢楼主。虽然还不会为fcitx挂载码表,没办法为你做测试。
头像
momova
帖子: 3381
注册时间: 2007-07-11 21:43
系统: archlinux
来自: 东江边

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#3

帖子 momova » 2009-04-16 16:43

之前向极点五笔的作者建议开发个ubuntu版本的,他说暂时没这个计划……
我来了,我看见了,我征服了!
求勾搭,不管饭。
bus387
帖子: 117
注册时间: 2007-04-26 9:22

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#4

帖子 bus387 » 2009-04-16 16:55

立刻支持楼主工作,感谢你为我们五笔者带来福音。
我是从ibus转到fcitx的用户,非常喜欢fcitx的简捷为美,装个ibus需要我费2天的时候还搞不定,而fcitx,5分钟就好。

楼主能不能更新一下,讲一下这些词库的特点,这样用户选择的时候就更方便了。
头像
南风夜雨
帖子: 840
注册时间: 2007-01-04 9:49
系统: ubuntu-gnome

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#5

帖子 南风夜雨 » 2009-04-16 20:43

已经挂载了极点梦幻词库码表,现在就是使用这个呢,感觉应该不错,没发现什么问题,
只是不知道省略号、间隔号、破折号、连接号等等标点符号怎么打了,这个很常用。
不期望能像windows下一样能打出多少特殊字符出来,但标点符号还是要全部加入的,建议楼主按照fictx默认五笔的方式就可以了,毕竟fcitx五笔用户已经养成了习惯,改了似乎也不太好。
头像
petrele.chen
帖子: 261
注册时间: 2008-09-11 17:41

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#6

帖子 petrele.chen » 2009-04-16 21:09

我现在还没对比这些词库,一开始我只是觉得fcitx的词组太少了,特别是二字词,所以就想找个替代的词库。于是我给fcitx的开发组发邮件,建议为五笔更新词库。而我得到的回复是可以,但要考虑版权问题。

于是我花了两天的时间联系几个不错的词库的作者,询问相关版权。我得到的回复是基本上都是只要不应用于商业用途均可再编辑打包后再发布。

对于你提到的问题,我花些时间参考一下fcitx原词库中相关符号的内容,然后将其加入现在的的词库中再发布出来。

谢谢你的反馈。。。
南风夜雨 写了:已经挂载了极点梦幻词库码表,现在就是使用这个呢,感觉应该不错,没发现什么问题,
只是不知道省略号、间隔号、破折号、连接号等等标点符号怎么打了,这个很常用。
不期望能像windows下一样能打出多少特殊字符出来,但标点符号还是要全部加入的,建议楼主按照fictx默认五笔的方式就可以了,毕竟fcitx五笔用户已经养成了习惯,改了似乎也不太好。
头像
lerosua
论坛版主
帖子: 8455
注册时间: 2007-11-29 9:41
联系:

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#7

帖子 lerosua » 2009-04-16 21:11

先顶后看
头像
aslen
帖子: 613
注册时间: 2006-08-28 23:00

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#8

帖子 aslen » 2009-04-16 21:38

这么好的东西,当然要顶起来了!
头像
南风夜雨
帖子: 840
注册时间: 2007-01-04 9:49
系统: ubuntu-gnome

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#9

帖子 南风夜雨 » 2009-04-17 10:46

fictx是开源的吧,如果是这样,词库自然也是开源的。而你联系的作者提出的前提条件是不应用于商业用途,已经明摆着不会同意开源了,这就是你说修改后的词库也许是不能默认加入fcitx的。版权还是个问题。
不过就算不用作fcitx五笔的默认码表,也可以遵照原作者的意思单独发布,由用户自行选择挂载,楼主也是功莫大焉。
现在才知道挂码个现成的码表就这样简单,我这等菜鸟也是可以接受的。 :em06
头像
petrele.chen
帖子: 261
注册时间: 2008-09-11 17:41

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#10

帖子 petrele.chen » 2009-04-17 12:09

作者原话:
不以盈利为目的可以任意修改使用,但需要注明词库来源于五笔爱好者论坛http://www.wbfans.com/bbs/,作者wybcn
本人对GPL等协议不甚了解,但我对上面一句话的理解是:只要我不以该码表来盈利,我可以对码表做任意的修改,当然也可以作为其他免费(不定开源)软件的组件再次发布。例如极点五笔默认采用的是窝子词库V4.3,这也算是个很好的说明。(注:如果需要的话我可以将窝子词库制作后传上来,但是由于窝子词库的作者注明不能进行任何的修改,所以加进fcitx的可能性不是很大。)

同时,我希望熟悉GPL的网友能对此进行更详细的解释。
南风夜雨 写了:fictx是开源的吧,如果是这样,词库自然也是开源的。而你联系的作者提出的前提条件是不应用于商业用途,已经明摆着不会同意开源了,这就是你说修改后的词库也许是不能默认加入fcitx的。版权还是个问题。
不过就算不用作fcitx五笔的默认码表,也可以遵照原作者的意思单独发布,由用户自行选择挂载,楼主也是功莫大焉。
现在才知道挂码个现成的码表就这样简单,我这等菜鸟也是可以接受的。 :em06
头像
jioyo源
帖子: 3476
注册时间: 2008-10-08 13:48

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#11

帖子 jioyo源 » 2009-04-17 12:18

:em06 来迟了,能在ibus里用吗??
--------------------------------------
论坛精华贴全集:http://forum.ubuntu.org.cn/viewtopic.php?f=48&t=199845
book:http://forum.ubuntu.org.cn/viewtopic.php?f=21&t=198286
头像
davio3g
帖子: 480
注册时间: 2009-01-06 15:18

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#12

帖子 davio3g » 2009-04-17 12:21

虽然偶不用FCITX,但也要顶一下。
感谢您的支持! www.tonegoo.com
头像
petrele.chen
帖子: 261
注册时间: 2008-09-11 17:41

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#13

帖子 petrele.chen » 2009-04-17 12:50

我不知道怎么转成ibus的词库,如果有需要我可以将fcitx的码表源文件传上来。

我之前也用过ibus,ibus的词库过于丰富,以至于用上Sun-Ext字库还有许多方框。。。
jioyo源 写了::em06 来迟了,能在ibus里用吗??
头像
南风夜雨
帖子: 840
注册时间: 2007-01-04 9:49
系统: ubuntu-gnome

Re: 梦幻词库V1.2(86优化版)for fcitx(更新 + 一词库)

#14

帖子 南风夜雨 » 2009-04-17 14:18

petrele.chen 写了:作者原话:
不以盈利为目的可以任意修改使用,但需要注明词库来源于五笔爱好者论坛http://www.wbfans.com/bbs/,作者wybcn
本人对GPL等协议不甚了解,但我对上面一句话的理解是:只要我不以该码表来盈利,我可以对码表做任意的修改,当然也可以作为其他免费(不定开源)软件的组件再次发布。例如极点五笔默认采用的是窝子词库V4.3,这也算是个很好的说明。(注:如果需要的话我可以将窝子词库制作后传上来,但是由于窝子词库的作者注明不能进行任何的修改,所以加进fcitx的可能性不是很大。)

同时,我希望熟悉GPL的网友能对此进行更详细的解释。
南风夜雨 写了:fictx是开源的吧,如果是这样,词库自然也是开源的。而你联系的作者提出的前提条件是不应用于商业用途,已经明摆着不会同意开源了,这就是你说修改后的词库也许是不能默认加入fcitx的。版权还是个问题。
不过就算不用作fcitx五笔的默认码表,也可以遵照原作者的意思单独发布,由用户自行选择挂载,楼主也是功莫大焉。
现在才知道挂码个现成的码表就这样简单,我这等菜鸟也是可以接受的。 :em06
我对gpl协议也并不了解。如果作者这样说的话,那就更可以搞了。
反正可以修改、使用它就是了。估计原作者也没明确自己采用什么协议发布吧!!我简单看了一下有关gpl协议的解释,采用这一协议软件只是不允许修改后作为闭源商业应用,但是充许发布者收取一定服务费用的,不知道这个算不算用于商业用途。fcitx不收取什么服务费用,更不可能用来赢利,应该不至于引起什么争议。
六翼拉菲尔
帖子: 163
注册时间: 2007-05-12 0:05

Re: 梦幻词库V1.2(86优化版)for fcitx(第三次更新)

#15

帖子 六翼拉菲尔 » 2009-04-18 11:43

:em20 :em20 :em20 :em20
各位大虾们,请问拼音的词库怎么制作啊,小弟我一直只用拼音啊,或者大虾们的作品中能不能考虑包含拼音呢,现在在使用ibus,不过感觉在某些时刻(很少,但是出现过)响应速度有问题啊。
回复