下载地址:
fcitx-utf8的搜狗词库精简版,仅整合搜狗词库、计算机词汇和诗词古句等:
http://hslinuxextra.googlecode.com/file ... e-small.7z
fcitx-utf8的搜狗词库,非常全面:
http://hslinuxextra.googlecode.com/file ... se-full.7z
主要改进在于去掉了一些很长的词,有些词库文件文件里面有单字,也给去掉了(会影响词频)
这个词库我用了两天,感觉还不错,虽然full的这个词库很大,但是如果机器资源足够的话问题倒不大,相应速度没有太大影响。small这个词库仅仅是搜狗官方词库、计算机专业词库、网络流行词和诗词古句等。
用法很简单:
如果你的fcitx-utf8是源代码安装的,只要把下载目录的pyPhrase.org替换掉原来的data目录下的同名文件再编译安装即可。
如果你的fcitx-utf8是二进制包,那么用终端进入到下载目录中,执行:./run.sh,然后把生成的下列文件:pybase.mb和pyphrase.mb复制到 /usr/share/fcitx/data目录下覆盖原文件即可。
PS:
这个词库是用于fcitx-utf8的
如果你的fcitx-utf8词库文件不是在/usr/share/fcitx/data下面,那么请自己查找词库文件的安装目录再覆盖。
覆盖系统文件需要root权限!
另外在linuxsir上有朋友提议做一个sunpinyin的词库,由于sunpinyin的userdict很方便,直接用他的转码工具生成即可,我把full的词库做了一个sunpinyin的userdict,解压后把文件覆盖原有的~/.sunpinyin/userdict就可以了。
http://hslinuxextra.googlecode.com/file ... serdict.7z
精简版的词库:
http://hslinuxextra.googlecode.com/file ... t-small.7z
我用的是fcitx-sunpinyin,用这个词库可以直接输出下面两个句子,大家试试看:
咱们马老太从夫子庙那里到中华门还能碰到奥巴马
咱们马老太从夫子庙那里还能买到三聚氰胺和汶川地震的介绍
尤其是sunpinyin的内存占用很低,比较适合大词库。