分页: 1 / 4

「fcitx-搜狗」合并词库及方法步骤(2012-06-17 更新)

发表于 : 2012-02-23 6:21
自由建客
词库:
压缩大小 6.9M,解压大小 21M
下载地址 我的网盘 之「中文」目录。
解压后,复制两 .mb 文件至 /usr/share/fcitx/data/ 或 /usr/share/fcitx/pinyin/ 覆盖原文件,或置于 ~/.config/fcitx/ 或 ~/.config/fcitx/pinyin/ 之中。
1.png
词库清单:
[text]fcitx 原配基础词库
白居易诗集【官方推荐】.scel.org
测绘词汇大全【官方推荐】.scel.org
成语俗语【官方推荐】.scel.org
初中必背古诗词曲大全(课标人教版).scel.org
党建理论词汇.scel.org
道教词汇大全【官方推荐】.scel.org
地理地质词汇大全【官方推荐】.scel.org
电力词汇大全【官方推荐】.scel.org
电子词汇大全【官方推荐】.scel.org
动物词汇大全【官方推荐】.scel.org
杜甫诗集【官方推荐】.scel.org
法律词汇大全【官方推荐】.scel.org
佛教词汇大全【官方推荐】.scel.org
古诗词名句【官方推荐】.scel.org
化学化工词汇大全【官方推荐】.scel.org
机械词汇大全【官方推荐】.scel.org
计算机词汇大全【官方推荐】.scel.org
教育部发布2007年新词语.scel.org
军事词汇大全【官方推荐】.scel.org
李白诗集【官方推荐】.scel.org
李清照词全集.scel.org
论语大全【官方推荐】.scel.org
毛泽东诗词精选【官方推荐】.scel.org
纳兰词.scel.org
南唐后主李煜的词.scel.org
农业词汇大全【官方推荐】.scel.org
气象词汇大全【官方推荐】.scel.org
生物词汇大全【官方推荐】.scel.org
诗词文言词库(精华版).scel.org
《诗经》篇名与诗句.scel.org
书法词汇大全【官方推荐】.scel.org
数学词汇大全【官方推荐】.scel.org
宋词精选【官方推荐】.scel.org
苏东坡诗词大全【官方推荐】.scel.org
太极拳【官方推荐】.scel.org
唐诗300首【官方推荐】.scel.org
天文词汇大全【官方推荐】.scel.org
王安石诗集【官方推荐】.scel.org
我国古代地名集锦(1264条).scel.org
武术【官方推荐】.scel.org
物理词汇大全【官方推荐】.scel.org
歇后语集锦【官方推荐】.scel.org
心理学词汇大全【官方推荐】.scel.org
辛弃疾词.scel.org
医疗器械大全【官方推荐】.scel.org
医学词汇大全【官方推荐】.scel.org
《增广贤文》.scel.org
哲学词汇大全【官方推荐】.scel.org
植物词汇大全【官方推荐】.scel.org
中国历史词汇大全【官方推荐】.scel.org
中外药品名称大全【官方推荐】.scel.org
中医中药大全【官方推荐】.scel.org
庄子全集【官方推荐】.scel.org[/text]

方法步骤流水帐:
[bash]# 下载词库
# http://pinyin.sogou.com/dict/

# 转为 org 格式
mkdir org
find . -name '*.scel' -exec scel2org -o org/{}.org {} \;

# 合并众 org 文件
mkdir dict
cd dict
cat ../org/*.scel.org > 1.org

# 准备必要的两个文件
# http://code.google.com/p/fcitx/downloads/list
tar xf fcitx-4.2.4.1_dict.tar.xz fcitx-4.2.4.1/data/{pinyin.tar.gz,gbkpy.org}
tar xf fcitx-4.2.4.1/data/pinyin.tar.gz
mv fcitx-4.2.4.1/data/gbkpy.org ./

# 合并 fcitx 基础词库
cat pyPhrase.org >>1.org

# 排序、去重、生成词库
sort 1.org >2.org
uniq 2.org >3.org
createPYMB gbkpy.org 3.org

# 结果文件
# pyERROR 词库中重复或有其它问题条目,有兴趣可参考,没事直接忽略
# pyPhrase.ok 除错后的无错的 org 格式词库,可取代 3.org 而保留供下次使用
# pyphrase.mb 最终词库,必须,用于覆盖原文件
# pybase.mb 配套的字码库,必须,用于覆盖原文件
[/bash]

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-23 12:42
npnufn
记号备用。
现在主要靠云输入,太强了

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-23 12:47
phoenixlzx
怎么用?

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-23 12:52
自由建客
phoenixlzx 写了:怎么用?
解压后,复制两 .mb 文件至 /usr/share/fcitx/data,覆盖原文件即可。

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-23 12:53
phoenixlzx
自由建客 写了:
phoenixlzx 写了:怎么用?
解压后,复制两 .mb 文件至 /usr/share/fcitx/data,覆盖原文件即可。
刚才找到了,Thx~

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-24 9:17
Eiffi
这是好东西,不过我也现在也是主要靠fcitx的云输入识别,当然也有写不能识别,基本上输入的时候,也不错的。感觉非常好。暂时用不了,虽然我的8G内存只用了不到20%每次,从开机到关机。

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-24 9:40
lovebluesky
mark

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-24 9:46
billzt
楼主怎么着也应该给一个词库转换教程啊!

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-24 10:47
谢宝良
在ibus上能用吗?

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

发表于 : 2012-02-24 15:11
自由建客
谢宝良 写了:在ibus上能用吗?
未知。估计不能!

Re: fcitx 搜狗合并词库及方法步骤(2012-02-24 更新)

发表于 : 2012-02-24 15:13
qy117121
五笔用户路过

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

发表于 : 2012-02-24 22:19
谢宝良
已经成功安装,但没有感觉到比之前智能多少。可能要使用一段时间才磨合到最佳吧。

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

发表于 : 2012-02-24 22:49
自由建客
谢宝良, 词库大点而已,输入法算法又没改,你想它智能到哪去啊!

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

发表于 : 2012-02-25 9:27
wtry
我这没有需要覆盖的东西啊!

我的是arch!

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

发表于 : 2012-02-25 10:00
自由建客
wtry 写了:我这没有需要覆盖的东西啊!

我的是arch!
“/usr/share/fcitx/pinyin/”