「fcitx-搜狗」合并词库及方法步骤(2012-06-17 更新)

系统字体配置、中文显示和输入法问题
头像
自由建客
帖子: 13468
注册时间: 2008-07-30 23:21
系统: Debian stable AMD64

「fcitx-搜狗」合并词库及方法步骤(2012-06-17 更新)

#1

帖子 自由建客 » 2012-02-23 6:21

词库:
压缩大小 6.9M,解压大小 21M
下载地址 我的网盘 之「中文」目录。
解压后,复制两 .mb 文件至 /usr/share/fcitx/data/ 或 /usr/share/fcitx/pinyin/ 覆盖原文件,或置于 ~/.config/fcitx/ 或 ~/.config/fcitx/pinyin/ 之中。
1.png
词库清单:
[text]fcitx 原配基础词库
白居易诗集【官方推荐】.scel.org
测绘词汇大全【官方推荐】.scel.org
成语俗语【官方推荐】.scel.org
初中必背古诗词曲大全(课标人教版).scel.org
党建理论词汇.scel.org
道教词汇大全【官方推荐】.scel.org
地理地质词汇大全【官方推荐】.scel.org
电力词汇大全【官方推荐】.scel.org
电子词汇大全【官方推荐】.scel.org
动物词汇大全【官方推荐】.scel.org
杜甫诗集【官方推荐】.scel.org
法律词汇大全【官方推荐】.scel.org
佛教词汇大全【官方推荐】.scel.org
古诗词名句【官方推荐】.scel.org
化学化工词汇大全【官方推荐】.scel.org
机械词汇大全【官方推荐】.scel.org
计算机词汇大全【官方推荐】.scel.org
教育部发布2007年新词语.scel.org
军事词汇大全【官方推荐】.scel.org
李白诗集【官方推荐】.scel.org
李清照词全集.scel.org
论语大全【官方推荐】.scel.org
毛泽东诗词精选【官方推荐】.scel.org
纳兰词.scel.org
南唐后主李煜的词.scel.org
农业词汇大全【官方推荐】.scel.org
气象词汇大全【官方推荐】.scel.org
生物词汇大全【官方推荐】.scel.org
诗词文言词库(精华版).scel.org
《诗经》篇名与诗句.scel.org
书法词汇大全【官方推荐】.scel.org
数学词汇大全【官方推荐】.scel.org
宋词精选【官方推荐】.scel.org
苏东坡诗词大全【官方推荐】.scel.org
太极拳【官方推荐】.scel.org
唐诗300首【官方推荐】.scel.org
天文词汇大全【官方推荐】.scel.org
王安石诗集【官方推荐】.scel.org
我国古代地名集锦(1264条).scel.org
武术【官方推荐】.scel.org
物理词汇大全【官方推荐】.scel.org
歇后语集锦【官方推荐】.scel.org
心理学词汇大全【官方推荐】.scel.org
辛弃疾词.scel.org
医疗器械大全【官方推荐】.scel.org
医学词汇大全【官方推荐】.scel.org
《增广贤文》.scel.org
哲学词汇大全【官方推荐】.scel.org
植物词汇大全【官方推荐】.scel.org
中国历史词汇大全【官方推荐】.scel.org
中外药品名称大全【官方推荐】.scel.org
中医中药大全【官方推荐】.scel.org
庄子全集【官方推荐】.scel.org[/text]

方法步骤流水帐:
[bash]# 下载词库
# http://pinyin.sogou.com/dict/

# 转为 org 格式
mkdir org
find . -name '*.scel' -exec scel2org -o org/{}.org {} \;

# 合并众 org 文件
mkdir dict
cd dict
cat ../org/*.scel.org > 1.org

# 准备必要的两个文件
# http://code.google.com/p/fcitx/downloads/list
tar xf fcitx-4.2.4.1_dict.tar.xz fcitx-4.2.4.1/data/{pinyin.tar.gz,gbkpy.org}
tar xf fcitx-4.2.4.1/data/pinyin.tar.gz
mv fcitx-4.2.4.1/data/gbkpy.org ./

# 合并 fcitx 基础词库
cat pyPhrase.org >>1.org

# 排序、去重、生成词库
sort 1.org >2.org
uniq 2.org >3.org
createPYMB gbkpy.org 3.org

# 结果文件
# pyERROR 词库中重复或有其它问题条目,有兴趣可参考,没事直接忽略
# pyPhrase.ok 除错后的无错的 org 格式词库,可取代 3.org 而保留供下次使用
# pyphrase.mb 最终词库,必须,用于覆盖原文件
# pybase.mb 配套的字码库,必须,用于覆盖原文件
[/bash]
上次由 自由建客 在 2012-03-06 13:32,总共编辑 9 次。
头像
npnufn
帖子: 1847
注册时间: 2005-10-14 15:56

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#2

帖子 npnufn » 2012-02-23 12:42

记号备用。
现在主要靠云输入,太强了
头像
phoenixlzx
帖子: 2245
注册时间: 2009-07-29 20:11
系统: Arch Linux
来自: Gensokyo
联系:

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#3

帖子 phoenixlzx » 2012-02-23 12:47

怎么用?
头像
自由建客
帖子: 13468
注册时间: 2008-07-30 23:21
系统: Debian stable AMD64

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#4

帖子 自由建客 » 2012-02-23 12:52

phoenixlzx 写了:怎么用?
解压后,复制两 .mb 文件至 /usr/share/fcitx/data,覆盖原文件即可。
头像
phoenixlzx
帖子: 2245
注册时间: 2009-07-29 20:11
系统: Arch Linux
来自: Gensokyo
联系:

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#5

帖子 phoenixlzx » 2012-02-23 12:53

自由建客 写了:
phoenixlzx 写了:怎么用?
解压后,复制两 .mb 文件至 /usr/share/fcitx/data,覆盖原文件即可。
刚才找到了,Thx~
头像
Eiffi
帖子: 417
注册时间: 2008-09-30 10:57
系统: Win/深度Linux
联系:

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#6

帖子 Eiffi » 2012-02-24 9:17

这是好东西,不过我也现在也是主要靠fcitx的云输入识别,当然也有写不能识别,基本上输入的时候,也不错的。感觉非常好。暂时用不了,虽然我的8G内存只用了不到20%每次,从开机到关机。
头像
lovebluesky
帖子: 487
注册时间: 2010-02-03 17:09

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#7

帖子 lovebluesky » 2012-02-24 9:40

mark
openSUSE+xfce 13年初开始用,可能要成为我用的最久的linux系统了
之所以xfce的官方理由是他轻便简洁
非官方理由是穷,没钱换高配电脑
继续为了买了mac但任性的换装openSUSE而奋斗!
头像
billzt
帖子: 1666
注册时间: 2010-05-23 20:44
系统: Ubuntu
联系:

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#8

帖子 billzt » 2012-02-24 9:46

楼主怎么着也应该给一个词库转换教程啊!
师大生信者:http://bnuzhutao.cn
谢宝良
帖子: 1983
注册时间: 2010-05-01 21:23

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#9

帖子 谢宝良 » 2012-02-24 10:47

在ibus上能用吗?
头像
自由建客
帖子: 13468
注册时间: 2008-07-30 23:21
系统: Debian stable AMD64

Re: 发个「fcitx 搜狗合并词库」(2012-02-23 首发)

#10

帖子 自由建客 » 2012-02-24 15:11

谢宝良 写了:在ibus上能用吗?
未知。估计不能!
头像
qy117121
论坛版主
帖子: 50587
注册时间: 2007-12-14 13:40
系统: Winbuntu
来自: 志虚国乌由市
联系:

Re: fcitx 搜狗合并词库及方法步骤(2012-02-24 更新)

#11

帖子 qy117121 » 2012-02-24 15:13

五笔用户路过
渠月 · QY   
本人只会灌水,不负责回答问题
无聊可以点一下→ http://u.nu/ubuntu

邮箱 [email protected]
谢宝良
帖子: 1983
注册时间: 2010-05-01 21:23

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

#12

帖子 谢宝良 » 2012-02-24 22:19

已经成功安装,但没有感觉到比之前智能多少。可能要使用一段时间才磨合到最佳吧。
头像
自由建客
帖子: 13468
注册时间: 2008-07-30 23:21
系统: Debian stable AMD64

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

#13

帖子 自由建客 » 2012-02-24 22:49

谢宝良, 词库大点而已,输入法算法又没改,你想它智能到哪去啊!
头像
wtry
帖子: 923
注册时间: 2009-03-18 9:26

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

#14

帖子 wtry » 2012-02-25 9:27

我这没有需要覆盖的东西啊!

我的是arch!
头像
自由建客
帖子: 13468
注册时间: 2008-07-30 23:21
系统: Debian stable AMD64

Re: “fcitx-搜狗”合并词库及方法步骤(2012-02-24 更新)

#15

帖子 自由建客 » 2012-02-25 10:00

wtry 写了:我这没有需要覆盖的东西啊!

我的是arch!
“/usr/share/fcitx/pinyin/”
回复