[分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

系统字体配置、中文显示和输入法问题
linyuanjie
帖子: 16
注册时间: 2009-03-13 16:52

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#16

帖子 linyuanjie » 2009-05-28 23:49

不错,马上试试!
fracting
帖子: 278
注册时间: 2009-02-26 1:30

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#17

帖子 fracting » 2009-05-31 1:31

shellex 写了:

代码: 全选

Traceback (most recent call last):
  File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module>
    cur_in.execute('select * from py_phrase where phrase=?',[phrase])
sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
出错鸟~囧
我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?
Wine的使用中的一些常见误区:
viewtopic.php?f=121&t=363147

分享Wine调试经验 -- 第二季: Wine Dr.com 中文乱码
viewtopic.php?f=121&t=385111

做一名开源社区的扫地僧(上)
viewtopic.php?f=80&t=389615
头像
牙签儿
帖子: 509
注册时间: 2007-06-30 0:27

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#18

帖子 牙签儿 » 2009-05-31 11:31

mark! :em11
反对台独,反对藏独,反对孤独!
apt-get不是万能的:

代码: 全选

sudo apt-get install girlfriend
正在读取软件包列表... 完成
正在分析软件包的依赖关系树... 完成
有一些软件包无法被安装。
下列的信息可能会对解决问题有所帮助:
下列的软件包有不能满足的依赖关系:
girlfiend: 依赖: hourse但是它将不会被安装
girlfiend: 依赖: car但是它将不会被安装
house,car: 依赖: money但是它将不会被安装
E: 无法安装的软件包
lanceu
帖子: 28
注册时间: 2009-02-17 21:13

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#19

帖子 lanceu » 2009-05-31 22:57

fracting 写了:
shellex 写了:

代码: 全选

Traceback (most recent call last):
  File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module>
    cur_in.execute('select * from py_phrase where phrase=?',[phrase])
sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
出错鸟~囧
我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?

我也遇到了这个错误。楼主解释下原因。
头像
qdxuxiao
帖子: 50
注册时间: 2007-11-22 23:05
来自: 青岛

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#20

帖子 qdxuxiao » 2009-07-08 11:29

File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module>
cur_in.execute('select * from py_phrase where phrase=?',[phrase])
sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
出错鸟~囧
我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?
我也遇到了这个错误。楼主解释下原因

可能需要添加下面两行:
db_in.text_factory = str
db_out.text_factory = str

如下所示:

代码: 全选

db_in=sqlite.connect('/usr/share/ibus-pinyin/engine/py.db')
db_in.text_factory = str
cur_in=db_in.cursor()

homedir=os.environ['HOME']
dbname=homedir+'/.ibus/pinyin/user.db'
# dbname='/home/fracting/.ibus/pinyin/user.db'# for test
db_out=sqlite.connect(dbname)
db_out.text_factory = str
cur_out=db_out.cursor()
还可能需要安装以下软件包:
sudo apt-get install python-sql python-sqllite python-sqlalchemy python-sqlobject
上次由 qdxuxiao 在 2009-08-06 12:16,总共编辑 1 次。
头像
傻傻啲
帖子: 26
注册时间: 2007-11-30 16:26
来自: 地球

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#21

帖子 傻傻啲 » 2009-08-05 14:52

:em11 :em11 太感谢楼主和qdxuxiao了
我终于可以导入词库没有的字了,原来只是用sql的insert就行了
(qdxuxiao例举的软件包中找不到python-sql, 而且python-sqllite打多了一个l应该是python-sqlite)
头像
nick198119
帖子: 215
注册时间: 2008-08-23 15:00

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#22

帖子 nick198119 » 2009-08-31 13:41

不知道为什么,我使用Ibus输入法时,自定义的词在重启输入法以后又消失了(当然重启系统也是这样),根本无法记忆。在家目录.ibus/pinyin中,发现输入新词时user.db没有任何变化,仅仅产生一个user.db-journal的文件,但重启输入法(或重启系统)可以发现user.db-journal被自动删除,在输入用户新词时重建。但不管怎样user.db都没有任何变化,输入法也无法记忆前次输入法记录的任何用户词汇。
谁知道这是为什么?
xpx10764
帖子: 6
注册时间: 2009-02-25 9:28

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#23

帖子 xpx10764 » 2009-09-10 16:03

感觉效率狠有问题的呀
头像
eagle5678
帖子: 1865
注册时间: 2006-07-08 14:07

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#24

帖子 eagle5678 » 2009-09-19 15:54

davio3g 写了:本人用万能五笔,爽得妙不可言。安装详见:
http://www.a0602.com/thread-101-1-1.html
:em11
??
头像
eagle5678
帖子: 1865
注册时间: 2006-07-08 14:07

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#25

帖子 eagle5678 » 2009-09-19 17:30

能转万能五笔吗
songah891
帖子: 49
注册时间: 2009-10-07 11:11

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#26

帖子 songah891 » 2009-11-04 18:16

好东西,分享一下
头像
hcym
帖子: 15634
注册时间: 2007-05-06 2:46

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#27

帖子 hcym » 2009-12-04 17:57

收藏主题
枫行天下
帖子: 2
注册时间: 2010-01-03 15:25

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#28

帖子 枫行天下 » 2010-02-22 20:24

提出几点改进意见哈

1.搜狗的导出词库似乎不太一样,希望可以修改下支持它

2.程序似乎效率太低了,原因有二,第一是从系统词库里面检索耗时非常厉害,每条几乎都要1秒左右,对于词库超过数万的用户来说导入简直是该噩梦,所以可以先吧系统词库复制出来为phrase字段建立索引,这样可以大大提高速度;第二就是向词库插入记录耗时严重,这个问题可以通过启用sqlite的事务来解决。根据试验,开启事务后导入11万条耗时仅2分钟左右

我不懂py,就用php写了个,以脚本形式运行即可,也发出来给大家瞧瞧,运行 php ./import.php 即可,记得要修改里面的输入输出文件才行的
import.tar.gz
(3.09 KiB) 已下载 58 次
头像
hubert_star
论坛版主
帖子: 5373
注册时间: 2007-10-29 22:12
系统: OSX 10.9 + Ub 1304
来自: 江苏南京

Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus

#30

帖子 hubert_star » 2010-02-24 23:20

楼主的脚本

提几个意见

1 多音字的处理
2 没做索引,所以效率慢
3 词频
4 批次提交

txt文件,除了形码输入有价值外,对于拼音没有任何价值

还是要分析scel文件,分析方法很简单,论坛有讨论的

还有,词库存在user.db里面,有问题的
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒  故我有罪!

我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;

特此声明!

有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。

欢迎来我的新浪微博@me
回复