[分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
-
- 帖子: 16
- 注册时间: 2009-03-13 16:52
-
- 帖子: 278
- 注册时间: 2009-02-26 1:30
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?shellex 写了:出错鸟~囧代码: 全选
Traceback (most recent call last): File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module> cur_in.execute('select * from py_phrase where phrase=?',[phrase]) sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?
Wine的使用中的一些常见误区:
viewtopic.php?f=121&t=363147
分享Wine调试经验 -- 第二季: Wine Dr.com 中文乱码
viewtopic.php?f=121&t=385111
做一名开源社区的扫地僧(上)
viewtopic.php?f=80&t=389615
viewtopic.php?f=121&t=363147
分享Wine调试经验 -- 第二季: Wine Dr.com 中文乱码
viewtopic.php?f=121&t=385111
做一名开源社区的扫地僧(上)
viewtopic.php?f=80&t=389615
- 牙签儿
- 帖子: 509
- 注册时间: 2007-06-30 0:27
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
mark!
反对台独,反对藏独,反对孤独!
apt-get不是万能的:
apt-get不是万能的:
代码: 全选
sudo apt-get install girlfriend
正在读取软件包列表... 完成
正在分析软件包的依赖关系树... 完成
有一些软件包无法被安装。
下列的信息可能会对解决问题有所帮助:
下列的软件包有不能满足的依赖关系:
girlfiend: 依赖: hourse但是它将不会被安装
girlfiend: 依赖: car但是它将不会被安装
house,car: 依赖: money但是它将不会被安装
E: 无法安装的软件包
-
- 帖子: 28
- 注册时间: 2009-02-17 21:13
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
fracting 写了:我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?shellex 写了:出错鸟~囧代码: 全选
Traceback (most recent call last): File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module> cur_in.execute('select * from py_phrase where phrase=?',[phrase]) sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?
我也遇到了这个错误。楼主解释下原因。
- qdxuxiao
- 帖子: 50
- 注册时间: 2007-11-22 23:05
- 来自: 青岛
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
File "/home/shellex/scripts/sougou2ibus.py", line 44, in <module>
cur_in.execute('select * from py_phrase where phrase=?',[phrase])
sqlite3.ProgrammingError: You must not use 8-bit bytestrings unless you use a text_factory that can interpret 8-bit bytestrings (like text_factory = str). It is highly recommended that you instead just switch your application to Unicode strings.
出错鸟~囧
我也遇到同样的问题了.不知道是发行版升级的原因还是ibus升级的原因?我用的是ubuntu 9.04 , shellex用的是哪个发行版?
还有谁遇到相同的错误吗?分别是什么发行版?ibus什么版本?
我也遇到了这个错误。楼主解释下原因
可能需要添加下面两行:
db_in.text_factory = str
db_out.text_factory = str
如下所示:
代码: 全选
db_in=sqlite.connect('/usr/share/ibus-pinyin/engine/py.db')
db_in.text_factory = str
cur_in=db_in.cursor()
homedir=os.environ['HOME']
dbname=homedir+'/.ibus/pinyin/user.db'
# dbname='/home/fracting/.ibus/pinyin/user.db'# for test
db_out=sqlite.connect(dbname)
db_out.text_factory = str
cur_out=db_out.cursor()
sudo apt-get install python-sql python-sqllite python-sqlalchemy python-sqlobject
上次由 qdxuxiao 在 2009-08-06 12:16,总共编辑 1 次。
- 傻傻啲
- 帖子: 26
- 注册时间: 2007-11-30 16:26
- 来自: 地球
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
太感谢楼主和qdxuxiao了
我终于可以导入词库没有的字了,原来只是用sql的insert就行了
(qdxuxiao例举的软件包中找不到python-sql, 而且python-sqllite打多了一个l应该是python-sqlite)
我终于可以导入词库没有的字了,原来只是用sql的insert就行了
(qdxuxiao例举的软件包中找不到python-sql, 而且python-sqllite打多了一个l应该是python-sqlite)
- nick198119
- 帖子: 215
- 注册时间: 2008-08-23 15:00
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
不知道为什么,我使用Ibus输入法时,自定义的词在重启输入法以后又消失了(当然重启系统也是这样),根本无法记忆。在家目录.ibus/pinyin中,发现输入新词时user.db没有任何变化,仅仅产生一个user.db-journal的文件,但重启输入法(或重启系统)可以发现user.db-journal被自动删除,在输入用户新词时重建。但不管怎样user.db都没有任何变化,输入法也无法记忆前次输入法记录的任何用户词汇。
谁知道这是为什么?
谁知道这是为什么?
-
- 帖子: 6
- 注册时间: 2009-02-25 9:28
- eagle5678
- 帖子: 1865
- 注册时间: 2006-07-08 14:07
- eagle5678
- 帖子: 1865
- 注册时间: 2006-07-08 14:07
-
- 帖子: 49
- 注册时间: 2009-10-07 11:11
- hcym
- 帖子: 15634
- 注册时间: 2007-05-06 2:46
-
- 帖子: 2
- 注册时间: 2010-01-03 15:25
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
提出几点改进意见哈
1.搜狗的导出词库似乎不太一样,希望可以修改下支持它
2.程序似乎效率太低了,原因有二,第一是从系统词库里面检索耗时非常厉害,每条几乎都要1秒左右,对于词库超过数万的用户来说导入简直是该噩梦,所以可以先吧系统词库复制出来为phrase字段建立索引,这样可以大大提高速度;第二就是向词库插入记录耗时严重,这个问题可以通过启用sqlite的事务来解决。根据试验,开启事务后导入11万条耗时仅2分钟左右
我不懂py,就用php写了个,以脚本形式运行即可,也发出来给大家瞧瞧,运行 php ./import.php 即可,记得要修改里面的输入输出文件才行的
1.搜狗的导出词库似乎不太一样,希望可以修改下支持它
2.程序似乎效率太低了,原因有二,第一是从系统词库里面检索耗时非常厉害,每条几乎都要1秒左右,对于词库超过数万的用户来说导入简直是该噩梦,所以可以先吧系统词库复制出来为phrase字段建立索引,这样可以大大提高速度;第二就是向词库插入记录耗时严重,这个问题可以通过启用sqlite的事务来解决。根据试验,开启事务后导入11万条耗时仅2分钟左右
我不懂py,就用php写了个,以脚本形式运行即可,也发出来给大家瞧瞧,运行 php ./import.php 即可,记得要修改里面的输入输出文件才行的
- kunkun0217
- 帖子: 441
- 注册时间: 2007-11-14 17:39
- 联系:
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
支持!!
Twitter@Yunkwan
http://yunkwan.wordpress.com
爱护地球,请尽量避免编译
Linux仿Mac之KDE篇
简单修复Grub2
解决英文环境Opera中文字体问题
解决Linux字体发虚的终极方法(适合用于假如你试过网上的方法都无效)
http://yunkwan.wordpress.com
爱护地球,请尽量避免编译
Linux仿Mac之KDE篇
简单修复Grub2
解决英文环境Opera中文字体问题
解决Linux字体发虚的终极方法(适合用于假如你试过网上的方法都无效)
- hubert_star
- 论坛版主
- 帖子: 5373
- 注册时间: 2007-10-29 22:12
- 系统: OSX 10.9 + Ub 1304
- 来自: 江苏南京
Re: [分享][原创]为ibus输入法导入第三方词库 phrase_converter_for_ibus
楼主的脚本
提几个意见
1 多音字的处理
2 没做索引,所以效率慢
3 词频
4 批次提交
txt文件,除了形码输入有价值外,对于拼音没有任何价值
还是要分析scel文件,分析方法很简单,论坛有讨论的
还有,词库存在user.db里面,有问题的
提几个意见
1 多音字的处理
2 没做索引,所以效率慢
3 词频
4 批次提交
txt文件,除了形码输入有价值外,对于拼音没有任何价值
还是要分析scel文件,分析方法很简单,论坛有讨论的
还有,词库存在user.db里面,有问题的
佛经说,人有八苦: 生、老、病、死、求不得、怨憎、爱别离、五阴盛 故我苦!
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me
圣经说,人有七罪: 饕餮、贪婪、懒惰、淫欲、傲慢、嫉妒和暴怒 故我有罪!
我这篇帖子里面没有任何攻击我们伟大的中华人民共和国政府和任劳任怨的人民公仆(和本论坛高素质的版主)的文字和含义;
特此声明!
有些事,我们明知道是错的,也要去坚持,因为不甘心;有些人,我们明知道是爱的,也要去放弃,因为没结局;有时候,我们明知道没路了,却还在前行,因为习惯了。
欢迎来我的新浪微博@me