闲着没事做了个tesseract-ocr简体中文识别数据包 - 页 2 - Ubuntu中文论坛

闲着没事做了个tesseract-ocr简体中文识别数据包

19 帖子

arthas_bb: 帖子： 1; 注册时间： 2012-05-24 14:58

Re: 闲着没事做了个tesseract-ocr简体中文识别数据包

引用

帖子由 arthas_bb » 2012-05-24 15:01

有没有什么办法让tesseract ocr 识别中英文混合的图像中的文本？？
目前只能单独识别中文或者英文。。

homtoo: 帖子： 305; 注册时间： 2006-12-06 11:52; 联系：
联系 homtoo

ICQ

Re: 闲着没事做了个tesseract-ocr简体中文识别数据包

引用

帖子由 homtoo » 2012-11-06 12:56

能否弄成从系统字体文件夹中获取字体？我将win的字体全部安装到ubuntu下了。能说明具体怎么安装tesseract-ocr简体中文识别数据包吗？我只是会用ubuntu做事情，复杂的我就不会了。

hairui: 帖子： 27; 注册时间： 2007-10-08 20:22

Re: 闲着没事做了个tesseract-ocr简体中文识别数据包

引用

帖子由 hairui » 2012-12-15 18:30

从文章发表时间看，这个数据包是给tessseract-ocr的2.0版本用的。

大家可以参考 http://code.google.com/p/tesseract-ocr/ ... Tesseract2

lx19880902: 帖子： 1; 注册时间： 2013-07-18 13:51

Re: 闲着没事做了个tesseract-ocr简体中文识别数据包

引用

帖子由 lx19880902 » 2013-07-18 13:53

虽然很久了，不过可否再发字符图片过来呢，是否还有保存，上传的字典在3.02版本下不能使用，谢谢兄弟了

回复

19 帖子

回到 “办公、图像、机械电子设计等”