有没有什么办法让tesseract ocr 识别中英文混合的图像中的文本??
目前只能单独识别中文或者英文。。
闲着没事做了个tesseract-ocr简体中文识别数据包
-
- 帖子: 1
- 注册时间: 2012-05-24 14:58
-
- 帖子: 305
- 注册时间: 2006-12-06 11:52
- 联系:
Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
能否弄成从系统字体文件夹中获取字体?我将win的字体全部安装到ubuntu下了。能说明具体怎么安装tesseract-ocr简体中文识别数据包吗?我只是会用ubuntu做事情,复杂的我就不会了。
- hairui
- 帖子: 27
- 注册时间: 2007-10-08 20:22
Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
从文章发表时间看,这个数据包是给tessseract-ocr的2.0版本用的。
大家可以参考 http://code.google.com/p/tesseract-ocr/ ... Tesseract2
大家可以参考 http://code.google.com/p/tesseract-ocr/ ... Tesseract2
-
- 帖子: 1
- 注册时间: 2013-07-18 13:51
Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
虽然很久了,不过可否再发字符图片过来呢,是否还有保存,上传的字典在3.02版本下不能使用,谢谢兄弟了