当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 20 篇帖子 ]  前往页数 1, 2  下一页
作者 内容
1 楼 
 文章标题 : 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-12 20:09 

注册: 2006-01-06 22:55
帖子: 558
送出感谢: 0 次
接收感谢: 1
识别范围是3500多常用汉字
http://ubuntuone.com/p/3Yw/


_________________
我的博客


最后由 fuhuizn 编辑于 2010-08-28 9:26,总共编辑了 1 次

页首
 用户资料  
 
2 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-13 10:19 
头像

注册: 2008-02-11 15:46
帖子: 450
送出感谢: 0 次
接收感谢: 0 次
NB! 兄弟辛苦了!可不可以将你的字符图片发给我呢? zhuhongxu@gmail.com
我想自己研究一下。


_________________
Google Talk群组,请来<雨云>一番!
主题:UbuntuLinux编程科幻、民主、科学等。
添加 rain-cloud@appspot.com 为好友(然后say hi,并等待验证)
参见 http://goo.gl/xIpxH

Twitter:http://twitter.com/nixzhu


页首
 用户资料  
 
3 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-13 11:03 
头像

注册: 2008-04-26 12:41
帖子: 11000
送出感谢: 11
接收感谢: 38
:em11


_________________
[新手必读]wubi安装常见问题(FAQ)
[分享]装双系统的同学必看——Windows与Linux系统共享交换分区的方法
kde下唯美的暗黑内透主题(无需编译)
无穷老机上的Trinity Desktop Environment


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-13 11:08 
头像

注册: 2008-11-21 20:26
帖子: 36913
送出感谢: 1
接收感谢: 36
:em11


_________________
讨厌我的人可以试着点一下
浏览全部ubuntu技巧


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-13 12:34 

注册: 2006-01-06 22:55
帖子: 558
送出感谢: 0 次
接收感谢: 1
i_NIX 写道:
NB! 兄弟辛苦了!可不可以将你的字符图片发给我呢? zhuhongxu@gmail.com
我想自己研究一下。


OK


附件:
文件注释: 单色 的
chs.tif
chs.tif [ 659.28 KiB | 被浏览 7915 次 ]



_________________
我的博客
页首
 用户资料  
 
6 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-13 13:38 

注册: 2006-01-06 22:55
帖子: 558
送出感谢: 0 次
接收感谢: 1
新版本包含三种字体:宋体、黑体、楷体

方法是带参数:

tesseract pic.tiff basename -l song | hei | kai

song | hei | kai :表示 song 或 hei 或 kai


从 ubuntuone 下载
http://ubuntuone.com/p/3Yw/


_________________
我的博客


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-25 20:04 

注册: 2010-05-24 9:07
帖子: 2
送出感谢: 0 次
接收感谢: 0 次
楼主您好,我的网络是拨号上网,从ubuntuone 下载不支持断点续传,尝试多次都无法完成下载,有没有别的下载链接呢?或者请楼主或好心人发给我!!

350930085@qq.com



song_chun_hua@yahoo.com.cn


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-25 20:22 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 274
很大的数据包?能从系统字体取数据不,从fc-list取字体名?
:em11


_________________
● 鸣学


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-26 11:23 

注册: 2010-05-24 9:07
帖子: 2
送出感谢: 0 次
接收感谢: 0 次
:em20
真的是下载不了阿,卡


有没有人帮帮忙阿


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-05-26 12:03 
头像

注册: 2008-03-25 15:49
帖子: 25877
地址: 谁知道?
送出感谢: 8
接收感谢: 10
:em11


页首
 用户资料  
 
11 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-06-16 21:44 
头像

注册: 2008-01-23 14:02
帖子: 884
地址: 吉林大学
送出感谢: 0 次
接收感谢: 0 次
给教育网的同学做了一个国内的网盘镜像下载点。

中文包下载 http://u.115.com/file/f1c2d9fe1d


_________________
立柱博客:书写生活,记录时间-哲学|互联网|文艺|英语


页首
 用户资料  
 
12 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-08-27 15:23 

注册: 2010-08-27 15:13
帖子: 1
送出感谢: 0 次
接收感谢: 0 次
:em01 可以把BOX文件发过来看一下么,我的邮箱是zhaoliang7810124@163.com.辛苦了兄弟


页首
 用户资料  
 
13 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2010-12-02 10:18 

注册: 2010-12-02 10:11
帖子: 1
送出感谢: 0 次
接收感谢: 0 次
图片下载不了
楼主能发一张我吗?

bsdpz1@sohu.com


页首
 用户资料  
 
14 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2012-04-09 12:10 

注册: 2012-04-09 12:04
帖子: 1
送出感谢: 0 次
接收感谢: 0 次
楼主啊,大牛啊。希望你能给我帮组。公司正在喊我做中文数据训练。我现在遇到了问题。希望楼主能给我联系。QQ:33948107 email:33948107@qq.com 感谢楼主了。


页首
 用户资料  
 
15 楼 
 文章标题 : Re: 闲着没事做了个tesseract-ocr简体中文识别数据包
帖子发表于 : 2012-04-09 18:10 

注册: 2006-01-06 22:55
帖子: 558
送出感谢: 0 次
接收感谢: 1
网上这类资料很多,个人经验关键是:
1、要自己编个根据中文文本文件生成单色图片的程序,要可以随意调节字体大小和上下左右距离
2、要修正自动生成的BOX文件,因为tesseract-ocr会吧某些中文字拆开,也可以编个小程序自动修正

我的程序很久之前就都已经删除了,不好意思。


_________________
我的博客


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 20 篇帖子 ]  前往页数 1, 2  下一页

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 4 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译