当前时区为 UTC + 8 小时



发表新帖 回复这个主题  [ 11 篇帖子 ] 
作者 内容
1 楼 
 文章标题 : 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2008-01-18 21:09 

注册: 2007-01-21 14:04
帖子: 157
送出感谢: 1
接收感谢: 0 次
用Evince看文档,并不是所有的文档中的文字都能拷贝出来的。有时候看比较早期的英文文献,是扫描版本,而且没有OCR的,要做个笔记,引用其中的内容还要手动输入。想偷下懒,用OCR软件来识别,直接拷贝。

这个脚本是用 tesseract OCR 来实现识别的。首先用 import (ImageMagick包提供的命令),通过鼠标选取需要识别的英文文字块,得到图片;然后用 tesseract (tesseract-ocr)来识别,得到文本文件;最后调用文本编辑器显示识别的文字,这里用的 gvim,也可以改成自己喜欢的编辑器程序。

要正常使用这个脚本,系统路径中要能找到以下几个程序:
import
tesseract
gvim
自己查找相关的包安装就可以了。这里抓图程序、OCR程序、显示文本程序都可以替换成自己喜欢的。

具体使用,我是在面板上创建了个启动器。要使用的时候,点一下启动器,等3秒(编译切换到需要选取的界面),出现十字鼠标,选取相应的图片文字部分,大概2秒后就有识别的文字在编辑器窗口显示出来了。

注意,临时文件默认存放在
/tmp/OCRs/
下面,如果没有写权限,可以改下路径。

这样的脚本方便阅读的时候记笔记。不过,还不支持中文的OCR识别。
[/code]


附件:
desktopocr.sh.tar [10 KiB]
被下载 155 次
页首
 用户资料  
 
2 楼 
 文章标题 :
帖子发表于 : 2008-01-18 21:22 
头像

注册: 2007-11-19 21:51
帖子: 6956
地址: 成都
送出感谢: 0 次
接收感谢: 4
顶!!!如果有能识别中文的版本就完美了


_________________
Joolix live OS: http://joolix.com
代码:
dpkg -l|awk '/^rc/{print $2}'|sudo xargs dpkg -P


页首
 用户资料  
 
3 楼 
 文章标题 :
帖子发表于 : 2008-01-18 21:58 
头像

注册: 2006-07-08 14:07
帖子: 1774
送出感谢: 14
接收感谢: 1
中文的才是正道。


页首
 用户资料  
 
4 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2008-11-15 9:01 

注册: 2008-06-09 10:12
帖子: 24
送出感谢: 0 次
接收感谢: 0 次
急切需要一个能在ubuntu下识别中文的识别软件,期待中。。。


页首
 用户资料  
 
5 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2008-11-15 10:31 
头像

注册: 2005-10-01 21:38
帖子: 964
地址: 湖南邵东流光岭
送出感谢: 0 次
接收感谢: 0 次
不支持中文的有什么用?我还老看外国扫描版本不成?


_________________
小江恩的博客
http://gann.blog.ifeng.com/


页首
 用户资料  
 
6 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2008-11-15 19:24 

注册: 2008-07-19 12:44
帖子: 50
送出感谢: 0 次
接收感谢: 0 次
识别中文,现在可以这样。
OCR识别是将图片中的文字转化为可以编辑的文本,在写书时很有用。
LINUX下的英文OCR识别软件已经很好用了,但是中文OCR尚不成熟,现在提供一种在龙芯下OCR中文的解决办法——利用网络OCR识别。
1、登录网站http://www.netocr.com
2、注册用户
3、上传图片
4、得到识别结果
图像一般由扫描得到,扫描分辨率越高,识别效果越好,但图像也就越大,上传较慢。尽量存成tif格式,图像较小。 另外也支持bmp, jpg格式。其他格式暂不支持。


_________________
福珑使用备忘http://blog.163.com/pingyuanv@126/


页首
 用户资料  
 
7 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2009-08-07 2:26 
头像

注册: 2007-07-16 19:43
帖子: 1362
地址: tangshan
送出感谢: 0 次
接收感谢: 0 次
wine 个尚书七号?


页首
 用户资料  
 
8 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2009-08-07 5:25 
头像

注册: 2006-02-28 3:11
帖子: 2470
送出感谢: 0 次
接收感谢: 0 次
yinliang108 写道:
不支持中文的有什么用?我还老看外国扫描版本不成?



_________________
一梦三年,
松风依旧,
萝月何曾老.


灵幽听微, 谁观玉颜?
灼灼春华, 绿叶含丹.


页首
 用户资料  
 
9 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2009-08-07 8:53 
头像

注册: 2005-08-14 21:55
帖子: 58428
地址: 长沙
送出感谢: 4
接收感谢: 272
很早就试过。中文的,都做梦去。


_________________
● 鸣学


页首
 用户资料  
 
10 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2009-08-07 13:49 
头像

注册: 2008-09-05 23:31
帖子: 1363
系统: LinuxMint17
送出感谢: 35
接收感谢: 11
中文抄英文,好好学英文。


_________________
茕茕
问题大海之一粟:http://forum.ubuntu.org.cn/viewtopic.php?f=74&t=212497
NEMO-Actions使用方法:http://forum.ubuntu.org.cn/viewtopic.php?f=175&t=456548
在线编码转换:http://2cyr.com/decode/?lang=en


页首
 用户资料  
 
11 楼 
 文章标题 : Re: 桌面OCR脚本------实现图片文字的拷贝
帖子发表于 : 2009-08-08 14:14 

注册: 2008-09-25 19:58
帖子: 294
送出感谢: 0 次
接收感谢: 1
可以wine尚书7号,wine汉王也可以,其他的ocr我就没试过了


页首
 用户资料  
 
显示帖子 :  排序  
发表新帖 回复这个主题  [ 11 篇帖子 ] 

当前时区为 UTC + 8 小时


在线用户

正在浏览此版面的用户:没有注册用户 和 3 位游客


不能 在这个版面发表主题
不能 在这个版面回复主题
不能 在这个版面编辑帖子
不能 在这个版面删除帖子
不能 在这个版面提交附件

前往 :  
本站点为公益性站点,用于推广开源自由软件,由 DiaHosting VPSBudgetVM VPS 提供服务。
我们认为:软件应可免费取得,软件工具在各种语言环境下皆可使用,且不会有任何功能上的差异;
人们应有定制和修改软件的自由,且方式不受限制,只要他们自认为合适。

Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
简体中文语系由 王笑宇 翻译