桌面OCR脚本------实现图片文字的拷贝
发表于 : 2008-01-18 21:09
用Evince看文档,并不是所有的文档中的文字都能拷贝出来的。有时候看比较早期的英文文献,是扫描版本,而且没有OCR的,要做个笔记,引用其中的内容还要手动输入。想偷下懒,用OCR软件来识别,直接拷贝。
这个脚本是用 tesseract OCR 来实现识别的。首先用 import (ImageMagick包提供的命令),通过鼠标选取需要识别的英文文字块,得到图片;然后用 tesseract (tesseract-ocr)来识别,得到文本文件;最后调用文本编辑器显示识别的文字,这里用的 gvim,也可以改成自己喜欢的编辑器程序。
要正常使用这个脚本,系统路径中要能找到以下几个程序:
import
tesseract
gvim
自己查找相关的包安装就可以了。这里抓图程序、OCR程序、显示文本程序都可以替换成自己喜欢的。
具体使用,我是在面板上创建了个启动器。要使用的时候,点一下启动器,等3秒(编译切换到需要选取的界面),出现十字鼠标,选取相应的图片文字部分,大概2秒后就有识别的文字在编辑器窗口显示出来了。
注意,临时文件默认存放在
/tmp/OCRs/
下面,如果没有写权限,可以改下路径。
这样的脚本方便阅读的时候记笔记。不过,还不支持中文的OCR识别。
[/code]
这个脚本是用 tesseract OCR 来实现识别的。首先用 import (ImageMagick包提供的命令),通过鼠标选取需要识别的英文文字块,得到图片;然后用 tesseract (tesseract-ocr)来识别,得到文本文件;最后调用文本编辑器显示识别的文字,这里用的 gvim,也可以改成自己喜欢的编辑器程序。
要正常使用这个脚本,系统路径中要能找到以下几个程序:
import
tesseract
gvim
自己查找相关的包安装就可以了。这里抓图程序、OCR程序、显示文本程序都可以替换成自己喜欢的。
具体使用,我是在面板上创建了个启动器。要使用的时候,点一下启动器,等3秒(编译切换到需要选取的界面),出现十字鼠标,选取相应的图片文字部分,大概2秒后就有识别的文字在编辑器窗口显示出来了。
注意,临时文件默认存放在
/tmp/OCRs/
下面,如果没有写权限,可以改下路径。
这样的脚本方便阅读的时候记笔记。不过,还不支持中文的OCR识别。
[/code]