一直以来,图片识别对我来说是很高深的东西,一直未曾涉猎,有幸在Python是了解到TesseractOCR,终于有个系统的了解,这个能做什么,那就太多了,验证码识别、车牌识别、证件识别等等。
目录
软件的特点
一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
软件的安装
源码地址为:https://github.com/tesseract-ocr/tesseract
EXE可执行文件下载地址(4.0.0):TesseractOCRV4.0.0图片识别-Python工具类资源-CSDN下载
EXE安装步骤及注意:(下载后默认双击安装)

上方可以选择其他语言,支持几十种语言,我选择的是第一个和中文简体及繁体,默认英文是自动安装的。

由于选择了其他语言,所以会多出这个下载,你也可以不选,但选择的话需要联网下载(中文简体:>40M,繁体:>50M)。
命令行测试
别人的文章说安装完会自动加入环境变量,我安装后并未加入,直接切换到安装目录(建议手动加入到环境变量),直接执行:tesseract,显示下图表示安装完成:

准备一张图片如:test.png (如下图),我设置了环境变量,并将这个图片放到D盘根目录。

![]()
打开D盘生成的output_1.txt发现:162408
遗憾,我上图用的是另一博客的图,他是3.x版本,6识别成了5,4.0我也安装了math包直接就识别出来了。
强大在于可以学习
学习工具jTessBoxEditor
配套训练工具 jTessBoxEditor 来训练样本,特别用于验证码的识别。
Tesseract训练
训练的思路是:1、安装jTessBoxEditor > 2、获取样本文件 > 3、Merge合并样本文件 > 4、生成Box文件 > 5、定义字符配置文件 > 6、字符矫正 > 7、执行批处理文件 > 8、将生成的trainegddata放入tessdata中。
总结:根据范本生成一个语言包,转换时可指定这个语言包即可。
理工男(作者)自己的公众号:
一个理工男的成长之路,如果你是理工男,带你“不正经”;如果你想了解理工男,带你认识理工男,他们是生活百事通,他们的生活简约而不简单。
不正经的原则:合规合法,信息保真能看懂,字越少事越大,学到真东西享受真实惠,有兴趣加入我一起“不正经”。


本文介绍了TesseractOCR,一个由HP实验室开发并由Google维护的开源OCR引擎,可用于验证码、车牌和证件识别等。文章详细阐述了软件特点、安装步骤、命令行测试以及如何通过jTessBoxEditor进行训练,提升图像转文本能力。

1万+

被折叠的 条评论
为什么被折叠?



