图片识别 - TesseractOCR

原创已于 2022-04-11 00:01:31 修改 · 1k 阅读

·

1

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#图片识别 #jTessBoxEditor #TesseractOCR #OCR

于 2018-10-08 23:29:54 首次发布

python之道同时被 2 个专栏收录

10 篇文章

订阅专栏

8 篇文章

订阅专栏

本文介绍了TesseractOCR，一个由HP实验室开发并由Google维护的开源OCR引擎，可用于验证码、车牌和证件识别等。文章详细阐述了软件特点、安装步骤、命令行测试以及如何通过jTessBoxEditor进行训练，提升图像转文本能力。

一直以来，图片识别对我来说是很高深的东西，一直未曾涉猎，有幸在Python是了解到TesseractOCR，终于有个系统的了解，这个能做什么，那就太多了，验证码识别、车牌识别、证件识别等等。

目录

软件的特点

软件的安装

命令行测试

强大在于可以学习

学习工具jTessBoxEditor

Tesseract训练

软件的特点

一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎，与Microsoft Office Document Imaging（MODI）相比，我们可以不断的训练的库，使图像转换文本的能力不断增强；如果团队深度需要，还可以以它为模板，开发出符合自身需求的OCR引擎。

软件的安装

源码地址为：https://github.com/tesseract-ocr/tesseract

EXE可执行文件下载地址（4.0.0）：TesseractOCRV4.0.0图片识别-Python工具类资源-CSDN下载

EXE安装步骤及注意：（下载后默认双击安装）

上方可以选择其他语言，支持几十种语言，我选择的是第一个和中文简体及繁体，默认英文是自动安装的。

由于选择了其他语言，所以会多出这个下载，你也可以不选，但选择的话需要联网下载（中文简体：>40M，繁体：>50M)。

命令行测试

别人的文章说安装完会自动加入环境变量，我安装后并未加入，直接切换到安装目录（建议手动加入到环境变量），直接执行：tesseract，显示下图表示安装完成：

准备一张图片如：test.png （如下图），我设置了环境变量，并将这个图片放到D盘根目录。

打开D盘生成的output_1.txt发现：162408

遗憾，我上图用的是另一博客的图，他是3.x版本，6识别成了5，4.0我也安装了math包直接就识别出来了。

强大在于可以学习

学习工具jTessBoxEditor

配套训练工具 jTessBoxEditor 来训练样本，特别用于验证码的识别。

Tesseract训练

训练的思路是：1、安装jTessBoxEditor > 2、获取样本文件 > 3、Merge合并样本文件 > 4、生成Box文件 > 5、定义字符配置文件 > 6、字符矫正 > 7、执行批处理文件 > 8、将生成的trainegddata放入tessdata中。

总结：根据范本生成一个语言包，转换时可指定这个语言包即可。

理工男（作者）自己的公众号：

一个理工男的成长之路，如果你是理工男，带你“不正经”；如果你想了解理工男，带你认识理工男，他们是生活百事通，他们的生活简约而不简单。

不正经的原则：合规合法，信息保真能看懂，字越少事越大，学到真东西享受真实惠，有兴趣加入我一起“不正经”。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。