图片识别 - TesseractOCR

本文介绍了TesseractOCR,一个由HP实验室开发并由Google维护的开源OCR引擎,可用于验证码、车牌和证件识别等。文章详细阐述了软件特点、安装步骤、命令行测试以及如何通过jTessBoxEditor进行训练,提升图像转文本能力。

      一直以来,图片识别对我来说是很高深的东西,一直未曾涉猎,有幸在Python是了解到TesseractOCR,终于有个系统的了解,这个能做什么,那就太多了,验证码识别、车牌识别、证件识别等等。

目录

软件的特点

软件的安装

命令行测试

强大在于可以学习

       学习工具jTessBoxEditor

      Tesseract训练


软件的特点

       一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。

软件的安装

      源码地址为:https://github.com/tesseract-ocr/tesseract

      EXE可执行文件下载地址(4.0.0):TesseractOCRV4.0.0图片识别-Python工具类资源-CSDN下载

      EXE安装步骤及注意:(下载后默认双击安装)

         

           上方可以选择其他语言,支持几十种语言,我选择的是第一个和中文简体及繁体,默认英文是自动安装的。

           

             由于选择了其他语言,所以会多出这个下载,你也可以不选,但选择的话需要联网下载(中文简体:>40M,繁体:>50M)。

命令行测试

       别人的文章说安装完会自动加入环境变量,我安装后并未加入,直接切换到安装目录(建议手动加入到环境变量),直接执行:tesseract,显示下图表示安装完成:

         

    准备一张图片如:test.png (如下图),我设置了环境变量,并将这个图片放到D盘根目录。

      

       打开D盘生成的output_1.txt发现:162408

遗憾,我上图用的是另一博客的图,他是3.x版本,6识别成了5,4.0我也安装了math包直接就识别出来了。

强大在于可以学习

       学习工具jTessBoxEditor

             配套训练工具 jTessBoxEditor 来训练样本,特别用于验证码的识别。

      Tesseract训练

                训练的思路是:1、安装jTessBoxEditor > 2、获取样本文件 > 3、Merge合并样本文件 > 4、生成Box文件 > 5、定义字符配置文件 > 6、字符矫正 > 7、执行批处理文件 > 8、将生成的trainegddata放入tessdata中。

                总结:根据范本生成一个语言包,转换时可指定这个语言包即可。

 理工男(作者)自己的公众号:

        一个理工男的成长之路,如果你是理工男,带你“不正经”;如果你想了解理工男,带你认识理工男,他们是生活百事通,他们的生活简约而不简单。

不正经的原则:合规合法,信息保真能看懂,字越少事越大,学到真东西享受真实惠,有兴趣加入我一起“不正经”。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值