上一期我们通过对实验:银行卡卡号识别 加深了对前面所学openCV图像处理的一些理解
openCV实践项目:银行卡卡号识别_老师我作业忘带了的博客-CSDN博客
本次图片文本检测相对于要容易一些,内容如下:
一、流程说明

把一个这样的图片,通过仿射变换转换成那样的图片。
然后再通过 pytesseract 读取图片内容得到图片中的文本就好了。

所用到的知识同样大部分来源于入门opencv的第三篇文章: 第三篇文章
新增知识:仿射变换、ocr识别,下面代码处会有讲解。
注:本文使用现成图片,轮廓检测较为明显,若是自己拍照,建议让轮廓/边缘清晰一些。
二、tesseract-ocr安装配置
第一步:下载安装
在开始前,我们需要去 下载(连接) 一下tesseract-ocr,建议选择一个稳定点的版本下载。
现在完成之后安装的时候点下一步下一步就行了,记得记一下安装路径,下一步要配置环境变量(不配置也可以)
第二步:环境变量
注:即使不配置环境变量也不影响后面在代码中的操作,即这一步可以跳过。不理解环境变量意义的可以看一下这篇文章: 这篇文章
上一步安装完成后,把路径加进去:

打开cmd,输入tesseract -v 得到版本信息,没报错就说明环境变量配置成功。

进行测试,比如我桌面上有这样一张图片:

在cmd中输入:tesseract 图片路径 输出路径 如:

注:这个路径不用手打,直接把图片拖进去。默认的话路径就是C:\Users\suichu
然后我的桌面上出现了一个叫result.txt的文本文件:

第三步:下载pytesseract
pip install pyte

5510

被折叠的 条评论
为什么被折叠?



