提高pytesseract图片识别的准确度

本文探讨了在使用pytesseract进行代码截图识别时遇到的准确率低的问题。通过图片二值化处理,尤其是针对不同底色调整阈值,能改善识别效果,但过程繁琐。此外,尝试样本训练以丰富tesseract语言库,虽然理论上可以提升识别准确度,但在实际操作中,由于样本多样性和手动调整的复杂性,效率低下。总结指出,对于同学们提交的格式各异的代码截图,采用通用的样本训练可能并非最佳解决方案。


前言

由于pytesseract提取图片的准确度太低,不足以提取代码以进行后续的检查,所以要提高图片识别的准确度。

一、图片二值化处理

对一个图片进行处理,使其更加容易被识别。

处理过程中发现生成的文件很小,没有什么内容,说明识别的过程出了问题。

后来使用cv2.threshold函数处理,可以把一个图片相对清楚地显示出来,但是要使不同的图片显示地更加清晰,要对应不同的阈值;
发现阈值的确定和图片的底色有关系。

对图片进行灰度处理,效果有提升但不明显:
在这里插入图片描述

二、样本训练

即丰富tesseract的语言库,使其更加熟悉我所要提取的内容(代码),进而提高识别的准确度。

需要下载jTessBoxEditor。

使用jTessBoxEditor.exe,选择样本图片,生成tif文件;
用管理员模式打开命令行输入指令:

tesseract.exe a.tif b batch.nochop makebox

a.tif为刚才生成的tif文件,生成文件b.box;
再用jTessBoxEditor.exe打开box文件进行调试:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值