python3调用OCR识别

最新推荐文章于 2026-05-18 12:38:06 发布

原创

最新推荐文章于 2026-05-18 12:38:06 发布 · 9.1k 阅读

·

1

·

标签

#python #OCR识别

本文介绍了如何在Python3中调用OCR识别，包括安装tesseract-ocr，配置环境变量，以及通过pytesseract库进行OCR操作。虽然tesseract的识别率有待提高，但可以考虑使用腾讯AI开放平台的通用OCR服务，它提供了高效且免费的识别方案。

可以用工具，需要下载安装tesseract-ocr，地址：https://github.com/tesseract-ocr/tesseract/wiki，找对应版本，还可以从上面找到各种.traineddata，放入tessdata文件夹。设置好环境变量，要新建TESSDATA_PREFIX，值为：D:\Program Files (x86)\Tesseract-OCR，路径是tessdata文件夹的上一层目录。

还要在pytesseract.py（文件地址如：D:\ProgramData\Anaconda3\Lib\site-packages\pytesseract）找到tesseract_cmd设置好路径。如：tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'。

参考：http://www.cnblogs.com/zhongtang/p/5554784.html

代码很简单：

from PIL import Image
import pytesseract

最低0.47元/天解锁文章

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。