可以用工具,需要下载安装tesseract-ocr,地址:https://github.com/tesseract-ocr/tesseract/wiki,找对应版本,还可以从上面找到各种.traineddata,放入tessdata文件夹。设置好环境变量,要新建TESSDATA_PREFIX,值为:D:\Program Files (x86)\Tesseract-OCR,路径是tessdata文件夹的上一层目录。

还要在pytesseract.py(文件地址如:D:\ProgramData\Anaconda3\Lib\site-packages\pytesseract)找到tesseract_cmd设置好路径。如:tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'。
参考:http://www.cnblogs.com/zhongtang/p/5554784.html
代码很简单:
from PIL import Image
import pytesseract

本文介绍了如何在Python3中调用OCR识别,包括安装tesseract-ocr,配置环境变量,以及通过pytesseract库进行OCR操作。虽然tesseract的识别率有待提高,但可以考虑使用腾讯AI开放平台的通用OCR服务,它提供了高效且免费的识别方案。

2142

被折叠的 条评论
为什么被折叠?



