【Python】从零配置图片的OCR识别

最新推荐文章于 2026-03-14 01:16:22 发布

原创最新推荐文章于 2026-03-14 01:16:22 发布 · 834 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#python #ocr #开发语言 #笔记

3 篇文章

订阅专栏

3 篇文章

订阅专栏

为了提取一本俄文书扫描件的文字内容，在新电脑上从零开始配置基于Python的OCR识别过程。
特此记录。

软件情况

系统为win11
Python为3.12.x
Anaconda为2.6.x
图片处理包：pillow
OCR包：tesseract、pytesseract

直接下载最新版anaconda：https://www.anaconda.com/download。

python为最新版anaconda自带的版本。

安装时注意勾选需要的语言包！！！

Anaconda没有提供Pytesseract的包，需要单独下载。
Pytesseract地址：https://pypi.org/project/pytesseract/#files
我采用的是whl包安装，在Anaconda Prompt里运行安装，

cd whl文件的路径（C:\...）
pip install 文件名.whl

最新版anaconda自带pillow包，没有单独安装。

需要配置两个环境变量

Path：
Path变量增加tesseract的安装路径
TESSDATA_PREFIX：
添加TESSDATA_PREFIX变量

非常重要，不修改会报错！！！

在pytesseract.py文件中查找变量 tesseract_cmd，修改赋值。

pytesseract.py的位置在anaconda安装位置下的lib文件夹中：
路径：…\Lib\site-packages\pytesseract\pytesseract.py

赋值内容为tesseract安装位置下的tesseract.exe可执行文件：

tesseract_cmd = r'C:\software\OCR\TesseractOCR\tesseract.exe'

import pytesseract
from PIL import Image
img=Image.open('路径'+'\\'+'文件名.jpg')
text=pytesseract.image_to_string(img)
print(text)