目录
一、前言
之前因为拿到了一本纯英文的pdf文档,而且无法划词以及复制任何内容,这对于英文较差的我阅读起来极其不友好,于是产生了想实现一个工具,通过截屏图片+ocr文字识别+翻译功能来加快阅读速度,于是就有了以下的代码。代码本身并不复杂,只是随手写的初版,可优化的点也有很多,欢迎各路大佬的指正。
二、主要功能
1、按下键盘s键,开启截屏翻译功能,按下键盘q键,停止截屏翻译功能
2、点击需要截取的位置的对角线两点,对屏幕上的英文进行截屏
3、识别截屏中的英文
4、将英文段落进行句子划分
5、翻译划分好的句子
6、输出到控制台
三、源码
import pytesseract
from googletrans import Translator
import pyscreenshot as ImageGrab
from pynput import mouse, keyboard
import threading
start_flag = 0
flag = 0
start_x = 0
start_y = 0
end_x = 0
end_y = 0
def translate_picture(img):
text = pytesseract.image_to_string(img)
print(text.replace("\n", " ").split("."))
split_text = text.replace("\n", " ").split(".")

本文介绍了一个使用Python编写的截屏工具,结合OCR识别和谷歌翻译API,帮助阅读英文PDF文档。该工具通过键盘快捷键s启动和q停止截屏翻译,识别屏幕上的英文,进行句子划分并翻译,输出到控制台。主要使用了pytesseract、googletrans、pyscreenshot和pynput库,其中pytesseract用于OCR识别,googletrans负责翻译,pyscreenshot用于截屏,pynput监听键盘鼠标事件。

9969

被折叠的 条评论
为什么被折叠?



