python PyPDF2处理PDF文件

本文介绍了Python的PyPDF2库,用于处理PDF文件,包括读取内容、加密解密、合并文件、处理页面重叠和添加水印等功能。通过示例代码详细展示了如何使用PyPDF2进行各种操作。

python PyPDF2处理PDF文件

  • 安装PyPDF2
pip install PyPDF2
import PyPDF2

1. 读取PDF中的内容

# author:mlnt
# createdate:2022/8/16
import PyPDF2    # 导入PyPDF2模块

# 官方文档:https://pypi.org/project/PyPDF2/
# 1.打开PDF文件
pdf = open(file='test.pdf', mode='rb')  # 以二进制方式打开

# 2.获取PDF文件的页数
# 打开PDF文件成功后,可使用PdfFileReader()方法读取PDF内容
pdf_reader = PyPDF2.PdfFileReader(pdf)  # 读取PDF内容
print(f'PDF页数为:{
     
     pdf_reader.numPages}')
print(f'PDF页数为:{
     
     len(pdf_reader.pages)}')

# 3.读取PDF页面内容
"""
- 使用PdfFileReader()方法读取PDF文件后,可使用getPage(n)(或pages[n])获取第n页的PDF内容
- PDF页面从第0页开始计算
- 页面内容被读入后,可使用extractText()取得该页的字符串内容
"""
for i in range(pdf_reader.numPages):
    pageObj = pdf_reader.getPage(i)  # 读取第i页内容
    # pageObj = pdf_reader.pages[i]  # 读取第i页内容
    page_content = pageObj.extractText()  # 提取页面内容
    print(page_content)

test.pdf:
在这里插入图片描述

读取效果:
在这里插入图片描述

2. PDF简单加密与解密

# author:mlnt
# createdate:2022/8/16

import PyPDF2
from PyPDF2 import PdfReader,</
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

梦里逆天

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值