python读取 xls,xlsx,csv,doc,docx,pdf 格式的文件

本文介绍了使用Python3.10.4读取不同格式文件的方法,包括xlrd和openpyxl处理xls/xlsx,docx模块读取docx,转换后读取doc,以及pdfplumber处理pdf,还涉及csv读取。此外,提到了前端和Spring框架的相关技术。

前言

利用python读取 xlsxlsxcsvdocdocxpdf 格式的文件
python版本3.10.4

读取xls

pip install xlrd==2.0.1
wps的.et文件也可以读取

import xlrd

wb = xlrd.open_workbook(path)

# 获取所有工作表
for index,value in enumerate(wb.sheet_names()):
    sheet = wb[index]

    # 获取工作表总行数
    rows = sheet.nrows
    # 获取工作表总列数
    cols = sheet.ncols
    # 总行,总列

    # 获取某一单元格内容(行, 列),列表从0开始r
    for r in range(0, rows):
        for c in range(0, cols):
            if sheet.cell(r, c).value:
              print(sheet.cell(r, c).value)

读取xlsx

pip install openpyxl==3.1.1

import openpyxl

# 获取工作簿对象
wb = openpyxl.load_workbook(path)

# 获取所有工作表
for index,value in enumerate(wb.sheetnames):
    sheet = wb[wb.sheetnames[index]]

    # 获取工作表总行数
    rows = sheet.max_row
    # 获取工作表总列数
    co
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值