在读取excel文件时,经常遇到合并单元格的情况,此时直接使用read_excel读取,获得的dataframe只保留第一个单元格的内容,后面合并的列使用unamed + 序号命名;
此时可使用pd.read_excel(path, sheet_name="sheet_name", header=[1, 2, 3])读取,
header中的序号代表第一二三行上的列名,输出的dataframe列名为1,2,3行的合并值;

如上图形式,输出的列名为报表\导出人:管理员\创建日期、报表\导出人:管理员\更新日期等。
读取加密Excel文档:
import io
import msoffcrypto
import pandas as pd
ori_data_path = "./data/yyy.xlsx"
password = '自己密码'
temp = io.BytesIO()
with open(ori_data_path, "rb") as f:
excel = msoffcrypto.OfficeFile(f)
excel.load_key(password)
excel.decrypt(temp)
df = pd.read_excel(temp, sheet_name="列名")
本文介绍如何使用Python的pandas库处理Excel文件中合并单元格的问题,并提供了解密受密码保护的Excel文件的方法。

1678

被折叠的 条评论
为什么被折叠?



