问题呈现
这是我在问答区看到的一个问题。
问:在python中使用pandas读取Excel数据,重复数据被区分了,如何做到重复数据不被区分?


解决思路
很明显,这是pandas读取excel文件时列名设置问题,我第一时间想到的就是pandas.read_excel()是否能读取多行为列名
在pandas.read_excel()里有这样一个参数header,官方文档中这样描述:

header:默认为0,接受整数和整数列表。
按照下标(第一行下标为0)读取为列名。如果传入整数列表,就将根据下标为这些整数的行生成多层索引。header=None表示没有列名。
解决方法已经呼之欲出了。
解决方法
参数header=[0, 1],将前两行作为多层索引
df.loc[:, ‘M1’].loc[:, ‘V1’],读取某列时逐层选定

通过设置pandas.read_excel()的header参数为[0,1],可以将Excel的前两行作为多层索引,从而处理重复的列名。在读取特定列时,需使用逐层选定的方式,如df.loc[:,M1].loc[:,V1]来获取M1下的V1列。
&spm=1001.2101.3001.5002&articleId=129197422&d=1&t=3&u=02542f592b8d4124b997df50b3b269fc)
2445

被折叠的 条评论
为什么被折叠?



