1、将本地EXCEL文件读取到HIVE表中
1.1 如果没有装读取EXCEL的包,如下安装:
pip install openpyxl
如果已经安装好,如下读取和处理文件:
import pandas as pd
#1-读表
file1=pd.read_excel(open('2023年数据表.xlsx', 'rb'), sheet_name='汇总表', header=1, dtype={"ID号":str})
#2-对一些需要处理的列进行特殊处理
file1['ID号']=file1['ID号'].map(lambda x:str(x).split(".")[0])
file1[:20]
#3-处理后转存为其他文件
file1.drop_duplicates().fillna("").to_csv("tmp.csv", index=False, encoding="utf-8", sep="|")
pandas读取EXCEL的其他方法参考:


1322

被折叠的 条评论
为什么被折叠?



