pandas操作 | 读取txt格式数据、删除nan值、删除重复值

本文介绍了如何使用Pythonpandas库读取txt格式数据,包括设置分隔符和表头,以及处理缺失值(删除行或列)和重复值的方法。

一、读取txt格式数据

指令:

pd.read_table(filepath,sep='\t',header='infer')

filepath:文件存储路径

sep:数据分隔符,默认为tap

header:是否需要将原数据集中的第一行作为表头,默认将第一 行用作字段名称

举个栗子:

数据形式

运行结果

二、nan值的处理

x.dropna(axis=0) #删除nan所在行的所有数据
x.dropna(axis=1) #删除nan所在列的所有数据

数据

删除行

删除列

三、重复值的删除

x.drop_duplicates()

效果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值