Python pandas函数库 (个人觉得常用)

本文介绍了Pandas库中的一些核心函数,如read_csv用于读取CSV数据,head和tail查看数据集的前n行和后n行,info提供数据框的统计信息,describe展示数值列的统计特性。此外,还涉及了drop删除行或列,groupby进行数据分组,apply应用自定义函数,merge合并数据框,pivot_table创建透视表,以及loc和iloc选择行或列,sort_values排序数据,plot生成图表,和crosstab计算交叉表的功能。

import pandas as pd

# read_csv() 作用:读取csv文件中的数据,并转化为DataFrame格式。

# 格式:pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None)

# 前者为文件路径或缓存,后者为指定分隔符,默认为','

# head() 作用:返回DataFrame前n行的数据。

# 格式:DataFrame.head([n])

#

# tail() 作用:返回DataFrame后n行的数据。

# 格式:DataFrame.tail([n])

# 参数n为指定行数。

# 参数n为指定行数。

#

# info() 作用:返回DataFrame的列名,数据类型,缺失值等信息。

# 格式:DataFrame.info()

# 返回DataFrame中每列的数据类型和是否缺失数据的情况

#

# describe() 作用:返回DataFrame的各个列值的统计特征,包括均值、标准差、最小值、最大值、分位数等。

# 格式:DataFrame.describe()

# 包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数、最大值

#

# drop() 作用:删掉DataFrame中某些行或列。

# 格式:DataFrame.drop(labels[, axis, columns, index, ...])

#

# groupby() 作用:按照某个或多个列对DataFrame进行分组,常常和聚合函数一起使用。

# 格式:DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, dropna=True)

#

# apply() 作用:对一个DataFrame或Series的一行或一列应用指定的函数。

# 格式:DataFrame.apply(func[, axis, raw, result_type, ...])

#

# merge() 作用:将两个DataFrame基于某个或多个共同的字段合并为一个DataFrame。

# 格式:pandas.merge(left, right[, how, on, left_on, ...])

#

# pivot_table() 作用:创建一个透视表,类似于Excel中的透视表。

# 格式:DataFrame.pivot_table([values, index, columns, ...])

# loc/iloc:按标签或整数位置选择行或列

#

# sort_values:按一列或多列对DataFrame进行排序

#

# apply函数:对DataFrame中的每一行或每一列应用一个函数

#

# plot函数:用于创建各种类型的图表,包括折线图、散点图、柱状图和饼图等

#

# crosstab函数:用于计算两个或更多因素之间的频率表或交叉表

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值