Python pandas函数库 (个人觉得常用)

原创已于 2023-03-27 08:50:19 修改 · 197 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#python

于 2023-03-23 13:40:58 首次发布

Python基础学习专栏收录该内容

16 篇文章

订阅专栏

本文介绍了Pandas库中的一些核心函数，如read_csv用于读取CSV数据，head和tail查看数据集的前n行和后n行，info提供数据框的统计信息，describe展示数值列的统计特性。此外，还涉及了drop删除行或列，groupby进行数据分组，apply应用自定义函数，merge合并数据框，pivot_table创建透视表，以及loc和iloc选择行或列，sort_values排序数据，plot生成图表，和crosstab计算交叉表的功能。

import pandas as pd

# read_csv() 作用：读取csv文件中的数据，并转化为DataFrame格式。

# 格式：pandas.read_csv(filepath_or_buffer, sep=',', header='infer', names=None, index_col=None)

# 前者为文件路径或缓存，后者为指定分隔符，默认为','

# head() 作用：返回DataFrame前n行的数据。

# 格式：DataFrame.head([n])

#

# tail() 作用：返回DataFrame后n行的数据。

# 格式：DataFrame.tail([n])

# 参数n为指定行数。

# 参数n为指定行数。

#

# info() 作用：返回DataFrame的列名，数据类型，缺失值等信息。

# 格式：DataFrame.info()

# 返回DataFrame中每列的数据类型和是否缺失数据的情况

#

# describe() 作用：返回DataFrame的各个列值的统计特征，包括均值、标准差、最小值、最大值、分位数等。

# 格式：DataFrame.describe()

# 包括计数、均值、标准差、最小值、25%分位数、中位数、75%分位数、最大值

#

# drop() 作用：删掉DataFrame中某些行或列。

# 格式：DataFrame.drop(labels[, axis, columns, index, ...])

#

# groupby() 作用：按照某个或多个列对DataFrame进行分组，常常和聚合函数一起使用。

# 格式：DataFrame.groupby(by=None, axis=0, level=None, as_index=True, sort=True, group_keys=True, squeeze=False, observed=False, dropna=True)

#

# apply() 作用：对一个DataFrame或Series的一行或一列应用指定的函数。

# 格式：DataFrame.apply(func[, axis, raw, result_type, ...])

#

# merge() 作用：将两个DataFrame基于某个或多个共同的字段合并为一个DataFrame。

# 格式：pandas.merge(left, right[, how, on, left_on, ...])

#

# pivot_table() 作用：创建一个透视表，类似于Excel中的透视表。

# 格式：DataFrame.pivot_table([values, index, columns, ...])

# loc/iloc：按标签或整数位置选择行或列

#

# sort_values：按一列或多列对DataFrame进行排序

#

# apply函数：对DataFrame中的每一行或每一列应用一个函数

#

# plot函数：用于创建各种类型的图表，包括折线图、散点图、柱状图和饼图等

#

# crosstab函数：用于计算两个或更多因素之间的频率表或交叉表

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。