提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
一、文件读取
方法:
- pd.read_csv()
- pd.read_excel()
- pd.read_json()
- pd.read_sql()
- pd.read_xml()
1.以pd.read_csv()为例:

2.数据查看


df.describe()方法只针对数值列的描述性统计

统计出现次数

二、数据离散化、排序
1.pd.cut()离散化,以按范围加标签为例

2. pd.qcut()实现离散化
cut是根据每个值进行离散化,qcut是根据每个值出现的次数进行离散,也就是基于分位数的离散化功能

3.排序
- df.sort_index():按照默认索引按正序排序

- data1.sort_values()按照实际值排序



5141

被折叠的 条评论
为什么被折叠?



