文章目录
一、运算与对齐
pandas可对不同索引的对象进行运算,索引与数据的对应关系仍然存在于数组运算的结果中。没对齐的位置补NaN
Series和Series、DataFrame和DataFrame均可以进行运算,原则是只有行索引和列索引相同的地方才可进行运算,运算结果的行与列数按照原行与列的最大值算。【Series的对齐操作发生在索引上,DataFrame的对齐操作发生在行与列上】
Series和DataFrame进行运算时,Series被看作行数据(index被看做列名组合),和DataFrame中数据进行运算。
二、函数应用
map()函数
将函数作用于一个Series的每一个元素,函数可以是Numpy中的通用函数,也可以是自定义函数。map函数只应用Series对象
import numpy as np
import pandas as pd
import math
a = list(range(10)) # 产生一个a列表
result = map(math.sqrt,a) # 产生了map对象,只是一个操作,直到访问这个它才会产生结果
list(result) # 这个时候才会产生sqrt之后的值
# --------------------------------------------------------------------
ser = pd.Series(a)
ser.map(np.sqrt) # Series可以直接使用map函数

本文深入探讨了Pandas在数据分析中的应用,包括运算与对齐,如Series和DataFrame的运算规则;函数应用,如map()、apply()和applymap();文件读写操作;排序,按索引和值排序的方法;数据清洗,处理缺失和重复数据的技巧;以及统计方法,如describe()、quantile()等。
&spm=1001.2101.3001.5002&articleId=124506212&d=1&t=3&u=d38365aa0cab4babbf837f32d2cf1325)
1016

被折叠的 条评论
为什么被折叠?



