在进行统计描述时,pandas对三个数据对象的轴参数规定如下:
Series: 没有轴参数
DataFrame: “index” (axis=0, default), “columns” (axis=1)
Panel: “items” (axis=0), “major” (axis=1, default), “minor” (axis=2)
统计描述参数如下:
| Function | Description | 描述 |
|---|---|---|
| count | Number of non-null observations | 观测值的个数 |
| sum | Sum of values | 求和 |
| mean | Mean of values | 求平均值 |
| mad | Mean absolute deviation | 平均绝对方差 |
| median | Arithmetic median of values | 中位数 |
| min | Minimum | 最小值 |
| max | Maximum | 最大值 |
| mode | Mode | 众数 |
| abs | Absolute Value | 绝对值 |
| prod | Product of values | 乘积 |
| std | Bessel-corrected sample standard deviation | 标准差 |
| var | Unbiased variance | 方差 |
| sem | Standard error of the mean | 标准误 |
| skew | Sample skewness (3rd moment) | 偏度系数 |
| kurt | Sample kurtosis (4th moment) | 峰度 |
| quantile | Sample quantile (value at %) | 分位数 |
| cumsum | Cumulative sum | 累加 |
| cumprod | Cumulative product | 累乘 |
| cummax | Cumulative maximum | 累最大值 |
| cummin | Cumulative minimum | 累最小值 |
| cov() | covariance | 协方差 |
| corr() | correlation | 相关系数 |
| rank() | rank by values | 排名 |
| pct_change() | time change | 时间序列变化 |
本文介绍了Pandas库中用于统计描述的各种方法及其参数。包括count、sum、mean等基本统计量,以及mad、skew等高级统计量的计算方式。同时也解释了不同数据结构如Series、DataFrame和Panel在调用这些统计方法时轴参数的不同。

3426

被折叠的 条评论
为什么被折叠?



