统计学基础:5分钟搞懂累积分布函数(CDF)与概率密度函数(PDF)的区别
想象你站在一条蜿蜒的山路上,CDF就像你脚下的海拔高度计,告诉你已经爬过了多少路程;而PDF则是你此刻的坡度感受器,反映脚下每一步的陡峭程度。这两种函数构成了概率世界的"地形图",让我们能精确导航随机变量的行为轨迹。
1. 核心概念拆解:从生活场景到数学语言
1.1 CDF:概率的累计账簿
累积分布函数(Cumulative Distribution Function)是随机变量X小于等于某值x的概率,记作F(x)=P(X≤x)。就像超市收银台的流水记录:
- 当x趋近于-∞时,F(x)=0(还没开始营业)
- 当x趋近于+∞时,F(x)=1(当日营业结束)
- 函数值永远单调不减(营业额不会倒扣)
典型特征:
import numpy as np
from scipy.stats import norm
x = np.linspace(-3, 3, 100)
cdf = norm.cdf(x) # 标准正态分布CDF
这段代码生成的曲线会从0平稳上升至1,如同缓坡登山。
1.2 PDF:概率的瞬时速率
概率密度函数(Probability Density Function)是CDF的导数,描述概率分布的"浓度"。以体温分布为例:
- 36.5℃附近PDF值较高(多数人集中在此)
- 40℃以上PDF值极低(发烧人群稀少)
- 曲线下总面积恒为1(所有人都在统计范围内)
关键性质:
注意:PDF在某点的值不是概率,只有区间积分才有概率意义。就像车速表显示瞬时速率,只有乘以时间才能得到行驶距离。


6214

被折叠的 条评论
为什么被折叠?



