单比例与双比例检验:正态、卡方分布及相关方法
1. 正态分布
设 $X$ 是一个连续随机变量,其样本空间为所有实数的集合 $(-\infty, \infty)$。用 $\mu$ 表示 $X$ 的均值,$\sigma^2$ 表示方差,$X$ 的概率密度函数定义为:
$f(X) = \frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(X - \mu)^2}{2\sigma^2}}$
此时,称 $X$ 服从参数为 $\mu$ 和 $\sigma$ 的正态分布,记为 $X \sim N(\mu, \sigma)$。
在 R 语言中,对应的概率密度函数为:
dnorm(x, mean = 0, sd = 1)
该函数的默认参数设置对应标准正态(或高斯)分布($\mu = 0$ 且 $\sigma = 1$)。与之前的 R 密度函数一样,参数 $x$ 可以赋值为单个值或值的向量。
由于 $X$ 是连续随机变量,其累积分布函数由积分定义:
$P(X \leq x) = \int_{-\infty}^{x} f(t) dt$
并且,对于样本空间中的单个点 $x$,有 $P(X = x) = 0$。因此,与离散概率分布的计算不同,有:
$P(X \leq x) = P(X < x)$
$P(X \geq x) = P(X > x)$
在 R 语言中,计算给定 $X = x$ 时该积分的函数为:
pnor
超级会员免费看
订阅专栏 解锁全文

1万+

被折叠的 条评论
为什么被折叠?



