随机变量基础：定义、期望与方差在风险预测中的核心作用

原创于 2026-06-18 09:45:52 发布 · 13 阅读

1 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

标签

#人工智能 #深度学习 #贝叶斯 #数学 #概率论

AI 专栏收录该内容

195 篇文章

订阅专栏

前言

如果说概率论研究的是：

随机事件发生的可能性

那么随机变量研究的则是：

随机事件对应的数值结果

在机器学习、金融风控、保险精算、医疗预测、人工智能等领域中，我们经常会看到类似的问题：

某用户未来违约概率是多少？
某股票未来收益率是多少？
某病人未来患病风险是多少？
某设备未来故障概率是多少？

这些问题背后都存在一个共同特点：

结果具有不确定性

因此：

我们需要用数学工具描述这种不确定性

而随机变量正是概率论中最重要的工具之一。

事实上：

概率分布
贝叶斯推断
机器学习
深度学习
大语言模型

都建立在随机变量理论基础之上。

可以说：

没有随机变量
就没有现代机器学习

本文将系统讲解：

什么是随机变量
为什么需要随机变量
离散与连续随机变量
数学期望
方差
风险预测中的应用
机器学习中的重要作用

帮助大家真正理解：

随机变量是连接概率论与人工智能的重要桥梁

一、为什么需要随机变量

从掷骰子开始

假设我们掷一次骰子。

可能结果：

此时我们会发现：

结果具有随机性

在掷出之前：

没人知道最终结果是什么。

概率论面临的问题

如果仅仅记录事件：

出现1点
出现2点
出现3点

那么：

无法进行数学运算

例如：

我们无法计算：

平均结果
波动程度
风险水平

因此需要一种方式：

把随机现象数字化

这就是随机变量诞生的原因。

二、什么是随机变量

基本定义

随机变量（Random Variable）：

是样本空间到实数集的映射

这一定义看起来比较抽象。

简单理解

随机变量本质上就是：

给随机结果贴上数字标签

例如：

掷骰子：

X = 骰子点数

则：

X ∈ {1,2,3,4,5,6}

此时：

随机事件
变成了
数学变量

一句话理解

随机变量实现了：

现实随机现象
↓
数字化表达
↓
数学分析

三、随机变量与随机事件的区别

很多初学者容易混淆。

随机事件

例如：

掷出偶数

对应：

{2,4,6}

又例如：

掷出大于4

对应：

{5,6}

这些属于：

随机事件

随机变量

例如：

X = 骰子点数

则：

X=1
X=2
X=3
...

随机变量回答：

结果是多少

随机事件回答：

发生了什么

四、离散随机变量

什么是离散随机变量

如果随机变量取值：

有限个
或者可数无限个

则称为：

离散随机变量

常见例子

掷骰子

1~6

抛硬币

正面
反面

用户点击次数

0
1
2
3
...

商品购买数量

0件
1件
2件
3件
...

特点：

所有取值都可以枚举出来

五、连续随机变量

现实世界中的很多变量无法枚举。

例如：

身高

175.1
175.12
175.123
...

温度

26.1℃
26.12℃
26.123℃

股票收益率

3.15%
3.156%
3.1567%

这些变量称为：

连续随机变量

特点：

取值无限连续

六、随机变量的概率分布

随机变量最重要的内容：

概率分布

骰子案例

X	概率
1	1/6
2	1/6
3	1/6
4	1/6
5	1/6
6	1/6

这张表描述：

每个结果出现的概率

称为：

概率分布

为什么重要

因为未来所有统计分析：

都建立在概率分布基础上

七、数学期望：长期平均结果

什么是期望

期望（Expectation）表示：

长期重复实验后的平均结果

例如：

骰子：

平均值：

(1+2+3+4+5+6)/6

结果：

3.5

如何理解

很多人疑惑：

骰子不可能掷出3.5

没错。

期望并不是实际结果。

而是：

长期平均水平

八、期望在风险预测中的意义

风险预测本质上关注：

未来平均收益

或者：

未来平均损失

股票投资案例

假设：

股票A：

收益率	概率
+20%	50%
-10%	50%

则：

期望收益率 = 5%

表示：

长期平均收益约5%

银行贷款案例

某客户：

违约概率 10%

违约损失：

10万元

则：

期望损失 = 1万元

这就是金融风控的重要依据。

九、方差：衡量风险大小

为什么仅看期望不够

假设：

投资A：

每年稳定收益5%

投资B：

+100%
或者
-90%

两者期望可能相近。

但风险完全不同。

因此需要：

衡量波动程度

这就是方差。

方差定义

方差用于描述：

随机变量偏离平均值的程度

其核心思想是：

离均值越远
风险越大

方差直观理解

方差越大：

结果越不稳定

方差越小：

结果越稳定

十、方差在风险预测中的作用

股票市场

假设：

股票A：

年收益率
5%
6%
4%
5%

股票B：

50%
-30%
80%
-20%

虽然平均收益接近。

但是：

股票B方差远大于股票A

意味着：

风险更高

银行业风控

银行不仅关心：

客户平均还款能力

更关心：

还款能力波动

波动越大：

违约风险越高

十一、标准差：更容易理解的风险指标

由于方差单位较大。

实际应用中常用：

标准差

定义：

标准差 = 方差开平方

优势：

与原始数据单位一致

例如：

股票年收益率：

平均收益 8%

标准差 3%

说明：

收益率通常围绕8%上下波动3%

十二、机器学习中的期望与方差

模型预测

机器学习训练目标：

本质上是：

降低预测误差

例如：

房价预测：

真实值：

100万

预测值：

102万

误差：

2万

大量样本误差：

形成误差分布

此时：

均值
方差

成为重要指标。

十三、偏差与方差问题

机器学习经典理论：

Bias-Variance Tradeoff

即：

偏差-方差权衡

高偏差

模型过于简单。

例如：

欠拟合

高方差

模型过于复杂。

例如：

过拟合

机器学习训练过程：

实际上是在寻找：

偏差与方差平衡点

十四、大语言模型中的随机变量

如今最热门的：

GPT
Claude
Gemini
DeepSeek

本质上都在预测：

下一个Token

例如：

输入：

中国的首都是

模型输出：

词语	概率
北京	98%
上海	1%
广州	1%

这里：

Token

本质上就是：

随机变量

而概率分布：

决定模型最终输出。

十五、从随机变量到人工智能

随机变量的发展路径：

随机现象
↓
随机变量
↓
概率分布
↓
期望
↓
方差
↓
统计推断
↓
机器学习
↓
深度学习
↓
人工智能

可以说：

随机变量是现代AI的数学起点

总结

随机变量是概率论最重要的基础概念之一，它将随机现象转化为可计算的数学对象，并通过期望和方差帮助我们量化收益与风险。

本文系统讲解了：

1、随机变量的定义
2、随机变量与随机事件区别
3、离散随机变量
4、连续随机变量
5、概率分布
6、数学期望
7、方差
8、标准差
9、风险预测中的应用
10、机器学习中的作用

可以将随机变量总结为：

随机变量负责描述不确定性，期望负责衡量长期收益，方差负责衡量风险大小。从金融风控到机器学习，从自动驾驶到大语言模型，随机变量、期望与方差始终是理解和预测世界的重要数学工具。

当你真正理解随机变量、期望与方差之后，就掌握了概率统计、机器学习以及人工智能最核心的数学基础之一。