目录
前言
如果说概率论研究的是:
随机事件发生的可能性
那么随机变量研究的则是:
随机事件对应的数值结果
在机器学习、金融风控、保险精算、医疗预测、人工智能等领域中,我们经常会看到类似的问题:
-
某用户未来违约概率是多少?
-
某股票未来收益率是多少?
-
某病人未来患病风险是多少?
-
某设备未来故障概率是多少?
这些问题背后都存在一个共同特点:
结果具有不确定性
因此:
我们需要用数学工具描述这种不确定性
而随机变量正是概率论中最重要的工具之一。
事实上:
-
概率分布
-
贝叶斯推断
-
机器学习
-
深度学习
-
大语言模型
都建立在随机变量理论基础之上。
可以说:
没有随机变量
就没有现代机器学习
本文将系统讲解:
-
什么是随机变量
-
为什么需要随机变量
-
离散与连续随机变量
-
数学期望
-
方差
-
风险预测中的应用
-
机器学习中的重要作用
帮助大家真正理解:
随机变量是连接概率论与人工智能的重要桥梁
一、为什么需要随机变量
从掷骰子开始
假设我们掷一次骰子。
可能结果:
1
2
3
4
5
6
此时我们会发现:
结果具有随机性
在掷出之前:
没人知道最终结果是什么。
概率论面临的问题
如果仅仅记录事件:
出现1点
出现2点
出现3点
那么:
无法进行数学运算
例如:
我们无法计算:
-
平均结果
-
波动程度
-
风险水平
因此需要一种方式:
把随机现象数字化
这就是随机变量诞生的原因。
二、什么是随机变量
基本定义
随机变量(Random Variable):
是样本空间到实数集的映射
这一定义看起来比较抽象。
简单理解
随机变量本质上就是:
给随机结果贴上数字标签
例如:
掷骰子:
X = 骰子点数
则:
X ∈ {1,2,3,4,5,6}
此时:
随机事件
变成了
数学变量
一句话理解
随机变量实现了:
现实随机现象
↓
数字化表达
↓
数学分析
三、随机变量与随机事件的区别
很多初学者容易混淆。
随机事件
例如:
掷出偶数
对应:
{2,4,6}
又例如:
掷出大于4
对应:
{5,6}
这些属于:
随机事件
随机变量
例如:
X = 骰子点数
则:
X=1
X=2
X=3
...
随机变量回答:
结果是多少
随机事件回答:
发生了什么
四、离散随机变量
什么是离散随机变量
如果随机变量取值:
有限个
或者可数无限个
则称为:
离散随机变量
常见例子
掷骰子
1~6
抛硬币
正面
反面
用户点击次数
0
1
2
3
...
商品购买数量
0件
1件
2件
3件
...
特点:
所有取值都可以枚举出来
五、连续随机变量
现实世界中的很多变量无法枚举。
例如:
身高
175.1
175.12
175.123
...
温度
26.1℃
26.12℃
26.123℃
股票收益率
3.15%
3.156%
3.1567%
这些变量称为:
连续随机变量
特点:
取值无限连续
六、随机变量的概率分布
随机变量最重要的内容:
概率分布
骰子案例
| X | 概率 |
|---|---|
| 1 | 1/6 |
| 2 | 1/6 |
| 3 | 1/6 |
| 4 | 1/6 |
| 5 | 1/6 |
| 6 | 1/6 |
这张表描述:
每个结果出现的概率
称为:
概率分布
为什么重要
因为未来所有统计分析:
都建立在概率分布基础上
七、数学期望:长期平均结果
什么是期望
期望(Expectation)表示:
长期重复实验后的平均结果
例如:
骰子:
1
2
3
4
5
6
平均值:
(1+2+3+4+5+6)/6
结果:
3.5
如何理解
很多人疑惑:
骰子不可能掷出3.5
没错。
期望并不是实际结果。
而是:
长期平均水平
八、期望在风险预测中的意义
风险预测本质上关注:
未来平均收益
或者:
未来平均损失
股票投资案例
假设:
股票A:
| 收益率 | 概率 |
|---|---|
| +20% | 50% |
| -10% | 50% |
则:
期望收益率 = 5%
表示:
长期平均收益约5%
银行贷款案例
某客户:
违约概率 10%
违约损失:
10万元
则:
期望损失 = 1万元
这就是金融风控的重要依据。
九、方差:衡量风险大小
为什么仅看期望不够
假设:
投资A:
每年稳定收益5%
投资B:
+100%
或者
-90%
两者期望可能相近。
但风险完全不同。
因此需要:
衡量波动程度
这就是方差。
方差定义
方差用于描述:
随机变量偏离平均值的程度
其核心思想是:
离均值越远
风险越大
方差直观理解
方差越大:
结果越不稳定
方差越小:
结果越稳定
十、方差在风险预测中的作用
股票市场
假设:
股票A:
年收益率
5%
6%
4%
5%
股票B:
50%
-30%
80%
-20%
虽然平均收益接近。
但是:
股票B方差远大于股票A
意味着:
风险更高
银行业风控
银行不仅关心:
客户平均还款能力
更关心:
还款能力波动
波动越大:
违约风险越高
十一、标准差:更容易理解的风险指标
由于方差单位较大。
实际应用中常用:
标准差
定义:
标准差 = 方差开平方
优势:
与原始数据单位一致
例如:
股票年收益率:
平均收益 8%
标准差 3%
说明:
收益率通常围绕8%上下波动3%
十二、机器学习中的期望与方差
模型预测
机器学习训练目标:
本质上是:
降低预测误差
例如:
房价预测:
真实值:
100万
预测值:
102万
误差:
2万
大量样本误差:
形成误差分布
此时:
均值
方差
成为重要指标。
十三、偏差与方差问题
机器学习经典理论:
Bias-Variance Tradeoff
即:
偏差-方差权衡
高偏差
模型过于简单。
例如:
欠拟合
高方差
模型过于复杂。
例如:
过拟合
机器学习训练过程:
实际上是在寻找:
偏差与方差平衡点
十四、大语言模型中的随机变量
如今最热门的:
-
GPT
-
Claude
-
Gemini
-
DeepSeek
本质上都在预测:
下一个Token
例如:
输入:
中国的首都是
模型输出:
| 词语 | 概率 |
|---|---|
| 北京 | 98% |
| 上海 | 1% |
| 广州 | 1% |
这里:
Token
本质上就是:
随机变量
而概率分布:
决定模型最终输出。
十五、从随机变量到人工智能
随机变量的发展路径:
随机现象
↓
随机变量
↓
概率分布
↓
期望
↓
方差
↓
统计推断
↓
机器学习
↓
深度学习
↓
人工智能
可以说:
随机变量是现代AI的数学起点
总结
随机变量是概率论最重要的基础概念之一,它将随机现象转化为可计算的数学对象,并通过期望和方差帮助我们量化收益与风险。
本文系统讲解了:
1、随机变量的定义
2、随机变量与随机事件区别
3、离散随机变量
4、连续随机变量
5、概率分布
6、数学期望
7、方差
8、标准差
9、风险预测中的应用
10、机器学习中的作用
可以将随机变量总结为:
随机变量负责描述不确定性,期望负责衡量长期收益,方差负责衡量风险大小。从金融风控到机器学习,从自动驾驶到大语言模型,随机变量、期望与方差始终是理解和预测世界的重要数学工具。
当你真正理解随机变量、期望与方差之后,就掌握了概率统计、机器学习以及人工智能最核心的数学基础之一。

395

被折叠的 条评论
为什么被折叠?



