极大似然估计与机器学习

原创

已于 2025-05-21 20:31:14 修改 · 1.6k 阅读

标签

#机器学习 #人工智能

收录于

于 2025-05-21 20:30:53 首次发布

复习概统的时候突然发现好像极大似然估计MLE与机器学习的数据驱动非常相似，都是采样样本然后估计模型参数。貌似，后知后觉的才意识到极大似然估计就是机器学习有效的数学保证

下面以拟合线性分布的最小二乘与分类问题为例推到以下如何从似然函数推导出MSE损失与交叉熵损失

一、线性回归的最小二乘法

1. 概率模型设定

假设数据由线性模型生成，且观测噪声服从正态分布：
$\mathbf{w}^T \mathbf{x} + \epsilon, \quad \epsilon \sim \mathcal{N}(0, \sigma^2)$
则给定输入 $x\mathbf{x}$ 时， $y$ 的条件概率密度为：
$\mathbf{x}; \mathbf{w}) = \frac{1}{\sqrt{2\pi\sigma^2}} \exp\left( -\frac{(y - \mathbf{w}^T \mathbf{x})^2}{2\sigma^2} \right)$
均值即为 $\mathbf{w}^T \mathbf{x})^2$