【机器学习】激活函数（Softmax）

最新推荐文章于 2026-05-17 12:20:11 发布

原创最新推荐文章于 2026-05-17 12:20:11 发布 · 4.3k 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#机器学习 #人工智能

13 篇文章

订阅专栏

该文章已生成可运行项目，

在机器学习中，Softmax 是一种激活函数，常用于多分类任务中。它的主要作用是将一个未归一化的向量（通常是模型的输出）转换为一个概率分布，使得输出中的每个值都位于 0 和 1 之间，并且所有输出的和为 1。

1. Softmax

Softmax 函数的数学表达式如下：

$\sigma(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{K} e^{z_j}}$

其中：

Softmax 函数的作用可以理解为：

Softmax 常用于分类问题的最后一层，特别是在多分类任务中，比如手写数字识别（MNIST），语言分类等。在这些任务中，Softmax 的输出表示模型对每个类别的信心值，可以通过选择概率最大的类别作为最终的预测结果。

假设我们设计一个 CNN 来分类手写数字（比如 MNIST 数据集），目标是将输入的 28x28 像素的手写数字图像分类为 0 到 9 这 10 个数字之一。

层次	描述
输入层	输入 28x28 的灰度图像。
卷积层	提取图像的局部特征，经过几层卷积、池化和激活函数处理，得到高维的特征图。
全连接层	将高维特征图展平成向量，并通过一层或多层全连接层处理，得到每个类别的“原始分数”。
输出层	通过 Softmax 函数将全连接层的输出转换为概率分布，用于多分类预测。