从感知机到多层前馈神经网络:BP算法与梯度下降的权值更新全解析

1. 从“开关”到“大脑”:神经网络的起点——感知机

大家好,我是老张,在AI这个行当里摸爬滚打了十几年,从最早的简单模型一路跟到现在的大模型。今天想和大家聊聊神经网络最核心、最基础的那些事儿。很多朋友一上来就想搞懂Transformer、GPT,但我的经验是,如果不把感知机、多层网络和反向传播(BP)这些地基打牢,后面学起来就像在沙地上盖楼,摇摇晃晃。咱们就从那个最简单的“开关”模型——感知机开始。

想象一下,你要做一个能自动判断今天是否适合打球的装置。它有两个输入:一个是“天气晴朗吗?”(是=1,否=0),另一个是“朋友有空吗?”(是=1,否=0)。你的目标是,只有当两个条件都满足时,装置才亮绿灯(输出1),否则亮红灯(输出0)。这其实就是逻辑“与”运算。感知机干的就是这个活儿。它本质上是一个单层的决策单元,由输入层和输出层组成。输入层负责接收信号(比如天气、朋友状态),每个信号都带有一个权重,你可以把权重理解为这个信号的重要性。比如你觉得“朋友有空”比“天气晴朗”更重要一点,就可以给它分配更大的权重。

这些带权重的信号汇总到输出层的那个神经元里,它会计算一个加权总和,然后和一个预设的阈值(也叫偏置)进行比较。如果总和超过阈值,神经元就“兴奋”,输出1(比如去打球);如果没超过,就“抑制”,输出0(比如宅家)。这个比较和输出的过程,由一个叫激活函数的家伙来完成。最早的感知机用的激活函数是阶跃函数,就像一个硬邦邦的开关,输入超过阈值就“啪”一下跳到1,否则就是0,非常干脆。

用代码来模拟一下这个“与”运算的感知机,会非常直观:

import numpy as np

def step_function(x):
    """阶跃激活函数"""
    return 1 if x >= 0 else 0

def perceptron_and(x1, x2):
    """实现逻辑与的感知机"""
    # 手动设置权重和阈值(偏置)
    w1, w2 = 0.5, 0.5  # 两个输入的权重,这里假设同等重要
    theta = 0.7         # 阈值
    weighted_sum = x1*w1 + x2*w2
    # 将加权总和减去阈值,输入激活函数
    return step_function(weighted_sum - theta)

# 测试四种输入情况
print(f"(0, 0) -> {perceptron_and(0, 0)}")  # 输出应为 0
print(f"(0, 1) -> {perceptron_and(0, 1)}")  # 输出应为 0
print(f"(1, 0) -> {perceptron_and(1, 0)}")  # 输出应为 0
print(f"(1, 1) -> {perceptron_and(1, 1)}")  # 输出应为 1

运行这段代码,你会发现它完美地实现了“与”逻辑。通过调整权重w1、w2和阈值theta,这个简单的感知机也能实现“或”、“非”运算。听起来很强大,对吧?但这里埋着一个巨大的坑,也是当年让神经网络研究陷入低谷的“阿喀琉斯之踵”:它解决不了异或问题。

什么是异或?就是“二者不同时为真”。比如,天气好和朋友有空,只满足其中一条时才去打球(输出1),两条都满足或都不满足时都不去(输出0)。你试着在纸上画个坐标轴,用点表示(0,0), (0,1), (1,0), (1,1)这四种输入,并标记对应的输出。你会发现,你永远无法用一条直线把输出为1的点((0,1)和(1,0))和输出为0的点((0,0)和(1,1))完全分开。这就是非线性可分问题。单层感知机的能力极限就是画一条直线(在三维空间里是一个平面)来分类,面对异或这种需要一条曲线(或折线)才能分开的情况,它就彻底抓瞎了,在学习过程中会陷入无限振荡,永远找不到正确的权重。

注意:这个“线性可分”的局限性是神经网络发展史上的一个重要转折点。它直接告诉我们,单层的网络结构能力有限,要想处理更复杂的现实问题(比如图像识别、自然语言理解),我们必须堆叠更多的层,引入非线性。这也就引出了我们下一节要讲的,真正强大的武器——多层前馈神经网络。

2. 堆叠的力量:多层前馈神经网络如何成为万能逼近器

既然一层不够用,那很自然的想法就是:多加几层。这就好比单兵作战能力有限,我们就组建一个多兵种协同的军团。多层前馈神经网络

于2024年4月-2025年9月期间,研究团队在贵州习水国家级自然保护区制定39条样线,涵盖灌木林、常绿阔叶林、针叶林、常绿落叶阔叶混交林、针阔混交林等不同植被类型,每条样线分春夏秋冬4个季节采集样品,用真菌采集软件记录经纬度、海拔、采集地点、时间、生境等信息,使用佳能相机(R6 mark Ⅱ)对大型真菌进行拍照,并采集标本,标本存放于贵州省生物研究所大型真菌标本馆(HGAMF)。 通过形态学初步鉴定,结合分子生物学最终鉴定,参考已]报道的中国毒蘑菇名录开展毒蘑菇的认定。 调查到保护区内有毒真菌7目25科64种,导致中毒的主要类型有急性肾衰竭型、神经精神型和胃肠炎型。最终形成贵州习水国家级自然保护区大型有毒真菌图片数据集,它由以下2个部分组成。 (1)附件1包含78张原始照片(.JPG),照片名字包括了大型有毒真菌的拉丁名和中文名,若无中文名的直接用拉丁名。 (2)附件2是一个压缩文件,包含了2张工作表,其中一张表是大型有毒真菌39条样线的信息,另一张表是大型有毒真菌的中毒类型。 照片采用佳能相机R6 mark Ⅱ拍摄,物种鉴定通过多种文献核实,并经两位以上专家鉴定确认。该数据集可为研究地及周边的普通人识别有毒大型真菌提供参考,通过及时的图片对比,能有效避免误采误食大型有毒真菌,同时为因误食大型真菌可能引发的身体损伤进行了总结,能为患者及时治疗提供参考。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值