对带有西格玛求和符号的函数求导

对带有求和符号(西格玛,Σ)的函数求导时,需要结合微积分的基本规则西格玛符号的线性性质。以下是详细的步骤和示例:


1. 西格玛符号的线性性质

西格玛符号具有以下线性性质:

  • 常数因子提出
    ∑i=1naf(xi)=a∑i=1nf(xi) \sum_{i=1}^n a f(x_i) = a \sum_{i=1}^n f(x_i) i=1naf(xi)=ai=1nf(xi)
  • 和的分解
    ∑i=1n[f(xi)+g(xi)]=∑i=1nf(xi)+∑i=1ng(xi) \sum_{i=1}^n [f(x_i) + g(x_i)] = \sum_{i=1}^n f(x_i) + \sum_{i=1}^n g(x_i) i=1n[f(xi)+g(xi)]=i=1nf(xi)+i=1ng(xi)

这些性质允许我们将求导操作分配到西格玛符号内的每一项。


2. 求导的基本规则

对带有西格玛的函数求导时,需根据变量在西格玛符号中的位置进行分析:

  • 变量在西格玛外部
    若变量是西格玛符号外的参数(如均值 μ\muμ、标准差 σ\sigmaσ),则直接对整体表达式求导。
  • 变量在西格玛内部
    若变量是西格玛符号内的项(如 xix_ixi),则需对每个 xix_ixi 分别求导后再求和。

3. 具体步骤

步骤 1:展开或简化表达式

将西格玛符号内的表达式展开(如平方项、乘积项),方便逐项求导。例如:
∑i=1n(xi−μ)2=∑i=1nxi2−2μ∑i=1nxi+nμ2 \sum_{i=1}^n (x_i - \mu)^2 = \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2 i=1n(xiμ)2=i=1nxi22μi=1nxi+nμ2

步骤 2:应用求导规则

根据变量的位置选择求导方式:

  • 对西格玛外的参数求导
    若变量是西格玛外的参数(如 μ\muμ),直接对整个表达式求导。例如:
    ∂∂μ[∑i=1n(xi−μ)2]=∂∂μ(∑i=1nxi2−2μ∑i=1nxi+nμ2)=−2∑i=1nxi+2nμ \frac{\partial}{\partial \mu} \left[ \sum_{i=1}^n (x_i - \mu)^2 \right] = \frac{\partial}{\partial \mu} \left( \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2 \right) = -2\sum_{i=1}^n x_i + 2n\mu μ[i=1n(xiμ)2]=μ(i=1nxi22μi=1nxi+nμ2)=2i=1nxi+2nμ

  • 对西格玛内的变量求导
    若变量是西格玛内的项(如 xix_ixi),需对每个 xix_ixi 分别求导后求和。例如:
    ∂∂xj[∑i=1n(xi−μ)2]=∂∂xj(xj−μ)2=2(xj−μ) \frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n (x_i - \mu)^2 \right] = \frac{\partial}{\partial x_j} (x_j - \mu)^2 = 2(x_j - \mu) xj[i=1n(xiμ)2]=xj(xjμ)2=2(xjμ)

步骤 3:合并结果

根据求导后的表达式,合并同类项或简化最终结果。


4. 示例解析

示例 1:对均值 μ\muμ 求导

假设函数为:
f(μ)=∑i=1n(xi−μ)2 f(\mu) = \sum_{i=1}^n (x_i - \mu)^2 f(μ)=i=1n(xiμ)2
步骤

  1. 展开平方项:
    f(μ)=∑i=1nxi2−2μ∑i=1nxi+nμ2 f(\mu) = \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2 f(μ)=i=1nxi22μi=1nxi+nμ2
  2. μ\muμ 求导:
    ∂f∂μ=−2∑i=1nxi+2nμ \frac{\partial f}{\partial \mu} = -2\sum_{i=1}^n x_i + 2n\mu μf=2i=1nxi+2nμ
  3. 令导数为零,求极值:
    −2∑i=1nxi+2nμ=0  ⟹  μ=1n∑i=1nxi -2\sum_{i=1}^n x_i + 2n\mu = 0 \implies \mu = \frac{1}{n} \sum_{i=1}^n x_i 2i=1nxi+2nμ=0μ=n1i=1nxi
示例 2:对标准差 σ\sigmaσ 求导

假设函数为:
f(σ)=∑i=1n(xi−μ)2σ2 f(\sigma) = \sum_{i=1}^n \frac{(x_i - \mu)^2}{\sigma^2} f(σ)=i=1nσ2(xiμ)2
步骤

  1. 将表达式拆解:
    f(σ)=1σ2∑i=1n(xi−μ)2 f(\sigma) = \frac{1}{\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 f(σ)=σ21i=1n(xiμ)2
  2. σ\sigmaσ 求导(注意 σ\sigmaσ 在分母):
    ∂f∂σ=∂∂σ(Cσ2)=−2Cσ3,其中 C=∑i=1n(xi−μ)2 \frac{\partial f}{\partial \sigma} = \frac{\partial}{\partial \sigma} \left( \frac{C}{\sigma^2} \right) = -\frac{2C}{\sigma^3}, \quad \text{其中 } C = \sum_{i=1}^n (x_i - \mu)^2 σf=σ(σ2C)=σ32C,其中 C=i=1n(xiμ)2

5. 常见问题

Q1: 西格玛符号内有复合函数怎么办?

:使用链式法则,逐层求导。例如:
∑i=1nln⁡(1+xi2)对 xj 求导: \sum_{i=1}^n \ln(1 + x_i^2) \quad \text{对 } x_j \text{ 求导:} i=1nln(1+xi2) xj 求导:
∂∂xj[∑i=1nln⁡(1+xi2)]=2xj1+xj2 \frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n \ln(1 + x_i^2) \right] = \frac{2x_j}{1 + x_j^2} xj[i=1nln(1+xi2)]=1+xj22xj

Q2: 西格玛符号内有指数或乘积项怎么办?

:先展开再求导。例如:
∑i=1nexi对 xj 求导: \sum_{i=1}^n e^{x_i} \quad \text{对 } x_j \text{ 求导:} i=1nexi xj 求导:
∂∂xj[∑i=1nexi]=exj \frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n e^{x_i} \right] = e^{x_j} xj[i=1nexi]=exj


6. 总结

  • 关键点
    1. 利用西格玛的线性性质分解表达式。
    2. 根据变量位置选择求导方式(整体或逐项)。
    3. 对于复合函数,结合链式法则。
  • 应用场景
    • 概率论(最大似然估计、方差计算)。
    • 机器学习(损失函数求导,如均方误差)。
    • 优化问题(梯度下降法)。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值