对带有求和符号(西格玛,Σ)的函数求导时,需要结合微积分的基本规则和西格玛符号的线性性质。以下是详细的步骤和示例:
1. 西格玛符号的线性性质
西格玛符号具有以下线性性质:
- 常数因子提出:
∑i=1naf(xi)=a∑i=1nf(xi) \sum_{i=1}^n a f(x_i) = a \sum_{i=1}^n f(x_i) i=1∑naf(xi)=ai=1∑nf(xi) - 和的分解:
∑i=1n[f(xi)+g(xi)]=∑i=1nf(xi)+∑i=1ng(xi) \sum_{i=1}^n [f(x_i) + g(x_i)] = \sum_{i=1}^n f(x_i) + \sum_{i=1}^n g(x_i) i=1∑n[f(xi)+g(xi)]=i=1∑nf(xi)+i=1∑ng(xi)
这些性质允许我们将求导操作分配到西格玛符号内的每一项。
2. 求导的基本规则
对带有西格玛的函数求导时,需根据变量在西格玛符号中的位置进行分析:
- 变量在西格玛外部:
若变量是西格玛符号外的参数(如均值 μ\muμ、标准差 σ\sigmaσ),则直接对整体表达式求导。 - 变量在西格玛内部:
若变量是西格玛符号内的项(如 xix_ixi),则需对每个 xix_ixi 分别求导后再求和。
3. 具体步骤
步骤 1:展开或简化表达式
将西格玛符号内的表达式展开(如平方项、乘积项),方便逐项求导。例如:
∑i=1n(xi−μ)2=∑i=1nxi2−2μ∑i=1nxi+nμ2
\sum_{i=1}^n (x_i - \mu)^2 = \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2
i=1∑n(xi−μ)2=i=1∑nxi2−2μi=1∑nxi+nμ2
步骤 2:应用求导规则
根据变量的位置选择求导方式:
-
对西格玛外的参数求导:
若变量是西格玛外的参数(如 μ\muμ),直接对整个表达式求导。例如:
∂∂μ[∑i=1n(xi−μ)2]=∂∂μ(∑i=1nxi2−2μ∑i=1nxi+nμ2)=−2∑i=1nxi+2nμ \frac{\partial}{\partial \mu} \left[ \sum_{i=1}^n (x_i - \mu)^2 \right] = \frac{\partial}{\partial \mu} \left( \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2 \right) = -2\sum_{i=1}^n x_i + 2n\mu ∂μ∂[i=1∑n(xi−μ)2]=∂μ∂(i=1∑nxi2−2μi=1∑nxi+nμ2)=−2i=1∑nxi+2nμ -
对西格玛内的变量求导:
若变量是西格玛内的项(如 xix_ixi),需对每个 xix_ixi 分别求导后求和。例如:
∂∂xj[∑i=1n(xi−μ)2]=∂∂xj(xj−μ)2=2(xj−μ) \frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n (x_i - \mu)^2 \right] = \frac{\partial}{\partial x_j} (x_j - \mu)^2 = 2(x_j - \mu) ∂xj∂[i=1∑n(xi−μ)2]=∂xj∂(xj−μ)2=2(xj−μ)
步骤 3:合并结果
根据求导后的表达式,合并同类项或简化最终结果。
4. 示例解析
示例 1:对均值 μ\muμ 求导
假设函数为:
f(μ)=∑i=1n(xi−μ)2
f(\mu) = \sum_{i=1}^n (x_i - \mu)^2
f(μ)=i=1∑n(xi−μ)2
步骤:
- 展开平方项:
f(μ)=∑i=1nxi2−2μ∑i=1nxi+nμ2 f(\mu) = \sum_{i=1}^n x_i^2 - 2\mu \sum_{i=1}^n x_i + n\mu^2 f(μ)=i=1∑nxi2−2μi=1∑nxi+nμ2 - 对 μ\muμ 求导:
∂f∂μ=−2∑i=1nxi+2nμ \frac{\partial f}{\partial \mu} = -2\sum_{i=1}^n x_i + 2n\mu ∂μ∂f=−2i=1∑nxi+2nμ - 令导数为零,求极值:
−2∑i=1nxi+2nμ=0 ⟹ μ=1n∑i=1nxi -2\sum_{i=1}^n x_i + 2n\mu = 0 \implies \mu = \frac{1}{n} \sum_{i=1}^n x_i −2i=1∑nxi+2nμ=0⟹μ=n1i=1∑nxi
示例 2:对标准差 σ\sigmaσ 求导
假设函数为:
f(σ)=∑i=1n(xi−μ)2σ2
f(\sigma) = \sum_{i=1}^n \frac{(x_i - \mu)^2}{\sigma^2}
f(σ)=i=1∑nσ2(xi−μ)2
步骤:
- 将表达式拆解:
f(σ)=1σ2∑i=1n(xi−μ)2 f(\sigma) = \frac{1}{\sigma^2} \sum_{i=1}^n (x_i - \mu)^2 f(σ)=σ21i=1∑n(xi−μ)2 - 对 σ\sigmaσ 求导(注意 σ\sigmaσ 在分母):
∂f∂σ=∂∂σ(Cσ2)=−2Cσ3,其中 C=∑i=1n(xi−μ)2 \frac{\partial f}{\partial \sigma} = \frac{\partial}{\partial \sigma} \left( \frac{C}{\sigma^2} \right) = -\frac{2C}{\sigma^3}, \quad \text{其中 } C = \sum_{i=1}^n (x_i - \mu)^2 ∂σ∂f=∂σ∂(σ2C)=−σ32C,其中 C=i=1∑n(xi−μ)2
5. 常见问题
Q1: 西格玛符号内有复合函数怎么办?
答:使用链式法则,逐层求导。例如:
∑i=1nln(1+xi2)对 xj 求导:
\sum_{i=1}^n \ln(1 + x_i^2) \quad \text{对 } x_j \text{ 求导:}
i=1∑nln(1+xi2)对 xj 求导:
∂∂xj[∑i=1nln(1+xi2)]=2xj1+xj2
\frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n \ln(1 + x_i^2) \right] = \frac{2x_j}{1 + x_j^2}
∂xj∂[i=1∑nln(1+xi2)]=1+xj22xj
Q2: 西格玛符号内有指数或乘积项怎么办?
答:先展开再求导。例如:
∑i=1nexi对 xj 求导:
\sum_{i=1}^n e^{x_i} \quad \text{对 } x_j \text{ 求导:}
i=1∑nexi对 xj 求导:
∂∂xj[∑i=1nexi]=exj
\frac{\partial}{\partial x_j} \left[ \sum_{i=1}^n e^{x_i} \right] = e^{x_j}
∂xj∂[i=1∑nexi]=exj
6. 总结
- 关键点:
- 利用西格玛的线性性质分解表达式。
- 根据变量位置选择求导方式(整体或逐项)。
- 对于复合函数,结合链式法则。
- 应用场景:
- 概率论(最大似然估计、方差计算)。
- 机器学习(损失函数求导,如均方误差)。
- 优化问题(梯度下降法)。



1万+

被折叠的 条评论
为什么被折叠?



