金融时间序列的分数阶差分：一种保留记忆的平稳化方法

原创

于 2026-06-23 10:21:10 发布 · 242 阅读

·

8

·

标签

#金融

金融时间序列的分数阶差分：一种保留记忆的平稳化方法

基于 Marcos Lopez de Prado《金融机器学习进阶》第5章

1. 核心困境：记忆与平稳性的权衡

在金融机器学习中，原始资产价格序列 $P_t$ 通常是非平稳（Non-stationary）的——具有随机游走特性，均值和方差随时间漂移，不满足大多数统计/ML模型对输入数据平稳性的假设。传统解决方案是对价格做一次差分得到收益率：
$r_t =(1-L)P_t = P_t - P_{t-1}$
其中 $L$ 是滞后算子（Backshift Operator）， $LP_t = P_{t-1}$ 。

d=0（原始价格）：完全保留长期记忆（Long Memory）和趋势信息，但非平稳，模型难以泛化。
d=1（一阶差分/收益率）：近似平稳，但完全丢失了水平（Level）信息——收益率只依赖前一个价格，所有更早的历史被"切断"，模型出现"记忆丧失（Amnesia）"，损失了均值回归、趋势跟踪等预测信号，丢失了价格序列中潜在的、有价值的长期记忆结构（如市场状态的“惯性”）。

Marcos Lopez de Prado 提出：分数阶差分将差分阶数从整数推广到实数 $\in [0,1]$ ，在"达到平稳性"和"保留记忆性"之间取得连续可调的平衡。

注1：在金融数据语境下，**“非平稳（Non-stationary）”可以通俗理解为：**数据的基本统计特性（均值、方差、自相关性）会随时间发生变化，而不是稳定在一个固定水平附近。

注2：单位根（Unit Root）：统计学里用来严格描述“非平稳”原因的一个概念。存在单位根 = 变量有“记忆过去所有冲击”的特性，过去的随机扰动会永久影响未来值，导致序列不会围绕固定均值波动 → 非平稳。

2. 分数阶差分的数学原理

德普拉多提出的解决方案是使用分数阶差分算子。它允许我们用一个非整数 $d$ 进行差分，从而在“完全保留记忆”和“完全平稳”之间找到一个连续的光谱。

2.1 数学定义

对于一个时间序列 $X$ ，其 $d$ 阶差分 $∇dX\nabla^d X$ 可以通过二项式展开表示为：
$\nabla^d X_t = \sum_{k=0}^{\infty} \omega_k X_{t-k}$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。