股票交易中的Alpha因子研究与应用
1. 数据处理工具与基础操作
在股票交易的Alpha因子研究中,NumPy和pandas是进行自定义因子计算的关键工具。在数据目录中的 00-data-prep.ipynb 笔记本包含了创建各种因子的示例,这些示例使用的数据由GitHub仓库根目录下数据文件夹中的 get_data.py 脚本生成,并以HDF5格式存储,以实现更快的访问。
以下是从原始股票数据计算选定因子的一些关键步骤:
- 数据加载 :使用 pd.IndexSlice 对 pd.MultiIndex 执行切片操作,选择调整后的收盘价,并将列进行透视转换,使DataFrame变为宽格式,其中列是股票代码,行是时间戳。
import pandas as pd
idx = pd.IndexSlice
with pd.HDFStore('../../data/assets.h5') as store:
prices = store['quandl/wiki/prices'].loc[idx['2000':'2018', :],
'adj_close'].unstack('ticker')
prices.info()
- 数据重采样 :为了减少训练时间并测试更长期的策略,将每日数据转换为月末频率。
超级会员免费看
订阅专栏 解锁全文

387

被折叠的 条评论
为什么被折叠?



