-
(一)人工智能选股框架及经典算法简介2017.6.1
-
机器学习的基本流程
数据获取、特征提取、数据转换、模型训练、模型选择、模型预测。

-
数据获取
大量、高质量。
现有接口:雅虎财经、新浪财经、万得终端。
爬虫数据源:新闻网站、财经论坛、自媒体平台、聊天软件
-
特征提取
情报隐藏于信息中。原始数据格式和类型无法直接用于训练。
自然语言识别:Word Embedding将文字转化为数值向量
图像识别:从图片提取出三原色、亮度等
多因子选股:从原始量化数据提取出各种因子
-
数据转换
缺失值的删、补
数据预处理:去极值、标准化、中性化…
降维:避免特征之间相关性的影响,避免维数灾难
-
模型训练
适合模型预判


:人工智能选股框架及经典算法简介&spm=1001.2101.3001.5002&articleId=100517700&d=1&t=3&u=f22ce859fcad4cf39430a4653697e23a)
2139

被折叠的 条评论
为什么被折叠?



