空间环境数据的机器学习与径向基函数神经网络
1. MLP模型在空间环境数据中的应用
在空间环境数据的机器学习中,多层感知器(MLP)模型是一种常用的工具。这里我们通过对风速相关数据的分析,来探讨MLP模型的性能。
1.1 模型误差统计
以下是MLP [26 - 20 - 20 - 3]模型在三种输出(均值、最大值和方向)下的误差统计:
| 模型情况 | RMSE(训练) | RMSE(验证) | R0(训练) | R0(验证) |
| — | — | — | — | — |
| 过拟合 | 0.0/0.0/0.0 | 3.6/8.5/172.9 | 1.0/1.0/1.0 | 0.47/0.23/0.02 |
| 注入噪声 | 1.4/2.8/45.8 | 1.5/2.9/52.5 | 0.83/0.86/0.61 | 0.77/0.74/0.55 |
从表中可以看出,在注入噪声的情况下,训练误差会在一些较低的值附近波动,因为噪声注入是动态的,误差不会降为零。而验证误差相对较低。
1.2 避免过拟合的方法
除了噪声注入,还可以使用提前停止的方法来避免过拟合。当将保留的31个样本数据集作为测试集,并在大约第50次迭代的早期阶段,由于测试误差较小而停止训练(标准训练,不注入噪声),也可以获得合理的性能。
1.3 预测结果分析
通过预测地图和散点图可以更直观地比较过拟合模型和注入噪声的最优模型的性能。最优模型能够重现与地形相关的风速依赖模式,如大山谷中心、山脊处风速增加,山谷迎风面和背风面风速差异等;而过拟合模型主要产生噪声。
超级会员免费看
订阅专栏 解锁全文

554

被折叠的 条评论
为什么被折叠?



