【每日视野】2016-08-26

原创于 2016-08-29 15:30:14 发布 · 893 阅读

·

0

·

本内容遵循CC 4.0 BY-SA版权协议

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

标签

#xgboost #fm

日志专栏收录该内容

6 篇文章

订阅专栏

本文探讨了FM（Factorization Machine）与FFM（Field-aware Factorization Machine）的工作原理及其优势。FM通过引入交叉项改进了传统的LR模型，并能够对未见数据进行合理预测。FFM进一步引入了域的概念，限制了特征之间的交互。文中还提到了FM与LR的结合方式，类似于GBDT与LR的融合。

fm， ffm

fm相对于一般的lr，它的好处在于
1. 引入了交叉项；
2. 对一些从未见过的例子也能做出预测。比如：以前只有女性看化妆品的例子，现在要求男性看化妆品的概率。理论上讲，如果完全拟合，两个隐向量乘出来得到的值应该也是0，但是由于正则项的存在，就能得到一个合理的值。

ffm就是加入了Field(域)的概念，同一个域内的特征不会互相叉乘。

fm的隐向量如果乘出来系数很高，那么可以让lr去加入这个交叉特征，这有点类似于GBDT与LR的融合。

附两个介绍FM的文章链接
http://tech.meituan.com/deep-understanding-of-ffm-principles-and-practices.html
http://www.52caml.com/head_first_ml/ml-chapter1-regression-family/

xgboost

xgboost的有个参数是min_child_weight, 那么它所谓的hessian值究竟意义何在？
每次更新的权重是和hessian值有关，但是叶子上的score并不等于hessian值，我的理解是这里应该是min_child_weight = score * num_of_samples，所以这里还没想明白。

附相关链接
1. 另一个人也问了hessian的问题
2. chentq的ppt
3. xgboost 浅入浅出
4. xgboost调参指南

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。