推荐系统之概率矩阵分解的详细推导过程(Probabilistic Matrix Factorization,PMF)

本文深入探讨了概率矩阵分解(PMF)模型,这是一种在推荐系统领域广泛应用的技术。PMF通过分解用户-物品评分矩阵来预测未知评分,适用于数据稀疏的情况。文章详细介绍了模型的基本原理、数学推导过程及关键参数。

原文地址:http://www.datalearner.com/blog/1051507818535686
论文地址:http://www.datalearner.com/conference_paper_content?paper_id=400002782&paper_name=Probabilistic%20Matrix%20Factorization.&type=0

概率矩阵分解是目前在推荐领域很流行的模型。本文主要是推导论文
Mnih A, Salakhutdinov R R. Probabilistic matrix factorization[C]//Advances in neural information processing systems. 2008: 1257-1264. 中的结果。

传统的协同过滤方法既不能处理大数据量的推荐,也不能处理只有很少评分的用户。这篇论文提出了著名的概率矩阵分解的方法来解决这个问题。概率矩阵分解的思想是以中线性因子模型,它使用与用户相关的系数,将用户的偏好建模成一个一系列向量的线性组合。具体如下:

假设有 M 个电影和 N 个用户。 R_ij 表示第 i 个用户对电影 j 的评分。假设隐变量的维度是 D ,那么我们希望将评分矩阵 R 分解成两个矩阵,即用户隐矩阵 URD×N ,和电影隐矩阵 VRD×M 。其中, U_i 表示第 i 个用户的隐向量, V_j 表示第 j 个电影的隐向量。假设评分是一个有高斯噪音的正态分布。那么我们的评分应当有如下公式:

p(R|U,V,σ2)=i=1Nj=1M[N(Rij|UTiVj,σ2)]Iij

这里的 N(R_ij|U_iTV_j,σ2) 是指高斯分布的概率密度函数。 I_ij 是指示函数,表明如果用户 i 评论了电影 j ,那么其结果等与1,否则就是0。因此,上面的结果就是所有已经被评论的电影得分的乘积,也就是似然函数了。

我们给每个用户和电影的隐向量(特征向量)一个均值为0的高斯先验。有:

p(U|σ2U)=i=1NN
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值