RS推荐系统-DSSM双塔模型

DSSM(Deep Semantic Similarity Model)是一种由微软提出的深度学习模型,用于计算Query和Document的语义相似度。模型包含输入层、表示层和匹配层,其中输入层通过embedding技术如Wordhashing处理数据,表示层通过深度学习得到新的向量表示,匹配层则计算余弦相似度并用softmax进行归一化。DSSM广泛应用于搜索和推荐系统的召回和排序阶段,尤其适合双塔模型架构,便于线上高效召回。

DSSM语义召回

DSSM是一种基于深度神经网络的语义建模方法,这是由微软发表的一篇关于Query和Doc的相似度计算模型的论文提出。

该模型的结构主要由三部分组成(如下图)

输入层

输入层主要负责将Query和Doc的数据转换成embedding向量表达,方法通常有TFIDF,One-Hot等。原论文针对英文输入提出了一种叫做Word hashing的特殊embedding方法来降低字典规模。

表示层

表示层主要是将初始的embedding向量,经过深度学习的方法映射得到Query和Doc的新的embedding向量表达,即上图中的New embeddingNew\ embeddingNew embedding

匹配层

匹配层是比较关键的一步,它将所获取的Query和Doc相互做余弦相似度运算,获得两两之间的语义相似度,注意此处的相似度结果不限输出范围,所以最后需要通过softmax把所有结果归一化,从而得到目标针对点击的正样本拟合P为1,反之拟合P为0。

总结

DSSM方法目前广泛运用于搜索、推荐等领域的找回和排序问题。双塔模型的最大特点就是user侧和item侧是两个独立的子网络,两个塔可以各自缓存,线上召回时只需要取出缓存中的向量做相似度计算即可。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Mr.Wiggles

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值