读论文《Cross-domain recommendation via user interest alignment》

本文提出了一种名为COAST的新方法,用于跨领域推荐,特别是在部分用户重叠的情况下。COAST通过构建统一的跨域异构图和改进的图卷积网络捕获跨领域相似性。它还利用对比学习和梯度对齐确保用户兴趣的一致性,从而提高推荐性能。实验结果表明,COAST在多个任务上显著优于现有的跨领域推荐算法和单领域推荐方法。

Cross-domain recommendation via user interest alignment

基于用户兴趣的跨领域推荐

[WWW 2023]

摘要

​ 跨领域推荐旨在利用来自多个领域的知识来缓解传统推荐系统中的数据稀疏性和冷启动问题。一种流行的范式是采用重叠的用户表示来建立域连接,从而提高所有场景下的推荐性能。然而,这种方法的一般通过在每个域中分别训练用户嵌入,然后以简单的方式聚合它们,通常忽略用户和项目之间潜在的跨域相似性。此外,考虑到它们的训练目标是面向推荐任务的,而没有特定的正则化,优化的嵌入忽略了用户视图之间的兴趣对齐,甚至违背了用户的原始兴趣分布。为了应对这些挑战,本文提出了一种新的跨领域推荐框架COAST通过感知实体之间的跨领域相似性和对齐用户兴趣来提高双领域推荐性能。

​ 具体而言,首先构建统一的跨域异构图,并重新定义图卷积网络的消息传递机制,以捕获跨域用户和项目的高阶相似性;针对用户兴趣对齐,从两个更细粒度的角度,借助丰富的无监督和语义信号,对跨领域的用户-用户和用户-项目兴趣不变性进行了深入的见解。在两个大型推荐数据集上构建的多个任务上进行了深入实验。大量实验结果表明,COAST的推荐性能明显优于当前最先进的跨领域推荐算法和经典的单领域推荐方法。

关键字

跨领域相似度,兴趣对齐,推荐系统 (Cross-domain similarity, Interest alignment, Recommender system)

1 介绍

​ 为了缓解信息过载,各种知名平台,如Netflix和Amazon部署了推荐系统来捕捉用户的个性化偏好。数据稀疏性和冷启动问题是影响用户兴趣建模精度和效率的重要挑战

​ 为了解决这些问题,研引入了跨域推荐系统(cross-domain recommendation system, CDR),即通过迁移学习技术将知识从信息丰富的推荐场景(源域)迁移到交互稀疏的场景(目标域)。这种定向迁移本质上增强了目标域的知识,并在多个推荐数据集上取得了很好的结果。进一步,有研究人员从事双向跨领域推荐,认为合理的模型结构可以促进源领域和目标领域知识的相互迁移。

例如,用户Jack在网络社区(源域)中搜索和浏览大量与计算机性价比相关的帖子,我们可以同时在网络商城(目标域)中向他推荐各种类型的计算机,反之亦然。这种双重推荐范式不仅可以缓解负迁移现象,还可以通过提升模型在源域的推荐能力来提升目标域上的上限

​ 双跨域推荐的主流分类方法可以分为协同矩阵分解、基于映射的方法、基于图神经网络的方法和重叠实体的表示组合。本文努力突破最后一种范式,其一般做法是在两个领域分别训练用户和项目表示,然后对它们进行特定的聚合(concat, dot, pooling)以进行知识转移。

​ 面临着三个严峻的挑战。

​ 1、这些研究大多在用户完全重叠的显式数据集上进行实验,与现实世界中丰富的隐式内容和部分用户重叠的场景显著不同。

​ 2、在每个领域独立训练实体表示的做法在结构上隔离了用户-项目之间的交互,从而无法感知实体之间的高阶相似性。

​ 3、考虑到面向推荐任务的优化目标,这些工作无法保证跨领域重叠用户兴趣的对齐。

本文认为,没有任何正则化的跨领域实体表示的普通聚合无法在实例层面区分用户的个人偏好,也无法保证用户对物品的兴趣一致,甚至导致用户之间的兴趣冲突。

​ 为了应对这些挑战,本文提出了一种基于用户兴趣对齐的跨域推荐方法COAST(

Cross domain recOmmendation viA uSer inTerest alignment),旨在改进具有部分用户重叠的跨域推荐,如图1(b)所示。与以往研究不同的是,我们从丰富的内容数据(评论、标签、用户/物品简介)中提取足够的特征来形成一个隐式数据集,以捕获更多的反馈。将之前单独训练表示的方法更新为一个统一的跨域异构图以吸收用户和项目的跨域相似性针对跨多个领域重叠的用户兴趣对齐,从用户-用户和用户-项目两个角度获得深入的见解。具体来说,对于用户-用户兴趣对齐,我们认为用户在不同领域的行为是由相同的兴趣分布驱动的,从而鼓励用户的所有视图在K个兴趣表示上具有相似的兴趣分布,如图1(a)所示。这不仅允许模型在实例级别区分用户,而且缓解了同一用户视图之间的利益冲突。对于用户-物品兴趣一致性问题,认为交互物品是对用户兴趣的观察,所有用户视图应该对它们表现出一致的偏好。得益于梯度[10]的丰富语义,采用梯度对齐来鼓励跨视图的高阶投影遵循相同的优化路径。

在这里插入图片描述

[10] Zhiqiang Gao, Shufei Zhang, Kaizhu Huang, Qiufeng Wang, and Chaoliang

Zhong. 2021. Gradient distribution alignment certificates better adversarial

domain adaptation. In Proceedings of the IEEE/CVF International Conference on

Computer Vision. 8937–8946.

本文做出了以下贡献:

1、通过考虑跨领域相似性和用户兴趣对齐,在跨领域推荐方面做了大量工作。该框架在部分用户重叠的基础上进行双重知识迁移,以提高推荐性能。

2、我们不是单独训练实体表示,而是构建统一的跨域异构图,并相应地开发一种新的消息传递机制来捕获实体之间的跨域相似性。

3、我们分别采用对比学习和梯度对齐来约束用户-用户和用户-项目的兴趣对齐,从而增强了视图间的兴趣一致性。

4、将COAST与现实世界中最先进的算法进行了比较,在所有任务上都取得了显著的改进。我们承诺代码和数据集将在验收后发布以供进一步比较

2 相关工作

​ 所提出的框架来自两个研究领域:跨域推荐和对比学习。分别总结了它们的主要研究范式、优缺点以及与研究的密切联系。

2.1 跨域推荐

​ 跨领域推荐致力于探索来自多个领域的数据,以同时提升模型在所有场景下的推荐性能

​ 一个基本的想法是合并跨领域知识的几个约束,以同时分解两个领域中的用户-项目交互矩阵[14,28,39]。这种类型可以扩展到基于矩阵分解的大量单域推荐[31]上,但其性能不如深度学习方法。另一种范式是定制一个映射函数,其优化目标是转换后的冷启动用户表示在目标域中具有良好的泛化性[29,45]。这种范式的效率取决于映射函数的合理性和表示能力,以及是否有足够的重叠实体可用于训练,这限制了模型的泛化能力。第三种范式借助于流行的知识图谱技术[35],构建共享图来表示用户、项目和属性之间的关系,并通过图嵌入学习实体表示[4,20]。尽管这些方法具有良好的图结构提取能力,但其对计算资源的高要求限制了其可扩展性。

​ 最近,利用重叠用户表示和组合的算法是一种趋势,它们的标准做法是学习来自不同领域的实体表示,然后结合重叠实体表示来丰富每个领域的知识[9,44]。显然,缺乏跨领域相似度和粗糙的组合方式限制了它们的推荐性能。

2.2 对比学习

Contrastive Learning

​ 对比学习强调学习一个实例的不同视图之间的共同特征,目的是实现实例级的判别。与监督学习相比,它以自监督的方式学习。

​ 早期的对比学习架构倾向于使用大批量来聚集足够多的负例,但此类方法的可扩展性受到GPU内存[3]的限制。现有体系结构都深入探讨了使用特定指标来衡量样本相似性,即鼓励同一实体的不同视图在投影空间中更接近,反之亦然。最近,Caron等人的[2]放弃了传统的正负例比较,从聚类的角度对对比学习展开了新的探索。

​ 受对比学习的启发,我们打算在实例级区分用户表示。特别是,遵循聚类的思想,我们鼓励同一用户的不同观点聚集到同一个兴趣中心,从而产生更好的用户兴趣表示。

3 提出的方法

​ 阐述一般CDR问题的定义,然后概述了本文的框架,最后详细介绍了子模块和优化方法。

3.1 问题定义

​ 本文考虑了一个一般的CDR场景,有两个域S(源)和T(目标),其中前者包含丰富和信息的交互,而后者相对稀疏。


s o u r c e   d o m a i n   :   D S = ( U S , V S , E S , X S ) t a r g e t   d o m a i n   :   D T = ( U T , V T , E T , X T ) w h e r e   U , V , E , X 代表用户集、项集和边集、属性集 特别是,用户设置 U S 和 U T 包含重叠的用户子集 U o 。 source\ domain\ : \ D_S = (U_S,V_S,E_S,X_S)\\ target \ domain\ : \ D_T=(U_T,V_T,E_T,X_T)\\ where\ U,V,E,X 代表用户集、项集和边集、属性集\\ 特别是,用户设置U_S和U_T包含重叠的用户子集U_o。 source domain : DS=(US,VS,ES,XS)target domain : DT=(UT,VT,ET,XT)where U,V,E,X代表用户集、项集和边集、属性集特别是,用户设置USUT包含重叠的用户子集Uo
​ 用户集可以重新定义为
U S = { U s , U o } , U T = { U t , U o } U_S=\{U_s,U_o\},U_T=\{U_t,U_o\} US={ Us,Uo},UT={ Ut,Uo}
其中U𝑠和U𝑡是两个域中不重叠/不同的用户集

为了简化说明,我们进一步引入两个二进制矩阵来存储用户-项目交互,
A S = { 0 , 1 } ∣ U S ∣ × ∣ V S ∣ A T = { 0 , 1 } ∣ U T ∣ × ∣ V T ∣ 每个领域中的元素 A i j 表示用户 u i ∈ U , 项目 v j ∈ V 在边集 E 中是否存在交互关系 A_S=\{0,1\}^{|U_S| \times |V_S|}\\ A_T=\{0,1\}^{|U_T| \times |V_T|}\\ 每个领域中的元素A_{ij}表示用户u_i \in U,项目v_j \in V 在边集E中是否存在 交互关系 AS={ 0,1}US×VSAT={ 0,1}UT×VT每个领域中的元素Aij表示用户uiU,项目vjV在边集E中是否存在交互关系
双跨领域推荐的定义如下:

鉴于观察到的S和T的交互和内容, dual CDR旨在利用重叠用户的知识转移来提高两个领域的推荐性能。
给定 A S , A T , X S , X T , 目标:在域 S 和域 T 中分别推荐  v i ∈ V S , v j ∈ V T 给定A_S,A_T,X_S,X_T,\\目标:在域S和域T中分别推荐 \ v_i \in V_S,v_j \in V_T 给定AS,AT,XS,XT,目标:在域S和域T中分别推荐 viVS,vjV

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

请站在我身后

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值