【技术解析】Diff-POI：基于扩散模型的兴趣点推荐新范式

最新推荐文章于 2026-06-24 19:11:55 发布

原创

最新推荐文章于 2026-06-24 19:11:55 发布 · 409 阅读

标签

#POI推荐 #扩散模型 #推荐系统 #人工智能

1. 从“猜你喜欢”到“带你去探索”：POI推荐为什么需要新思路？

如果你用过地图或者点评软件，会发现一个挺有意思的现象：它给你推荐的餐厅、咖啡馆，是不是总在你常去的那个商圈打转？你住城东，它就拼命给你推城东的店；你上次去了趟城南，接下来几天它可能就逮着城南的店推。这背后的技术，就是我们常说的“兴趣点推荐”。

传统的推荐模型，就像个记忆力超群但有点“宅”的朋友。它把你过去去过的地方（POI）都记在小本本上，然后通过复杂的数学计算，找出跟你历史行为最像的那些地方推荐给你。这种方法，技术上叫“聚合”或“归纳”。它很擅长服务那些生活轨迹固定的“保守型”用户，比如每天两点一线的上班族。模型算一算，发现你80%的签到都在公司和家附近，那它自然就把推荐范围锁定在这片区域，准确率往往还挺高。

但问题来了。生活不是只有一种模式。想想你出去旅游的时候，或者周末想探索城市新角落的时候，你希望App给你推荐什么？肯定不是酒店隔壁那条你已经逛腻了的商业街，而是这个城市里你可能从未涉足、但会惊艳到你的宝藏地点。这时候，传统模型的“宅”属性就成了致命伤——它缺乏探索的能力。因为它只会基于“已有”的数据做归纳，而无法对“未知”但合理的区域进行有依据的“生成”或“推测”。这就好比让一个只研究过古典音乐的AI去推荐你可能会喜欢的电子音乐，它可能完全无从下手。

这就是POI推荐领域长期以来的一个核心挑战：如何平衡“利用已知历史”和“探索未知可能”。用户的空间偏好不是静态的，它会随着时间、情境、心情动态变化。一个理想的推荐系统，应该既能读懂你过去的习惯，又能嗅到你未来可能想尝试的新方向。

近几年在AI图像生成领域大放异彩的扩散模型，恰恰提供了一种全新的解题思路。它最擅长的，就是从一片随机噪声中，一步步“去噪”，最终生成一张全新的、高质量的图片。这个过程，本质上是在学习并“生成”一个复杂的数据分布。如果把“用户未来可能感兴趣的地理区域”也看作一个需要被“生成”的复杂分布，那么扩散模型这套“先破坏再重建”的哲学，是不是就能派上用场了呢？

Diff-POI这篇论文，正是将扩散模型的生成能力，首次系统性地引入到POI推荐任务中。它不再仅仅“聚合”历史，而是尝试“采样”出用户潜在的空间偏好分布。简单说，它不再只回答“你以前喜欢什么”，而是试图回答“以你过去的习惯为起点，你下一步可能会对哪些‘新’地方产生兴趣？”这个模型的出现，标志着POI推荐从“记忆与匹配”向“想象与生成”范式的一次重要转变。接下来，我们就一起拆解这套新范式是如何工作的。

2. 传统方法为何“画地为牢”？深入理解空间探索的难题

要理解Diff-POI的创新点，我们得先看看老方法们到底卡在了哪里。你会发现，很多问题不是工程师们没想到，而是受限于模型本身的设计哲学。

2.1 主流技术路线及其“舒适区”

早期的POI推荐模型，比如基于矩阵分解（MF）的方法，把用户和地点都映射成一个数字向量（嵌入），通过向量间的点积大小来判断喜好程度。这就像给每个人和每个地方贴上一堆性格标签，匹配度高的就推荐。但这种方法完全忽略了访问的顺序和地理关系——你去完健身房后想找健康餐，和你逛完街后想找甜品店，显然是不同的需求。

于是，序列模型登场了，比如RNN、LSTM，以及后来的Transformer。它们把用户的访问记录看作一个句子（“家 -> 公司 -> 健身房 -> 餐厅”），试图捕捉这种时序规律。同时，为了融入空间信息，研究者们发明了ST-RNN这样的模型，在RNN里加入了时间间隔和地理距离的权重。这已经是一大进步，模型能知道“你通常在公司附近呆8小时”和“你从家到健身房通常开车20分钟”这些模式。

更进一步，图神经网络（GNN）被广泛应用。因为用户、地点之间的关系天然就是图结构。比如，可以构建一个“转移图”，节点是地点，边代表用户从一个地点去到另一个地点的频率。通过图卷积，一个地点的信息可以传播给它的邻居。还有一种常见的做法是构建“距离图”，把物理上邻近的地点连接起来，让模型显式地学习地理邻近性。像STGCN、GSTN等模型都是这方面的佼佼者。

2.2 “聚合”范式的天生缺陷：偏向与短视

无论上述方法如何演变，其核心逻辑依然是“聚合”。它们通过加权平均、注意力机制、图传播等方式，把用户历史访问过的地点特征，聚合成一个或一组向量，来代表用户的偏好。这个向量，我习惯称之为“用户历史足迹的浓缩精华”。

这种做法导致两个根深蒂固的问题：

推荐偏向性（Bias towards Visited Regions）：模型聚合出的用户向量，其重心必然落在历史访问点的空间分布范围内。用它去匹配候选地点，那些远离这个“历史重心”的地点，即使本身很有吸引力，得分也会天然偏低。这就导致了系统永远在推荐用户“熟悉区域”的相似品，难以跳出既有圈子。
无法建模动态空间偏移（Dynamic Spatial Shift）：用户的空间偏好是会转移的。一个典型的例子是通勤者：工作日他的重心在公司和家构成的轴线上，但周末他可能想去城市另一头的湖边或山上。传统聚合模型生成的静态向量，无法刻画这种“从轴线区域向湖边区域”的平滑、连续的偏好转移过程。它要么死守轴线，要么只能生硬地切换。

你可以把这个过程想象成用过去一年的天气数据来预测明天的天气。如果只用“聚合”（比如计算平均温度、最常见风向），你很可能预测出一个温和但毫无特色的天气，而完全错过了