图神经网络的扩展与图分类的表达能力
1. 图神经网络的扩展:GraphSAGE
GraphSAGE是一个灵活的框架,可用于处理大规模图数据。它有两个核心组件:邻居采样算法和三种聚合算子。邻居采样是GraphSAGE能够在短时间内处理大型图的关键,同时也使其具备归纳学习的能力,能够将预测推广到未见过的节点和图。
PinSAGE和Uber Eats的GraphSAGE版本是推荐系统,它们将无监督设置与不同的损失函数相结合,目标是为每个用户对最相关的实体(如食物、餐厅、图钉等)进行排名,为此实现了一种考虑嵌入对的最大间隔排名损失。
如果需要扩展图神经网络(GNN),还有其他解决方案:
- Cluster - GCN :以不同的方式创建小批量。它将图划分为孤立的社区,然后将这些社区作为独立的图进行处理,但这可能会对所得嵌入的质量产生负面影响。
- 简化GNN :可以减少训练和推理时间。具体做法是丢弃非线性激活函数,然后使用线性代数将线性层压缩为一次矩阵乘法。这种简化版本在小数据集上的准确性不如真正的GNN,但对于大型图(如Twitter)非常高效。
2. 定义图分类的表达能力
GNN的目标是产生尽可能好的节点嵌入,这意味着不同的节点应该有不同的嵌入,相似的节点应该有相似的嵌入。然而,如何判断两个节点是否相似是一个复杂的问题,这涉及到图同构问题。
在图论中,两个图如果具有相同的连接,只是节点的排列不同,则它们是同构的。1968年,Weisfeiler和Lehman提出了一种解决此问题的高效算法,即WL测试。
WL
超级会员免费看
订阅专栏 解锁全文

64

被折叠的 条评论
为什么被折叠?



