Knowledge Graph Convolutional Networks for Recommender Systems

ABSTRACT

背景

为了减轻基于协作过滤的推荐系统的稀疏性和冷启动问题,研究人员和工程师通常收集用户和项目的属性,并设计精细的算法目的是利用这些额外的属性信息。一般来说,属性不是孤立的,而是相互联系的,形成了一个知识图谱(KG)。

创新点

提出了知识图卷积网络(KGCN),这是一个端到端的框架,通过在KG上挖掘它们的相关属性来有效地捕捉项目间的相关性。
为了自动发现KG的高阶结构信息和语义信息,从知识图谱每个实体的邻居采样作为感受野,然后当计算一个给定实体表示的时候,将邻里信息与偏执值结合起来考虑。感受野可以扩展到多个跳,以模拟高阶邻近信息,并捕获用户潜在的远程兴趣。

INTRODUCTION

基于CF用户和项目交互的缺点

协同过滤(C F)是一种传统的推荐技术,它分配基于用户和项目ID的向量表示,然后通过特定的操作对它们的交互进行建模。例如:内积和神经网络。基于CF的方法通常存在用户-项目交互的稀疏性和冷启动问题。
为了解决这些限制,研究人员通常采用特征丰富的场景,用户和项目的属性被用来补偿稀疏性并提高推荐的性能。

与不含KG的方法相比,将KG纳入推荐的好处

(1)KG项目之间丰富的语义关联有助于探索它们之间的潜在联系,提高推荐结果的准确性
(2)KG中的各种关系有助于合理地扩大用户的兴趣,增加推荐项目的多样性
(3)KG连接用户历史上喜欢的和推荐的项目,从而为推荐系统带来可解释性

KGCN

.设计目标是自动捕捉KG中的高阶结构和语义信息。KGCN的关键思想是在计算KG中给定实体的表示时,聚合和合并带有偏见的邻域信息。
优势:
(1)通过邻域聚合的操作,成功捕获本地邻近结构并存储在每个实体中
(2)邻居对应的权重是由依赖于连接关系和特定用户的分数来加权的,这既表征了KG的语义信息,也表征了用户在关系中的个性化兴趣。
给定实体的邻域定义也可以分层扩展到多跳,以模拟高阶实体依赖关系,并捕获用户潜在的远程兴趣。

Our contribution in this paper are summarized as follows:

(1)提出了知识图卷积网络,一个端到端的框架,探索用户在知识图谱做推荐上的偏好。通过扩展知识图谱中每个实体的每个感受野,KGCN能够捕捉用户的高阶个性化兴趣…
(2)在三个现实世界的推荐场景上进行实验…结果表明KGCN-LS对最先进基线的有效性…
(3)向研究人员发布KGCN的代码和数据集(知识图),以验证报告的结果并进行进一步的研究。代码和数据可在
https://github.com/hwwang55/KGCN. 获得

RELATED WORK

GCN

GCN可分为谱聚类法和非谱聚类法。本文提出一种特殊类型图(即知识图)的非谱聚类方法。

KNOWLEDGE GRAPH CONVOLUTIONAL NETWORKS

知识图感知推荐问题

在许多推荐场景中,一个项目v∈V对应于一个实体e∈ E. 例如,在书籍推荐中,“A Song of Ice and Fire"项目也出现在知识图中(与实体有相同的名字)。

给定用户-项交互矩阵Y以及知识图G,目的是预测用户u是否对他以前没有交互的项目v有潜在的兴趣。目标是学习一个预测函数Knowledge Graph Convolutional Networks for Recommender Systems,其中Knowledge Graph Convolutional Networks for Recommender Systems表示用户u参与项目v的概率,Knowledge Graph Convolutional Networks for Recommender Systems表示函数F的模型参数

KGCN Layer

提出KGCN是为了捕捉知识图中实体间的高阶结构邻近性。
eg.描述单个KGCN层
Knowledge Graph Convolutional Networks for Recommender Systems
使用了一个函数g:通过内积的方式来计算用户和关系之间的分数。ur是用于u和关系r的向量表示。
Knowledge Graph Convolutional Networks for Recommender Systems
描述关系r对用户u的重要性。
例如,一个用户可能有更多潜在的兴趣,在他看过的电影历史记录中,是因为喜欢一个明星而观看电影,而另一个用户可能更关心电影的“类型”。
Knowledge Graph Convolutional Networks for Recommender Systems
Knowledge Graph Convolutional Networks for Recommender Systems
为了表征项目v的拓扑邻近结构,我们计算了v的邻域的线性组合。e是实体e的向量表示。
.当计算实体的邻域表示时,用户关系分数充当个性化过滤器,因为聚集了相对于用户特定分数的偏差邻居。
在现实世界的知识图中,N(e)表示一个实体的邻居集合,它的大小可能在所有实体上都有很大的差异。为了使每个批次的计算模式保持固定和更有效,统一采样固定大小。为每个实体设置一组邻居,而不是使用其完整邻居数据。
Knowledge Graph Convolutional Networks for Recommender Systems
这是一个给定实体的两层感受野的示例。
KGCN层的最后一步是将实体向量表示v及其邻域表示Knowledge Graph Convolutional Networks for Recommender Systems聚合为单个向量。因此这里用到了聚合器。
论文中在KGCN中使用了三种类型的聚合器,比较评估聚合器的性能。
图中蓝色节点和其邻居节点(绿色节点)的向量表示,混合以形成下一次迭代(蓝色节点)的表示形式。

Learning Algorithm

通过一个KGCN层,一个实体的最终向量表示依赖于它本身以及它的近邻节点,我们命名为一阶实体表示。KGCN从一层扩展到多层,以更深入的方式合理地探索用户的潜在兴趣。该技术是直观的:传播每个实体的初始表示(0阶表示)到它的邻居形成一阶实体表示,然后可以重复这个过程,即进一步传播和聚合一阶表示以获得二阶表示.一般来说,一个实体的h阶表示是它自身及其邻居表示的混合。这是KGCN的重要性质。
H表示感受野的最大深度(或等效的聚合迭代次数),由表示向量附加的后缀[h]表示h阶。
Knowledge Graph Convolutional Networks for Recommender Systems
Knowledge Graph Convolutional Networks for Recommender Systems
项目v的向量表示与用户表示u一起输入函数f:Rd×Rd→R,用于预测用户u对项目v概率。

EXPERIMENTS

评估KGCN的三个现实世界的场景:电影,书籍和音乐推荐。

Datasets

MovieLens-20M 是电影推荐中广泛使用的基准数据集,它由MovieLens网站上大约2000万个明确的评级(从1到5)组成。
https://grouplens.org/datasets/movielens/
Book-Crossing包含了Book-Crossing社区100万本书的评分(从0到10)
http://www2.informatik.uni-freiburg.de/~cziegler/BX/
Last.FM包含来自Last.fm在线音乐系统的两千名用户的音乐人收听信息。
https://searchengineland.com/library/bing/bing-satori

CONCLUSIONS

本文为推荐系统提出了知识图卷积网络。KGCN通过选择性地聚合邻域信息,将非谱聚类GCN方法扩展到知识图,能够学习KG的结构信息和语义信息,以及用户的个性化和潜在兴趣。以批处理的方式实现本文的方法,它能够在大型数据集和知识图上操作。通过对真实世界数据集(电影、书籍和音乐推荐)的广泛实验,证明了KGCN的性能始终优于最先进的基线。

相关文章: