Knowledge Graph Convolutional Networks for Recommender Systems

ABSTRACT

背景

为了减轻基于协作过滤的推荐系统的稀疏性和冷启动问题，研究人员和工程师通常收集用户和项目的属性，并设计精细的算法目的是利用这些额外的属性信息。一般来说，属性不是孤立的，而是相互联系的，形成了一个知识图谱（KG）。

创新点

提出了知识图卷积网络（KGCN），这是一个端到端的框架，通过在KG上挖掘它们的相关属性来有效地捕捉项目间的相关性。
为了自动发现KG的高阶结构信息和语义信息，从知识图谱每个实体的邻居采样作为感受野，然后当计算一个给定实体表示的时候，将邻里信息与偏执值结合起来考虑。感受野可以扩展到多个跳，以模拟高阶邻近信息，并捕获用户潜在的远程兴趣。

INTRODUCTION

基于CF用户和项目交互的缺点

协同过滤（C F）是一种传统的推荐技术，它分配基于用户和项目ID的向量表示，然后通过特定的操作对它们的交互进行建模。例如：内积和神经网络。基于CF的方法通常存在用户-项目交互的稀疏性和冷启动问题。
为了解决这些限制，研究人员通常采用特征丰富的场景，用户和项目的属性被用来补偿稀疏性并提高推荐的性能。

与不含KG的方法相比，将KG纳入推荐的好处

（1）KG项目之间丰富的语义关联有助于探索它们之间的潜在联系，提高推荐结果的准确性
（2）KG中的各种关系有助于合理地扩大用户的兴趣，增加推荐项目的多样性
（3）KG连接用户历史上喜欢的和推荐的项目，从而为推荐系统带来可解释性

KGCN

.设计目标是自动捕捉KG中的高阶结构和语义信息。KGCN的关键思想是在计算KG中给定实体的表示时，聚合和合并带有偏见的邻域信息。
优势：
（1）通过邻域聚合的操作，成功捕获本地邻近结构并存储在每个实体中
（2）邻居对应的权重是由依赖于连接关系和特定用户的分数来加权的，这既表征了KG的语义信息，也表征了用户在关系中的个性化兴趣。
给定实体的邻域定义也可以分层扩展到多跳，以模拟高阶实体依赖关系，并捕获用户潜在的远程兴趣。

Our contribution in this paper are summarized as follows:

（1）提出了知识图卷积网络，一个端到端的框架，探索用户在知识图谱做推荐上的偏好。通过扩展知识图谱中每个实体的每个感受野，KGCN能够捕捉用户的高阶个性化兴趣…
（2）在三个现实世界的推荐场景上进行实验…结果表明KGCN-LS对最先进基线的有效性…
（3）向研究人员发布KGCN的代码和数据集（知识图），以验证报告的结果并进行进一步的研究。代码和数据可在
https://github.com/hwwang55/KGCN. 获得

RELATED WORK

GCN

GCN可分为谱聚类法和非谱聚类法。本文提出一种特殊类型图（即知识图）的非谱聚类方法。

KNOWLEDGE GRAPH CONVOLUTIONAL NETWORKS

知识图感知推荐问题

在许多推荐场景中，一个项目v∈V对应于一个实体e∈ E. 例如，在书籍推荐中，“A Song of Ice and Fire"项目也出现在知识图中（与实体有相同的名字）。

给定用户-项交互矩阵Y以及知识图G，目的是预测用户u是否对他以前没有交互的项目v有潜在的兴趣。目标是学习一个预测函数 Knowledge Graph Convolutional Networks for Recommender Systems ，其中表示用户u参与项目v的概率，表示函数F的模型参数

KGCN Layer

提出KGCN是为了捕捉知识图中实体间的高阶结构邻近性。
eg.描述单个KGCN层
Knowledge Graph Convolutional Networks for Recommender Systems
使用了一个函数g：通过内积的方式来计算用户和关系之间的分数。u，r是用于u和关系r的向量表示。

描述关系r对用户u的重要性。
例如，一个用户可能有更多潜在的兴趣，在他看过的电影历史记录中，是因为喜欢一个明星而观看电影，而另一个用户可能更关心电影的“类型”。
Knowledge Graph Convolutional Networks for Recommender Systems

为了表征项目v的拓扑邻近结构，我们计算了v的邻域的线性组合。e是实体e的向量表示。
.当计算实体的邻域表示时，用户关系分数充当个性化过滤器，因为聚集了相对于用户特定分数的偏差邻居。
在现实世界的知识图中，N（e）表示一个实体的邻居集合，它的大小可能在所有实体上都有很大的差异。为了使每个批次的计算模式保持固定和更有效，统一采样固定大小。为每个实体设置一组邻居，而不是使用其完整邻居数据。
Knowledge Graph Convolutional Networks for Recommender Systems
这是一个给定实体的两层感受野的示例。
KGCN层的最后一步是将实体向量表示v及其邻域表示聚合为单个向量。因此这里用到了聚合器。
论文中在KGCN中使用了三种类型的聚合器，比较评估聚合器的性能。
图中蓝色节点和其邻居节点（绿色节点）的向量表示，混合以形成下一次迭代（蓝色节点）的表示形式。

Learning Algorithm

通过一个KGCN层，一个实体的最终向量表示依赖于它本身以及它的近邻节点，我们命名为一阶实体表示。KGCN从一层扩展到多层，以更深入的方式合理地探索用户的潜在兴趣。该技术是直观的：传播每个实体的初始表示（0阶表示）到它的邻居形成一阶实体表示，然后可以重复这个过程，即进一步传播和聚合一阶表示以获得二阶表示.一般来说，一个实体的h阶表示是它自身及其邻居表示的混合。这是KGCN的重要性质。
H表示感受野的最大深度（或等效的聚合迭代次数），由表示向量附加的后缀[h]表示h阶。
Knowledge Graph Convolutional Networks for Recommender Systems

项目v的向量表示与用户表示u一起输入函数f：Rd×Rd→R，用于预测用户u对项目v概率。

EXPERIMENTS

评估KGCN的三个现实世界的场景：电影，书籍和音乐推荐。

Datasets

MovieLens-20M 是电影推荐中广泛使用的基准数据集，它由MovieLens网站上大约2000万个明确的评级（从1到5）组成。
https://grouplens.org/datasets/movielens/
Book-Crossing包含了Book-Crossing社区100万本书的评分（从0到10）
http://www2.informatik.uni-freiburg.de/~cziegler/BX/
Last.FM包含来自Last.fm在线音乐系统的两千名用户的音乐人收听信息。
https://searchengineland.com/library/bing/bing-satori

CONCLUSIONS

本文为推荐系统提出了知识图卷积网络。KGCN通过选择性地聚合邻域信息，将非谱聚类GCN方法扩展到知识图，能够学习KG的结构信息和语义信息，以及用户的个性化和潜在兴趣。以批处理的方式实现本文的方法，它能够在大型数据集和知识图上操作。通过对真实世界数据集（电影、书籍和音乐推荐）的广泛实验，证明了KGCN的性能始终优于最先进的基线。