一. 已有模型的缺点
以往的模型中用户的意图大都是根据其历史点击行为进行提取。会有以下缺点:
- 用户行为稀疏问题(behavior sparsity):当用户行为稀疏时很难提取其实时意图。
- 弱泛化问题(weak generalization) ,用户很难跳出他们的特定历史行为来进行兴趣探索
二. GIN的创新点
- 提出基于共现商品图(co-occurrence commodity graph)的图意图网络(GIN)挖掘用户意图。 首次提出了对图学习和CTR预测任务的端到端赞助搜索模型。
- 通过采用多层图扩散,GIN丰富了用户行为以解决行为稀疏性问题。 通过引入商品的共现关系以探索潜在的偏好,还可以缓解弱泛化问题。
三. GIN具体实现
\qquad
\qquad
a表示行为序列在图中多层分散;b表示多层分散结果利用注意力机制聚合。
3.1 图构造
根据相似性将行为序列分为会话以防止跨不同会话的边构造。每个会话构造出一个无方向的商品共现图。节点类型代表商品,边的权重代表共现次数。
3.2 意图扩散与聚集
首先,分散用户点击序列的每个商品去探索历史点击商品和当前点击的共现关系;
然后,利用AGGREGATE算法从最外层开始一层一层地聚合商品;
最后,通过注意力机制选择用户点击序列中的商品(commodities)增加其权重。获得包含用户潜在偏好的多样化向量。