SDM简述
CIKM ’19, 阿里巴巴的一项推荐工作。
贡献
在已有的 sequence-based 工作基础上,解决两个问题:
- session 中存在 multiple interest tendencies
- long-term behaviors are various and complex. 为此设计 long-short term gated 作长短期兴趣融合
网络结构

user profile preference
使用 eu=concat({eup∣p∈P}) 表达用户向量。where P={age,gender,life_stage}.
short-term preference
- 使用 ei=concat({eif∣f∈F}) 表达商品向量。where F={id,cate_first_level,cate_leaf_level,shop,brand}. due to the sparsity caused by the large-scale items, encoding items only by item_id is far from satisfaction.
- 送往LSTM,得到 [h1u,...,htu]
- 送往self_att, 得到[h^1u,...,h^tu]
- user_attention,权重由softmax(<eu,hiu>)得到,不再像self_att那样先线性投影 Q,K 空间再点积相乘。该步得到短期偏好stu
long-term preference
-
Lu={Lfu∣f∈F},lku∈Lfu,lku∈Rd, F 为field的集合,同上。Lfu 为某个field的偏好list,同一field共享embedding 矩阵。
-
zfu=user_attention(eu,Lfu)∈Rd , 起到 pooling 作用。
-
zu=concat({zfu∣f∈F}),得到长期偏好 pu=tanh(Wzu+b).
long-short term fusion gate
“we elaborately design a gated neural network”,Gu=σ(W1eu+W2stu+W3pu+b),Gu∈Rd,该gate用来控制短期兴趣的占比。
⊙为element-wise multiplication,进一步得到otu=Gu⊙stu+(1−Gu)⊙pu用于召回。
candidate matching
score(itemi)=<otu,vi>,score(itemi)∈R,vi∈V,V是另一个item emb矩阵。
paper对比实验
我的讨论
参考
- paper,SDM