推荐系统——行为序列

2 min
NOTE

这是 b 站王树森推荐系统课程的笔记,记录到了重排,之后的物品冷启动和提分部分我没有学,所以也没有笔记。索引如下:


LastN 特征

用户最近的 nn 次交互的物品 ID(点击的最近 NN 个,点赞的、收藏的……),embedding 之后求平均/求和/attention 操作等

DIN 模型

在 LastN 特征中,用加权平均代替平均(即注意力机制),LastN 向量作为 key 和 value,候选物品向量作为 query

缺点是 NN 不能很大,否则计算成本太高,会导致模型过分关注短期兴趣

SIM 模型

相较于 SIM 模型,保持一个长期行为记录,共 nn 项,每次计算 LastN 特征时,先进行一步筛选(TopK),然后再使用 DIN 模型。筛选可以使用硬筛选(选择相同类目的物品等)和软筛选(近似 kk 近邻查找等)。应用 DIN 模型前,需要加入时间信息。

时间信息?就是 transformer 里面的位置 embedding!