NOTE这是 b 站王树森推荐系统课程的笔记,记录到了重排,之后的物品冷启动和提分部分我没有学,所以也没有笔记。索引如下:
用户最近的 次交互的物品 ID(点击的最近 个,点赞的、收藏的……),embedding 之后求平均/求和/attention 操作等
在 LastN 特征中,用加权平均代替平均(即注意力机制),LastN 向量作为 key 和 value,候选物品向量作为 query
缺点是 不能很大,否则计算成本太高,会导致模型过分关注短期兴趣
相较于 SIM 模型,保持一个长期行为记录,共 项,每次计算 LastN 特征时,先进行一步筛选(TopK),然后再使用 DIN 模型。筛选可以使用硬筛选(选择相同类目的物品等)和软筛选(近似 近邻查找等)。应用 DIN 模型前,需要加入时间信息。
时间信息?就是 transformer 里面的位置 embedding!