推荐系统——概述

3 min
NOTE

这是 b 站王树森推荐系统课程的笔记,记录到了重排,之后的物品冷启动和提分部分我没有学,所以也没有笔记。索引如下:


这部分偏导论,随便记录了一点

基本概念

  • 用户行为:点击、点赞、收藏、转发
  • 消费指标:点击率 (click rate)、交互率 (engagement rate)
  • 北极星指标:用户规模、消费、发布
  • 实验流程:离线实验、AB测试、推全

链路

  • 召回(retrieval):快速从海量数据中取回几千个用户可能感兴趣的物品。
  • 粗排:用小规模的模型的神经网络给召回的物品打分,然后做截断,选出分数最高的几百个物品。
  • 精排:用大规模神经网络给粗排选中的几百个物品打分,可以做截断,也可以不做截断。
  • 重排:对精排结果做多样性抽样,得到几十个物品,然后用规则调整物品的排序。

A/B 测试

分桶

分层实验:召回、粗排、精排、重排、用户界面、广告……

同层互斥、不同层正交

同类策略互斥:天然互斥(不同结构);效果相互增强或者相互抵消 不同类型策略:通常不会相互干扰,可以作为正交的两层


Holdout 机制

同一时间有很多实验,可以留 10% 的用户作为 holdout 桶,只用剩下的 90% 用户做实验,结果和 holdout 桶进行对比,就可以验证实验是否有效。

还有其他 holdout 的方法,比如每个用户留 k 个行为、根据时间顺序划分训练/测试等

每个考核周期结束后,重置 holdout 桶


实验推全

新建一个推全层,和其他层正交

从小流量实验到推全后,diff 会上升(如线性提升),可能需要做归一


反转实验

有指标会有滞后性,需要长期观测;但公司需要尽可能快地推全上线(因为可以腾出桶给其他实验用,以及后续开发)

解决方法是在推全的新层中开一个旧策略的桶,长期观测实验指标的 diff