NOTE这是 b 站王树森推荐系统课程的笔记,记录到了重排,之后的物品冷启动和提分部分我没有学,所以也没有笔记。索引如下:
这部分偏导论,随便记录了一点
分桶
分层实验:召回、粗排、精排、重排、用户界面、广告……
同层互斥、不同层正交
同类策略互斥:天然互斥(不同结构);效果相互增强或者相互抵消 不同类型策略:通常不会相互干扰,可以作为正交的两层
Holdout 机制
同一时间有很多实验,可以留 10% 的用户作为 holdout 桶,只用剩下的 90% 用户做实验,结果和 holdout 桶进行对比,就可以验证实验是否有效。
还有其他 holdout 的方法,比如每个用户留 k 个行为、根据时间顺序划分训练/测试等
每个考核周期结束后,重置 holdout 桶
实验推全
新建一个推全层,和其他层正交
从小流量实验到推全后,diff 会上升(如线性提升),可能需要做归一
反转实验
有指标会有滞后性,需要长期观测;但公司需要尽可能快地推全上线(因为可以腾出桶给其他实验用,以及后续开发)
解决方法是在推全的新层中开一个旧策略的桶,长期观测实验指标的 diff