推荐系统——概述

2025-07-13 3 min

这是 b 站王树森推荐系统课程的笔记，记录到了重排，之后的物品冷启动和提分部分我没有学，所以也没有笔记。索引如下：
推荐系统——概述
推荐系统——召回
推荐系统——排序
推荐系统——特征交叉
推荐系统——行为序列
推荐系统——重排

这部分偏导论，随便记录了一点

基本概念

分桶

分层实验：召回、粗排、精排、重排、用户界面、广告……

同层互斥、不同层正交

同类策略互斥：天然互斥（不同结构）；效果相互增强或者相互抵消不同类型策略：通常不会相互干扰，可以作为正交的两层

Holdout 机制

同一时间有很多实验，可以留 10% 的用户作为 holdout 桶，只用剩下的 90% 用户做实验，结果和 holdout 桶进行对比，就可以验证实验是否有效。

还有其他 holdout 的方法，比如每个用户留 k 个行为、根据时间顺序划分训练/测试等

每个考核周期结束后，重置 holdout 桶

实验推全

新建一个推全层，和其他层正交

从小流量实验到推全后，diff 会上升（如线性提升），可能需要做归一

反转实验

有指标会有滞后性，需要长期观测；但公司需要尽可能快地推全上线（因为可以腾出桶给其他实验用，以及后续开发）

解决方法是在推全的新层中开一个旧策略的桶，长期观测实验指标的 diff