1、DataFunSummit#2023因果推断技术在快手短视频推荐中的应用演讲人-林肖-快手-高级算法专家01快手单列短视频推荐场景02因果推断技术与模型表示03观看时长预估与因果推断技术04未来的展望目录 CONTENTDataFunSummit#202301快手单列短视频推荐场景关于快手 头部短视频和直播社区 MAU:6.733 亿 DAU:3.760 亿 拥抱每一种生活 单列:沉浸式体验 双列:自主选择 推荐算法在流量分发与提升用户体验方面起到了核心作用快手单列短视频推荐场景 快手单列推荐场景特点:业务侧:用户行为模式:上下滑动,无需点击,直接播放 反馈:多种互动反馈,观看时长,滑动行为等
2、 优化目标:长期目标与短期目标 系统侧:日志来源:有限,且存在自循环 用户人群受众广、差异大 视频数量大且更新频繁 流行度偏差 长短视频曝光偏差 关注的问题:如何在短视频推荐中利用因果技术进行纠偏,从而提升推荐效果DataFunSummit#202302因果推断技术与模型表示因果推断技术与模型表示 背景:推荐系统通过交互日志进行学习 用户的交互归因可能来自于兴趣或者从众 不同用户对相同item的从众心理不同 相关工作:纠偏工作流行度作为静态偏差流行度仅与item有关 解耦表示考虑用户侧从众心理的差异交互可能来自于从众心理和兴趣的叠加因果推断技术与模型表示 DICE:解耦conformity与i
3、nterest以click为例,交互来自于双重因素的叠加separate embeddings from cause-specific samples 因果视角:Additive model for click record!=!#$%&%$+!()#*)&+$,通过colliding effect构建样本在不同cause上的偏序关系Disentangling User Interest and Conformity for Recommendation with Causal Embedding.Webconf 2021 Zheng,et al.因果推断技术与模型表示 DCCL:解耦conf
4、ormity与interest带来了帮助实际推荐系统中存在大量长尾item观测数据存在稀疏性采用偏序关系也很难解决稀疏性问题引入对比学习进行样本增广Batch内负采样进行样本扩充引入item popularity ratioDisentangled Causal Embedding With Contrastive Learning For Recommender System.Webconf 2022.Zhao,et al.More popular,more conformityLess popular,more interest因果推断技术与模型表示 实验结果:因果推断技术与模型表示 总结
5、:短视频中的用户交互可能是由于兴趣和从众心理的叠加作用 从因果的角度出发兴趣和从众心理会对模型表示带来影响 采用causal embedding的手段可以从结构上实现表示解耦 实际系统中的短视频数量庞大,且存在大量长尾视频,样本稀疏 通过对比学习和样本增广进行缓解DataFunSummit#202303观看时长预估与因果推断技术观看时长预估与因果推断技术 视频观看时长的重要性用户体验的核心指标之一用户的注意力有限观看时长提升长期留存推荐系统需要准确预估观看时长志采集模型训练推荐视频时反馈 观看时长的影响因素用户对视频的兴趣视频本身的长度长视频观看时长偏长系统倾向于推荐观看时长更长的视频推荐系统
6、处于bias强化循环中 观看时长的预估视频长度是较强的biasDuration Bias的研究较少时长预估是特殊的回归问题观看时长预估与因果推断技术 因果角度分析时长与duration bias观看时长由若干个因素同时影响U:用户特征表示:视频特征表示:视频长度:用户观看视频的时长,:表示UV对观看时长的影响 :表示视频长度对观看时长的影响 :表示视频长度对视频特征的影响 Deconfounding Duration:后门调整Deconfounding Duration Bias in Watch-time Prediction for Video Recommendation.KDD 202