1、大模型时代的推荐架构进化:工程实践与业务赋能张建磊张建磊Opera技术副总监中科院计算所前企鹅自我介绍Opera简介01推荐系统介绍02实践03总结04目录我们是谁?成立于1995年,总部挪威奥斯陆主要产品:浏览器(AI浏览器、游戏游览器、移动浏览器等)Opera News为何需要推荐系统?浏览器内容独立资讯app:Opera News内容覆盖全球主要国家语言TOB:出海内容资讯服务推荐系统架构推荐系统架构推荐架构经典的推荐系统架构推荐架构索引召回排序:粗排、精排、规则(重排)推荐架构推荐架构推荐架构推荐内容特征工程特征是推荐系统理解内容的基石优质特征决定了召回和排序的精度缺乏特征会导致新内容
2、难以被有效分发特征工程传统特征工程深度不足:传统方式多为基于“字面匹配”,无法捕捉复杂的语义关联和隐含意图。冷启动难题:文本特征稀疏,新内容缺乏用户行为数据,分发效率极低。工程成本:依赖大量规则和定制小模型,系统复杂且维护成本高昂结构化信息结构化信息(Category,Tag,Keyword)传统做法:人工标注(成本高)、基于统计的分类器(准确率瓶颈)、TextRank提取关键词(容易包含噪音词)、基于规则的解析维护成本高、泛化能力弱、覆盖面低LLM 优化方案:LLM 输出最符合的 Category 或生成细粒度的 Tags、keywords等效果提升:推荐多样性、冷启动覆盖率、长尾覆盖率等均
3、有提升极大降低了冷启动内容的人工运营成本生成式摘要生成式摘要(Generative Summary):传统做法:截取、TF-IDF、简单的pooling等;关键信息可能丢失、语义不完整等根据文章内容,生成更精准、覆盖核心信息点的 Summary。效果提升:相比传统的抽取式摘要,生成式摘要更连贯,更适合在推荐流中展示给用户,提升点击率。内容聚合聚合理解(Cluster)传统做法:基于简单向量的 K-Means 聚类。LLM方案:可解释性聚类:在高质量语义向量聚类的基础上,将同一个 Cluster 的内容输入 LLM,让 LLM 总结出“为什么这些内容被聚在一起”,生成 Cluster 的标题描述
4、。效果提升:增强了推荐理由的可解释性(例如:“因为您关注了【深度学习前沿】话题”)自媒体辅助写作痛点:自媒体创作的效率瓶颈选题难:热点&兴趣点耗时长:选题、收集到撰写LLM 解决方案:热点内容汇聚辅助写作核心业务价值:提升效率:大幅缩短创作周期热点:紧贴平台热点,提高文章的推荐曝光量和点击率繁荣生态:更多高质量自媒体作者入驻,形成正向循环电商内容生成电商内容规模化生成输入结构化的商品信息(SKU、参数、图片等)。批量输出种草文案、商品测评报告、商品比价信息等,大幅降低内容制作成本。商品转化率提升内容生成内容审核审核范围:自媒体文章(UGC/PGC):软广、标题党、虚假信息等图片素材:恶心、色情、广告图像内容垃圾评论:广告、脏话、民粹等LLM:区别于传统OCR识别突破传统关键词过滤,识别广告、恶意人身攻击等评论业务价值与赋能:效率提升:显著降低人工审核的压力与成本生态保障:净化内容社区环境,提升用户体验和平台信任度广告素材AI广告素材:图片和视频有效提升ctr和cvr其他AI reportAI push 标题AI podcastAI 帖子AI 评论报警agent等AI coding能力放大器拓展边界效率提升未来挑战:LLM如何进一步深度融合到推荐系统延时、成本生成式推荐:Meta的GR快手的OneRecTHANK YOU!感谢聆听!