当前位置:首页 > 报告详情

申晗-快手推搜广计算引擎优化实践v2.pdf

上传人: 张** 编号:168959 2024-07-06 31页 14.78MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了快手在推荐系统性能优化方面的实践。首先,快手推荐系统已全面进入GPU时代,但训练耗费大量GPU资源,因此需要关注DNN部分的计算优化。快手采用了TensorFlow作为DNN计算引擎,通过Grappler和XLA进行图优化和编译优化。此外,快手还提出了Dynamic Scale FP16和BF16全图混合精度训练方案,以提高训练效率。在工程架构方面,快手从TensorFlow 1.x升级到2.x,并独立出XLA,以实现更灵活的编译优化。同时,快手也在探索多元算力,包括国产芯片和AMD GPU,以应对高端算力卡供不应求的挑战。
快手如何优化推荐系统GPU计算? 快手如何实现多元算力支持? 快手如何应对芯片禁令挑战?
客服
商务合作
小程序
服务号
折叠