当前位置:首页 > 报告详情

推荐系统推理性能优化在“双十一”中的应用.pdf

上传人: li 编号:29562 2021-02-07 18页 882.86KB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了在双11大促活动中,推荐系统如何进行推理性能优化。面临挑战包括模型计算复杂度增长、硬件资源成本高、原生算法模型在CPU-GPU异构系统中无法完全发挥出计算性能以及双11当天流量洪峰等。优化方法包括:推理性能优化方法、量化、算子融合、通用模块设计及优化、CUDA Graph应用等。实验结果显示,优化后的推荐系统在多个业务场景中成功上线,性能提升2~10倍,GPU利用率普遍提升到80%以上,业务响应时间降低约20%~50%。
"双11推荐系统如何实现性能优化?" "CPU-GPU异构系统如何发挥最大性能?" "推荐系统推理性能优化有哪些实际应用?"
客服
商务合作
小程序
服务号
折叠