当前位置:首页 > 报告详情

曾鸣堃-小红书训推异构引擎的设计与应用0622.pdf

上传人: 张** 编号:168905 2024-07-06 23页 3.03MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
曾鸣堃,小红书训推计算引擎负责人,在DataFunSummit # 2024上分享了小红书模型工程面临的挑战及异构弹性引擎的设计与实践。主要挑战包括业务高速增长带来的模型复杂化、稀疏参数量和计算FLOPS的需求,以及多模型应用场景等。为解决挑战,小红书设计了异构弹性引擎,核心技术点包括支持超大规模稀疏特征、基于无冲突的高效稀疏Table、高性能Lookup Table算子实现和支持多种参数优化器等。此外,还介绍了第一代训练框架Larc和异构GPU训练框架,以及AI编译技术在训练和推理场景中的优化。结果显示,异构弹性引擎能显著提高GPU利用率,降低成本,提升迭代ROI,具有高性能和灵活性。面向未来的HPC训练框架需解决显存不足、计算和通信调度效率低等问题。
"小红书如何应对模型工程挑战?" "异构弹性引擎有哪些设计亮点?" "AI编译技术在训推框架中的应用如何?"
客服
商务合作
小程序
服务号
折叠