当前位置:首页 > 报告详情

Whale:统一多种并行化策略的分布式深度学习框架.pdf

上传人: li 编号:29537 2021-02-07 19页 1.72MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文介绍了一种名为Whale的统一分布式训练框架,由阿里巴巴的 Wang Wangang 及其团队开发。随着模型变得越来越大和复杂,传统的数据并行方法(DP)不再总是最优的,因为它无法充分利用资源并加速训练。Whale 支持各种分布式策略,包括自定义模型并行和自动并行策略,易于使用且与各种 DSL API 兼容。它通过引入 Whale IR、关键抽象(如子图、多维度和虚拟设备)和操作分组来优化分布式训练。Whale 还引入了一个元驱动的成本模型,用于探索分布策略。该框架在 Alibaba Cloud 中提供,并已成功应用于大规模分类任务和 BertLarge 模型训练。结果显示,与传统的数据并行和 Horovod 数据并行相比,Whale 能够提供更好的性能。
"Whale框架如何实现自动并行化?" "分布式训练中,数据并行何时不再最优?" "Whale框架在Alibaba Cloud中的应用有哪些?"
客服
商务合作
小程序
服务号
折叠