当前位置:首页 > 报告详情

利用 Databricks 和 AMD 为生成式 AI 提供支持.pdf

上传人: 张** 编号:167628 2024-06-15 25页 1.85MB

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要介绍了AMD和Databricks如何共同推进生成式人工智能的发展。AMD GPU硬件和软件可以预训练大型AI模型,支持灵活的本地或GPU云预训练,使用RDMA和AMD GPU扩展工作负载。Databricks提供了模型管理和生产部署的功能,如AI模型共享、微调以及更好的治理、隐私保护和成本效益。文章中提到了多个关键数据:AMD MI300X系列GPU具有1.3 PFLOPS bfloat16峰值和1.5TB HBM3内存;xGMI支持GPU间的双向 peer-to-peer通信;Azure ND MI300X V5实例具有8个GPU和1.5TB HBM3内存;使用ROCm和Pytorch进行分布式训练,最佳损失为24 GPUs时的3.1366。最后,文章提到了模型部署和服务的关键点,包括使用Databricks的Serverless Inference API部署模型,以及使用AMD硬件和软件运行预训练模型和进行模型生命周期管理。
如何利用AMD和Databricks提高生成式AI的性能? AMD GPU硬件和软件在生成式AI预训练中扮演什么角色? 在Databricks上进行模型微调的具体步骤和优势是什么?
客服
商务合作
小程序
服务号
折叠