1、移动业务向数智转型 万卡的 Serverless 调度实践,中国移动数智能化部,2025/11/15,柴壮 赵宇聪,柴壮中国移动数智能化部架构师,形象照,形象照,赵宇聪中国移动数智能化部开发工程师,CONTENT,目录,01,为什么选择Serverless架构,02,从传统到Serverless:应用演进之路,03,Serverless落地案例与业务价值,04,通智一体算力资源调度优化,此区域不写实际内容,此区域不写实际内容,此区域不写实际内容,大模型时代新基建,云数智一体化是发展趋势,MaaS 集群,传统智算中心建设模式,大模型时代智算中心建设模式,Nvidia GPU,AI PAAS,资源
2、池化,资源调度,平台安全,大模型训练平台,大模型推理平台,租户1,租户2,租户3,中央门户,高性能网络,华为GPU服务器,海光GPU服务器,租户隔离,性能优化,磐基PaaS 平台,AI MaaS,高性存储,租户1,租户1,租户1,建设模式:烟囱式独立建设及运维,整体成本高,建设模式:平台式统一建设及运维,整体成本低,PaaS平台,PaaS平台,PaaS平台,CPU、GPU 服务器,CPU、GPU 服务器,CPU、GPU 服务器,RDMA 交换机,RDMA 交换机,RDMA 交换机,高性能存储服务器,高性能存储服务器,高性能存储服务器,MaaS 集群,MaaS 集群,此区域不写实际内容,此区域不
3、写实际内容,此区域不写实际内容,Serverless 架构理念,从资源管理到能力即服务(AI时代新范式),能力即服务(Service as a Capability),弹性按需(Elastic On-Demand),按量付费(Pay-as-you-go),CONTENT,目录,01,为什么选择Serverless架构,02,从传统到Serverless应用演进之路,03,Serverless落地案例与业务价值,04,通智一体算力资源调度优化,此区域不写实际内容,此区域不写实际内容,此区域不写实际内容,以Serverless 驱动智能应用重构,从传统架构到 Agentic AI 的演进之路,19
4、60年1980年IBM 大型机,虚拟化架构,分布式架构,云原生架构,AI原生架构,单体服务架构,模块化架构,1980年1998年局域网(LAN),1998年2006年Vmware KVM,2006年2018年GFS、MapReduce、BigTable,2025年至今Agentic AI,CONTENT,目录,01,为什么选择Serverless架构,02,从传统到Serverless:应用演进之路,03,Serverless落地案例与业务价值,04,通智一体算力资源调度优化,此区域不写实际内容,此区域不写实际内容,此区域不写实际内容,基于 Serverless 的 AI 能力全生命周期管理,
5、超大规模算力集群管理,多种算力按实际使用付费,虚拟化与弹性伸缩能力,基于事件触发业务请求,AI能力,AI引擎镜像,生产环境,测试环境,研发环境,业务A,业务B,业务C,AI模型/数据,此区域不写实际内容,此区域不写实际内容,此区域不写实际内容,实现业务快速部署和弹性伸缩,面向业务提供强大的AI生产算力与服务保障,多租户,分级资源管理,平台资源池,租户资源池,项目资源池,任务资源,多租户管理,实现租户间资源隔离,租户自主管理能力,可对所属用户、项目、数据、AI模型、推理服务和资源进行管理,也可以进行租户之间的共享,平台可按各省/专业公司需求分配计算资源,为AI业务提供充足的算力保障和安全的资源隔
6、离。,资源优化及弹性调度,平台对推理服务进行实时监控,可通过设置多个维度的弹性扩容阈值,自动进行服务的扩容,通过增加服务节点的方式提升推理服务的访问处理能力。平台支持GPU虚拟化等技术,可实现显存粒度的资源调度,提升GPU利用率。,云端多节训练,边缘推理,华北,华东,华中,华南,东北,资源管理,数据管理,模型研发,推理预测,能力开放,广东,江苏,重庆,山东,云端统一管控,边缘适度自治,省公司N,AI预测、实时计算、设备就近接入、近场业务支撑,西部,天津,CONTENT,目录,01,为什么选择Serverless架构