当前位置:首页 > 报告详情

03-cong-yun-yuan-sheng-dao-aiyuan-sheng-mo-xing-yin-fa-de-xin-yi-dai-ji-chu-she-shi-gou-jian-yu-feng-chu-ba-.pdf

上传人: d*** 编号:1035778 2026-01-04 20页 6.99MB

1、从云原生到 AI 原生:模型引发的新一代基础设施构建蚂蚁集团基础设施技术委员会主席超级计算技术部负责人余锋(褚霸)基础设施技术的演进软件管理全局的软件部署配置管理:Puppet,Chef,Salt,Ansible集群API化管理硬件资源,特别是借助Terraform 类的工具,可以软件管理云上资源云基础设施:OpenStack,CloudStack,Eucalyptus虚拟化基础系统运行、隔离性、软硬件解耦Xen,KVMOSLinux软件定义基础设施之始:虚拟化与云计算容器是标准运行时环境对代码运行(OS)容器是统一、标准、一致的环境对开发与构建、测试容器是基本的应用编排单元和资源调度单位对于

2、编排和调度容器是标准化分发载体,类似于软件包对于分发R容器一个理想的解耦点OBS容器与云原生:应用为中心云原生:良好架构带来的生态繁荣 https:/cf.io模型成为新的数据库GenAI 时代的应用GenAI 之前的(互联网)应用 PatternLAMP 的演进之路数据库是应用系统的核心大规模分布式数据库、数据中间件等,帮助构建高性能大规模应用。数据库是核心的应用基础设施。面向互联网规模的复杂应用消息队列、服务发现、RPC、应用框架等(Spring),用于构建大规模并行应用;云原生时代,引入了 ServiceMesh(istio)、AppRuntime(dapr),将应用和应用基础设施解耦。

3、数据计算链路在线服务之外,服务过程产生的数据,会进入数据计算链路,进行离线或实时计算,构成数据驱动的应用。大模型引领的大爆发(模型)https:/ Agent 的财报解读应用(例中应用基于AgentUniverse 框架构建)越来越多的应用,使用模型生成的内容来服务用户,而不是基于数据库来生成内容。GenAI 时代的大模型正在充当 Web 2.0时代的数据库的生态位,这会对基础设施需要满足的需求,和它的架构带来很多变化。模型为中心的基础设施开源模型推理引擎 vLLM 和 SGLang 快速崛起两个项目成长迅速,不仅性能竞赛一直在持续,而且都有上千开发者,开发速度都很快,大量的 Issue 会在

4、几个小时内就得到响应。任何单一一家公司都很难跟上社区的脚步。模型的优化部署与服务模型的规模化服务,以开源的蚂蚁 AIGW+Mooncake 为例大模型应用的请求与数据库应用的模式不同,每个请求的计算消耗量大,且请求之间差异很大,需要整个基础设施的系统化适应和改进,而不仅是推理引擎本身的优化。LLM-d 等项目同样是在处理这个系统问题。更进一步,从云原生到 AI 原生,从应用为中心到模型为中心From CNCF Sandbox Project ModelPack(https:/ 基础设施AI 应用的基础设施Agent 领域开源项目的活跃度趋势同样,模型训练也在引入 Agentic RL以 inc

5、lusionAI/AReaL 项目为例,作为一个强化学习框架,在AReaLite 版本中增强了Agentic RL,通过 Agent,来提升模型的泛化能力。这样任意定义/引入的 Agent 代码,在训练过程中被执行,给基础设施也提出了更多需求Agent Sandbox 与 Agent Tools一切都是Agent,未来可能需要有海量的 Agent 和运行它们的 Sandbox,给已有的 Sandbox 技术和平台带来了新的挑战和机会功能性从简单的计算器,到搜索,再到浏览器、Computer Use,乃至于执行任意代码,都可能是 Agent 或 Agent Tools 需要完成的功能性能与并发量

6、对于 Agentic RL,可能需要同时并发执行大量的 Agent,并要求响应速度很快,镜像和容器加速项目都可能会被用到Sandbox 的隔离性因为 Agent 有可能执行任意获取的代码,或者是模型生成的代码,因此需要使用安全容器或其他安全的配置,来保护基础设施,免受意外或恶意的攻击,Kata Containers,Firecracker,gVisor,都是被大量提到的沙箱技术。从“通算+智算”向通智一体的演进展望从“通算+智算”向通智一体的演进挑战:基础设施的稳定性与模型技

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **基础设施演进**:从云原生(应用为中心)到AI原生(模型为中心),模型成为新数据库,替代Web 2.0时代的数据库生态位。 2. **技术趋势**:开源模型推理引擎(vLLM、SGLang)快速崛起,LLM-d等项目系统性优化模型部署;Agent基础设施需求增长,涉及Sandbox隔离性(Kata Containers等)、并发量及安全性挑战。 3. **核心数据**:vLLM和SGLang有上千开发者,Issue响应速度达小时级;Agent功能从计算器扩展至任意代码执行,需安全容器防护。 4. **挑战与机遇**:平衡基础设施稳定性与模型快速迭代,应对Agent安全风险;前AI时代应用将向Agent演进,推动通智一体架构发展。
**AI原生时代?** **模型即数据库?** **Agent如何演进?**
客服
商务合作
小程序
服务号
折叠