03-cong-yun-yuan-sheng-dao-aiyuan-sheng-mo-xing-yin-fa-de-xin-yi-dai-ji-chu-she-shi-gou-jian-yu-feng-chu-ba-.pdf

编号:1035778 PDF 20页 6.99MB 下载积分:VIP专享
下载报告请您先登录!

1、从云原生到 AI 原生:模型引发的新一代基础设施构建蚂蚁集团基础设施技术委员会主席超级计算技术部负责人余锋(褚霸)基础设施技术的演进软件管理全局的软件部署配置管理:Puppet,Chef,Salt,Ansible集群API化管理硬件资源,特别是借助Terraform 类的工具,可以软件管理云上资源云基础设施:OpenStack,CloudStack,Eucalyptus虚拟化基础系统运行、隔离性、软硬件解耦Xen,KVMOSLinux软件定义基础设施之始:虚拟化与云计算容器是标准运行时环境对代码运行(OS)容器是统一、标准、一致的环境对开发与构建、测试容器是基本的应用编排单元和资源调度单位对于

2、编排和调度容器是标准化分发载体,类似于软件包对于分发R容器一个理想的解耦点OBS容器与云原生:应用为中心云原生:良好架构带来的生态繁荣 https:/cf.io模型成为新的数据库GenAI 时代的应用GenAI 之前的(互联网)应用 PatternLAMP 的演进之路数据库是应用系统的核心大规模分布式数据库、数据中间件等,帮助构建高性能大规模应用。数据库是核心的应用基础设施。面向互联网规模的复杂应用消息队列、服务发现、RPC、应用框架等(Spring),用于构建大规模并行应用;云原生时代,引入了 ServiceMesh(istio)、AppRuntime(dapr),将应用和应用基础设施解耦。

3、数据计算链路在线服务之外,服务过程产生的数据,会进入数据计算链路,进行离线或实时计算,构成数据驱动的应用。大模型引领的大爆发(模型)https:/ Agent 的财报解读应用(例中应用基于AgentUniverse 框架构建)越来越多的应用,使用模型生成的内容来服务用户,而不是基于数据库来生成内容。GenAI 时代的大模型正在充当 Web 2.0时代的数据库的生态位,这会对基础设施需要满足的需求,和它的架构带来很多变化。模型为中心的基础设施开源模型推理引擎 vLLM 和 SGLang 快速崛起两个项目成长迅速,不仅性能竞赛一直在持续,而且都有上千开发者,开发速度都很快,大量的 Issue 会在

4、几个小时内就得到响应。任何单一一家公司都很难跟上社区的脚步。模型的优化部署与服务模型的规模化服务,以开源的蚂蚁 AIGW+Mooncake 为例大模型应用的请求与数据库应用的模式不同,每个请求的计算消耗量大,且请求之间差异很大,需要整个基础设施的系统化适应和改进,而不仅是推理引擎本身的优化。LLM-d 等项目同样是在处理这个系统问题。更进一步,从云原生到 AI 原生,从应用为中心到模型为中心From CNCF Sandbox Project ModelPack(https:/ 基础设施AI 应用的基础设施Agent 领域开源项目的活跃度趋势同样,模型训练也在引入 Agentic RL以 inc

5、lusionAI/AReaL 项目为例,作为一个强化学习框架,在AReaLite 版本中增强了Agentic RL,通过 Agent,来提升模型的泛化能力。这样任意定义/引入的 Agent 代码,在训练过程中被执行,给基础设施也提出了更多需求Agent Sandbox 与 Agent Tools一切都是Agent,未来可能需要有海量的 Agent 和运行它们的 Sandbox,给已有的 Sandbox 技术和平台带来了新的挑战和机会功能性从简单的计算器,到搜索,再到浏览器、Computer Use,乃至于执行任意代码,都可能是 Agent 或 Agent Tools 需要完成的功能性能与并发量

6、对于 Agentic RL,可能需要同时并发执行大量的 Agent,并要求响应速度很快,镜像和容器加速项目都可能会被用到Sandbox 的隔离性因为 Agent 有可能执行任意获取的代码,或者是模型生成的代码,因此需要使用安全容器或其他安全的配置,来保护基础设施,免受意外或恶意的攻击,Kata Containers,Firecracker,gVisor,都是被大量提到的沙箱技术。从“通算+智算”向通智一体的演进展望从“通算+智算”向通智一体的演进挑战:基础设施的稳定性与模型技

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(03-cong-yun-yuan-sheng-dao-aiyuan-sheng-mo-xing-yin-fa-de-xin-yi-dai-ji-chu-she-shi-gou-jian-yu-feng-chu-ba-.pdf)为本站 (data) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠