《陶宇田-OpenSandbox:重新思考 Agent 时代的 Runtime.pdf》由会员分享,可在线阅读,更多相关《陶宇田-OpenSandbox:重新思考 Agent 时代的 Runtime.pdf(23页珍藏版)》请在三个皮匠报告上搜索。
1、OpenSandbox:重新思考 Agent 时代的 Runtime陶宇阿巴巴级技术专家录010203040605AI Agent 执环境的新挑战OpenSandbox 的核设计池化调度与极速交付Agent 场景下的安全执典型应场景未来演进向01AI Agent 执环境的新挑战Agent Workload 的新要求 需要件系统、命令执、服务访问和连接 Runtime 既要能执,也要能承载 IDE/Browser/Notebook 外访问必须可控,不是简单的开关Autonomous Agent 需要规模并发交付和环境致性 单环境冷启动可接受,批量交付放控制成本 必须快速回收,避免评测系统资源堆积
2、批量评测 需要海量短命周期环境 希望吞吐交付,同时兼顾复和成本 运环境本身会影响训练效率和可重复性RL/训练共性诉求:并发、短命周期、可控联、统执与统访问不同场景的表象背后,是同组 Runtime 约束被不断放为什么传统 Docker/K8s 不够它们能运任务,但并不是为 Agent 时代的执模式设计的 单环境没问题,批量交付时对象创建和状态同步成本迅速上升 吞吐瓶颈常常不在执本身,在控制协调批量交付时,控制写放明显传统容器路径Agent Runtime 真正需要 HTTP、SSE、WebSocket、IDE、VNC通常分别处理 业务被迫理解底层端、络和暴露式访问路径分裂,交互体验不统 先定义
3、命周期和执能,再决定底层如何承载 让 SDK 向稳定抽象,不是基础设施细节统执契约 服务访问、联策略、交互式都进平台治理 表达“允许访问哪些域名、通过什么访问”统访问与细粒度安全控制问题不在于容器能不能跑,在于缺少层向 Agent 的统执模型02OpenSandbox 的核设计OpenSandbox:从容器抽象到协议抽象它不是单 Runtime 实现,是套稳定的能边界SDK LayerSDK LayerRuntime LayerSpecs LayerSpecs LayerSandbox InstancesPython/JS/Java/C#/Go 等多语统接Lifecycle/Execution
4、/Access/Policy 契约稳定暴露Docker/K8s/Custom Runtime 独演进Commands/Filesystem/Interpreter/Services 统承载先定义契约,再实现 RuntimeSDK/业务逻辑1 create/get/list/delete renew/pause/resume/endpoint 把环境命周期抽象成标准接Lifecycle Protocol3 FQDN 级 egress policy 统表达连能和约束 SDK 与 Runtime 解耦Network/Policy Contract2 commands/filesystem/code
5、interpreter metrics/session/background execution 把“进去之后怎么做事”抽象清楚Execution Protocol4 endpoint+proxy 统承载服务访问 HTTP/SSE/WebSocket/IDE 致暴露 让交互式 Agent 也有统Access ContractProtocol-First 的标,不是 API 数量,是稳定的能边界只感知统 sandbox 语义价值:上层依赖的是 Runtime Contract,不是具体 Runtime 实现03池化调度与极速交付极速交付:Pool+BatchSandbox1Pool把批量创建环境
6、建模成统对象和批量分配语义维护预热资源,降低从 0 到可环境的等待成本2BatchSandbox3为评测和训练场景交付成批可的运环境Sandbox Delivery4按需注异构任务或补丁,持更复杂作负载Optional Tasks从资源预热到批量分配,重构的是交付链路本身为什么快:优化的是系统级交付效率不是某个环境启动更快,是批量交付路径更短传统 K8s 路径 创建 N 个资源对象 N 次状态同步与回写 控制成本随规模接近线性增OpenSandbox 路径 Warm Pool+BatchSandbox 更少对象写与