1、释放算力潜能,Serverless+AI让应用开发更简单报告人:王仁达 阿里云智能2025年6月阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云Serverless在解决什么问题 通过不断的优化资源供给能力:降低用户保有资源的成本,提高资源利用率,降低资源使用成本;通过不断的加强和云产品及周边生态的集成,降低用户业务构建的门槛,减少业务发布和扩容运维时间,提升业务效率;成本目标 按需付费,降低用户成本,提供产品竞争力效率目标 简单,易用,减少发布/扩容时间,提升发布/扩容的效率Serverless目标和策略按需付费极简运维灵活定制 平台及体验能力升级:事件驱动,云服务集成,流程编排,应用
2、模版,计费优化,观测能力集成阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云AI 应用基本要素3 业务逻辑4 领域抽象2 领域模型1 大模型6 流程编排5 BaaS 服务开箱即用、一键托管、可观测完备、低成本领域适配、业界标准、活跃生态流程引擎,工具生态,广泛集成门槛高、迭代快,效果好,低成本开箱即用、快速迭代、灵活可定制、低成本性能、成本、稳定、安全、体验AI 应用基本要素Serverless 擅长领域阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云模型服务+Serverless GPU实现降本增效模型服务Serverless GPU行业痛点开源/微调模型做成镜像有门槛,vLLM
3、/SGLang 等框架选择困难商业模型按 token 计费贵且有速率限制,不自主可控平台价值快速托管:主流模型一键部署,自定义模型下载加速快速托管框架封装:vLLM/SGLang/Ollama/Hugging Face Transformers 实现推理加速、轻量化部署API Key管理:KMS、访问控制实现安全存储及隔离行业痛点高峰流量大、资源成本高、运维管理复杂冷启动延迟高,系统调度、镜像拉取、模型加载、首推理平台价值负载感知调度、资源池化,实现更高的弹性和资源利用率推理速度、稳定性、成本间取得平衡函数计算:FC AI 应用开发+FC 弹性算力FC 业界独家极速模式:提供秒级快照、毫秒级两
4、种模式,满足实时和准实时推理场景FunctionAI 模型服务:主流模型如 Qwen、DeepSeek 等可一键部署,魔搭社区、HuggingFace 的热门模型可通过模型 ID 快速托管阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云领域模型加速落地:图像生成行业痛点SaaS 昂贵且无法自主可控虚机/容器自建弹性效率弱、利用率低、成本高文生图 WebUI/API 开发门槛高,模型/插件下载国内网络不可用Serverless图像生成平台价值深度集成Serverless GPU,兑现弹性降本优势、快速出图专属工作空间:激活、销毁快,简单易用企业级特性增强:Serverless API,自带
5、流量灰度,多实例并发出图加速出图效率函数计算:FunctionAI 图像生成SD WebUI/CompyUI 一键部署,提供专属工作空间和网络加速能力,支持上传、下载自定义模型及插件开发调试一键发布Serverless API,隔离测试和生产环境,通过API调用实现同步/异步/流式/WebSocket出图阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云AI 应用基本要素3 业业务务逻逻辑辑4 领域抽象2 领域模型1 大模型6 流程编排5 BaaS 服务开箱即用、一键托管、可观测完备、低成本领域适配、业界标准、活跃生态流程引擎,工具生态,广泛集成门槛高、迭代快,效果好,低成本开箱即用、快速
6、迭代、灵活可定制、低成本性能、成本、稳定、安全、体验AI 应用基本要素Serverless 擅长领域阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云智能体应用中间件服务知识库数据库大语言模型智能体传统应用开发AI 应用开发记忆/工具应用抽象发生变化阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云阿里云智能体应用LLM 和和现现实实世世界界的的结结合合 包含感知、决策、行动 行动:碎片化代码,需要灵活、快速、轻量的运行时,函数是最合适的形态(MCP,function calling,code interpreter,)AI 领域应用的主体应用集成及应