叶辉-从云原生到AI原生.pdf

编号:1158904 PDF 25页 4.02MB 下载积分:VIP专享
下载报告请您先登录!

1、从云原生到AI原生云端之上,智见未来叶叶辉2025-12-27自我介绍场景Before云原生NowAI原生+从云原生到AI原生容器化改造服务治理异地多活混沌工程大数据存算分离湖仓一体场景智能客服AI素材分析小说生视频情感陪聊游戏AI NPC短剧出海回顾与新挑战123目录展望AI原生探索与尝试目录回顾与新挑战云原生回顾 01发布效率:从周级到小时级敏捷响应市场从需求提出到上线的时间大幅缩短,快速验证业务价值自动化流水线消除人工干预瓶颈,构建、测试、部署全流程自动化传统方式数小时云原生方式1-2周WEEKLY效率跃升Hours数据出数据出处:https:/ CI/CD 流水线的引入软件交付周期实现

2、了质的飞跃软件交付效能演进报告显示:发布效率差异超过百倍云原生回顾 02弹性能力:从手动到自动程序启动效率大幅提升:VM启动1次=容器26.6次数据出数据出处:https:/ 03资源利用率提升70%+传统虚拟化资源闲置严重弹性扩容能力差10%虚拟机利用率优化20%容器利用率40%云原生利用率优化容器化资源隔离利用率提升云原生HPA动态调度混合部署极致算力潜能业务云原生化改造,资源利用率提升最高可达60%70%业务配置HPA弹性伸缩策略,资源利用率进一步提升70%+数据出数据出处:https:/ 人工转接秒级响应 7*24在线服务能力同时服务1-2人同时服务10000+人成本结构人力成本占80

3、%推理成本为主客服场景维度传统客服AI 智能客服知识更新培训周期长(1-2周)实时学习新知识服务质量依赖个人经验 波动大标准化,波动小1.延迟与交互体验挑战(Latency&Streaming)2.上下文与状态管理挑战(Context&State Management)3.集成与编排挑战(Orchestration&Function Calling)4.稳定性与可控性挑战(Reliability&Guardrails)5.成本与效率调度(Cost&Scheduling)企业在落地AI客服时服务端架构不再是简单的“Web服务+数据库”,而是演变为“网关(流式)+编排层(Agent)+记忆层(向量

4、库)+模型层(MaaS)”的复合系统AI时代的新需求-内部组织效率的提升Vibe coding 新架构软件需求代码实现目录展望AI原生AI原生本质从云原生(Cloud Native)向AI原生(AI Native)的演进本质上是一场从“以资源效率为中心”向“以智能计算为中心”的架构范式转移场景一:微服务治理的演进从“流量治理”到“语义与模型治理”治理维度云原生(Cloud Native)AI原生服务通信IREST/gRPC:强类型的接口契约关注QPS、延迟、错误率Prompt/Context:自然语言或Embedding交互关注Token消耗、上下文窗口、首字延迟(TTFT)流量路由基于Hea

5、der/IP:蓝绿发布、金丝雀发布基于权重或特定标签分流语义路由(Semantic Routing):基于用户意图的Embedding相似度将请求分发给不同能力的模型熔断限流基于请求数:传统的令牌桶算法,限制QPS等基于Token/计算量:限制Token速率(TPM)基于GPU显存占用的动态背压(Backpressure)可观测性Metrics/Logs/Trace:关注CPU、内存、网络IOModel Observability关注幻觉率、回答质量、Prompt耗时、KV Cache命中率边车模式Envoy/Sidecar:处理网络代理、TLS、鉴权。AI Gateway/Sidecar增加

6、Prompt缓存、PII(敏感信息)过滤、输出结果的格式化校验(Guardrails)。场景二:推荐场景的演进从“强特征工程模型”到“生成式交互”治理维度云原生(Cloud Native)AI原生核心范式基于业务的自定小模型、无通用性、需反复迭代通用大模型+基于业务的Prompt+RAG工程生成推荐理由或列表特征工程ID类特征为主:UserID,ItemID,离散特征One-hot依赖手工构造交叉特征无需特征工程,大模型端到端闭环自动直接理解内容语义及特征存储设计KV Store/NoSQL:Redis/HBase存储用户画像和物料库,追求毫秒级点查Vector Database:存储高维向量

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(叶辉-从云原生到AI原生.pdf)为本站 (彩旗) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠