当前位置:首页 > 报告详情

03-ji-yu-k8s-yu-openstack-de-ji-jian-zhi-suan-fang-an-luo-di-shi-jian-wu-wen-xiang-.pptx

上传人: d*** 编号:1035830 2026-01-04 17页 5.36MB

1、极简智算解决方案落地Kubernetes&OpenStack&AI,Algoblu 首席架构师,2025/11/09,吴文相,吴文相Algoblu 首席架构师,聚焦云计算、MEC 边缘计算、容器云、智算 AI 解决方案。是 OpenStack Skyline PTL,CNCF KubeClipper PTL。,形象照,CONTENT,目录,01,痛点切入和方案目标,02,极简架构的底层逻辑,03,关键技术支撑,04,落地实践案例,资源浪费非核心服务抢占 40%+资源(Ceph)运维复杂度提升 60%(工作流等非核心模块)GPU 利用率=55%AI任务响应延迟超 30%安全缺失涉密算力资源与非涉

2、密算力资源未隔离管理员账号滥用安全审计不完善权限管理 RBAC 过于粗放对内和对外均缺乏入侵防御设计,1.1 痛点分析,1.2 核心价值,聚焦核心能力以“裸机/虚拟机/容器云集群/大模型即服务”为核心剥离其它冗余插件:Ceph/非核心模块/Neutron 简化保障安全可控RBAC&ABAC 的权限设计根账号的分段存储,限制终端使用涉密算力隔离安全策略和安全等级管理安全审计强化简化管理链路中心统一管控业务边缘极致轻量化,1.3 极简智算平台:资源直达&安全无虞,裸机管理对接 Ironic(Redfish 适配)对接非 Ironic对接物理资源管理虚拟机管理GPU 透传RoCE 网络的虚拟化适配容

3、器云管理Magnum&KubeClipper&Ubuntu 24.04基于 VM&基于 BM大模型即服务,2.1 边缘极简架构,区域和硬件管理统一的硬件资源管理:虚拟化集群/裸机集群/其它设备区域接入中心和自发现资源信息缓存和更新触发边沿触发缓存更新水平触发缓存更新业务层产品资源和产品订单/账单/计费辅助服务监控和日志通知和工单,2.2 中心极简架构,以“是否支撑算力供给”为唯一标准仅保留 Nova 和 GlanceIronic/Heat/Magnum 可选Neutron 和 Cinder 简化适配硬件监控硬件:Redfish/传感器网络硬件:RoCE 交换机存储硬件:三方文件存储服务计算硬件

4、:GPU PCIe vs NVL C2C异构算力支持(ARM&x86,国产 GPU 卡等),3.1 关键技术:OpenStack 服务裁剪,中心-边缘“租户”协同业务逻辑保留在中心租户管理从中心向边缘单向同步中心-边缘算力协同中心订单-边缘算力交付边缘算力状态监控和用量统计-中心缓存,3.2 关键技术:中心-边缘协同,资源隔离GPU 分片健康监控实时检测,异常自动迁移用量统计调度优化区分优先级动态调度GPU透传PCIeC2C,3.3 关键技术:GPU精细化管理,提供 Web 与 API 双通道5 分钟内完成上线模型选择GPU 规格加密策略配置并生成 K8S Deployment镜像统一托管版本可回溯部署过程零人工干预,3.4 关键技术:大模型即服务,监控指标源可配置实时流处理计费“加密通道、密钥、损耗”同步可视化运维-财务-合规三端同源可信,3.5 关键技术:监计一体,4.1 性能对比,硬件投入减少 20%(取消冗余服务器)年省人力成本 30 万+(运维工作量-70%)单位算力成本 降低 45%节省安全成本 50 万+(无需独立加密设备)支持外接三方入侵防御服务,4.2 成本效益,4.3 稳定合规,THANKS,Q&A,

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
客服
商务合作
小程序
服务号
折叠