《可预期数据中心网络-可预期网络论坛(20页).pdf》由会员分享,可在线阅读,更多相关《可预期数据中心网络-可预期网络论坛(20页).pdf(20页珍藏版)》请在三个皮匠报告上搜索。
1、可预期数据中心网络周维,席永青阿里云资深技术专家,阿里云高级技术专家Predictable Datacenter NetworkWei Zhou,Yongqing XiContents目录01可预期高性能的数据中心02可预期网络质量Predictable high-performance data centerPredictable network quality可预期高性能的数据中心build Datacenter Network with Predictable High performance01数据中心网络data center network网络服务:高效稳定的链接Network S
2、ervice计算服务:低时延高带宽的IOComputing IO ServiceNetworkServicesComputing IO数据中心发展趋势AI/BD workload growthAI算力需求持续增长,依赖网络释放更大算力,解除通信规模和时延的束缚Heterogeneous&high performance storageARM+RISC-V+GPU,accelerator新型算力模型和存储介质open inter-conn to break the closed systemCXL等inbox开放互联衍生出新的开放式multi-host互联,异构+池化数据中心趋势端网协同DC a
3、s a Computer,Network as IO带宽持续升级、极限低时延技术inbox PCIe+outbox Eth-inbox、inrack、inbuilding分级、分池端网协同、软硬一体trend of data center network development数据中心发展趋势trend of data center developmentDC as a Computerscale upMoores Law增速放缓爆炸半径大规模分布式Best-effort IO互联分布式计算效率高带宽 vs 低时延数据传输的能耗有效算力能耗高性能的同时,要求可预期的结果scale outene
4、rgy数据中心高性能网络现状静态动态拥塞1us1us1us1us1usNusNus1us1us1us1ususmsNusNus0.5us/100m0.5us/100mqueuing&scheduling静态时延、吞吐的要点0 copy,DATA DMA协议/CC-硬化单跳低时延,减少跳数大带宽更短的路径距离23445动态时延、吞吐的要点网络语义和操作调度高效精确的流控算法更好更精细的拥塞反馈均衡的负载和优化的路径1345协议/CCAPPmem copy协议/CCAPPmem copy123454网卡硬件卸载拥塞控制算法物理网络架构端网协同互联协议典型距离150m,静态时延约20us拥塞调度St
5、atus of High-Performance Networks in Data Centers传统方式AAPPDDDPPAAProtoAPPProtoAPP网络端网协同AAPPDDDPPAAProtoAPPProtoAPP拥塞链路故障网络路径拥塞程度感知(道路拥堵)故障状态感知(道路维修)路径信息感知(导航选择)端侧网络栈对物理fabric状态不感知端端网端端网端+网+全视角无导航,盲开blind driving,No navigation导航反馈,城市大脑navigation system,City Brain阿里巴巴端网协同数据中心网络Alibaba data center netwo
6、rk with terminal networks integration阿里巴巴高性能可预期数据中心实践实时状态感知IO模型的拓扑抽象拥塞优化HPCCRDMAAlibabas high-performance predictable data center network practiceReal-time status awarenessHPCC to optimize congestion controlTopological abstraction for a specific IO patternDC as computer,Network as IO低时延全栈优化和卸载端网协同流控