当前位置:首页 > 报告详情

华为:2026年Atlas 650E 服务器技术白皮书(92页).pdf

上传人: 人*** 编号:1274268 2026-07-03 92页 8.57MB

下载:
核心结论速览。 整机采用14U风冷平插架构,支持标准19英寸机柜部署:整机结构设计采用风冷平插架构,集成CPU抽屉、NPU抽屉、机框等关键部件,集成密度高,易维护。整机尺寸618.8mm(高)×447mm(宽)×920mm(深)。 CPU抽屉与NPU抽屉支持独立断电插拔维护:NPU抽屉采用4.5U抽屉设计,整抽屉支持断电插拔。CPU抽屉采用3U抽屉设计,整抽屉支持断电状态下的插拔。抽屉式设计显著简化了现场维护操作。 PSU电源模块支持5+1冗余与热插拔:共配置6块PSU电源模块,支持任意5+1冗余,支持热插拔。单块PSU电源模块最大输出功率3000W,电源转换效率峰值高达96%。 前面板集成8个400Gbps参数面接口与32个800Gbps UB接口(双机) :前面板配置8个参数面接口(QSFP,400Gbps)用于连接整机柜外标准交换机,32个UB接口(OSFP,800Gbps)用于UB交换机互联。 风扇墙由30个8080风扇模组组成,支持N+1冗余与热插拔:风扇墙由30个风扇模组组成,支持热插拔更换,整机支持任意N+1冗余。 iBMC管理系统支持通过Redfish接口被第三方网管集成:软件上支持CCAE智能管理平台纳管运维,同时支持通过Redfish接口被第三方网管集成。 CPU基础板提供24个DDR5内存插槽,最大支持2304GB:每个处理器均提供12条内存通道,每条通道都支持1个DIMM。配置24根内存时最大传输速率为6400MT/s。H2:硬件部署与物理结构——从机柜安装到抽屉维护。整机结构与机柜安装:Atlas 650E服务器整机为14U机框,支持标准19英寸机柜安装(仅支持符合IEC60297或GB/T19520(19英寸)要求的机柜)。整机满配净重251kg。整机尺寸为618.8mm(高)×447mm(宽)×920mm(深)。三大抽屉模块:整机主要包括1个14U整机框、1个CPU抽屉、2个NPU抽屉。 NPU抽屉:采用4.5U抽屉设计,整抽屉支持断电插拔。抽屉前面板集成16个OSFP光模块(仅双机场景支持)、2个UBEXP模组或UBoE直通模组,抽屉尾部集成2个Phoenix连接器和1个鸭嘴连接器。抽屉内部集成4个NPU模组。每台服务器整机包含2个NPU抽屉。 CPU抽屉:采用3U抽屉设计,整抽屉支持断电状态下的插拔。抽屉前面板集成10块硬盘、3个Riser模组及其他线缆接口,抽屉尾部集成1个CableTray和1个鸭嘴连接器。机框部件:机框主要集成了PSU电源模块、风扇墙(集成风扇模组)、风扇背板、电源转接板、电源管理板、BUSBAR、Cable背板、PSU背板、横向铜排等部件。机框通过电源转接板和BUSBAR为NPU抽屉、CPU抽屉提供54VDC电压供电。H2:供电与散热实操——14.5kW功耗下的工程部署要点。PSU电源模块部署:共配置6块PSU电源模块,支持任意5+1冗余(共8个电源模块插槽,其中从左至右的最后2个插槽是假面板)。单块PSU电源模块支持热插拔,自带结构件外壳,内置风扇组件。支持主备双路AC/HVDC混合供电,支持PSU自适应切换。输入电源优先级:AC的优先级高于DC,A路优先级高于B路。当输入电压AC不低于200V、DC不低于240V时,A路AC输入优先级最高。供电注意事项: 默认A路为主路全负载,B路为备路零负载。 当交流输入电压低于200V或直流输入电压低于240V时,单PSU电源模块最大输出功率低于3kW,无法支持5+1冗余。 各级电源设计支持输出电压异常保护、输出过流保护、短路保护等功能。风扇墙部署:风扇墙由30个风扇模组组成,采用8080风扇(风扇尺寸80mm×80mm,内含两个风扇转子),每排5个,一共6排。支持热插拔更换。风扇转速支持自适应调节。整机支持任意N+1冗余。风扇单转子失效时支持的最高工作温度为正常工作温度规格以下5℃。H2:前面板接口与指示灯——现场运维的快速识别指南。前面板接口(双机) :前面板共集成8个参数面接口(QSFP,400Gbps,用于连接整机柜外标准交换机)、32个UB接口(OSFP,800Gbps,仅双机场景支持)、1个VGA接口(DB15)、2个USB 3.0接口、1个主板以太网接口(RJ45,1000Mbps)、1个灵衢总线管理网口(RJ45,1000Mbps)、1个BMC管理网口(RJ45,1000Mbps)。前面板指示灯: 参数面接口指示灯:LINK/ACT指示灯绿色常亮表示网络连接正常,绿色闪烁(1Hz)表示有数据传输;SPEED指示灯绿色表示400Gbps,橙色表示200Gbps。 UB接口指示灯:LINK/ACT指示灯绿色常亮表示网络连接正常,绿色闪烁表示有数据传输。 故障诊断数码管:显示“。”表示设备正常;显示故障码表示有部件故障。 电源按钮/指示灯:绿色常亮表示正常上电,黄色闪烁表示按钮锁定,黄色常亮表示待机状态。 健康状态指示灯:绿色常亮表示运转正常,红色闪烁(1Hz)表示严重告警,红色闪烁(5Hz)表示紧急告警。 UID按钮/指示灯:短按打开/关闭定位灯,长按5秒复位iBMC。硬盘指示灯: SATA硬盘:Active绿色常亮表示在位,绿色闪烁(4Hz)表示读写;Fault红色常亮表示故障。 NVMe硬盘:Active绿色常亮表示在位且无故障,绿色闪烁表示读写;Fault/Locate红色闪烁(4Hz)表示被OS定位,红色闪烁(0.5Hz)表示允许拔出,红色常亮表示故障。H2:NPU抽屉部件详解——4.5U抽屉内的AI算力核心。NPU模组:每台服务器内共有2个NPU抽屉,每个抽屉内部集成4个NPU模组(即HiAM模组)。NPU模组是以高性能通用NPU计算芯片为核心的高密高功耗基础AI硬件单元,采用54V DC供电。NPU模组高速信号通过10个Luna连接器对外引出。NPU模组在服务器内部的编号为1~8,其中A1槽位(底层)NPU抽屉对应编号1/2/3/4,A2槽位(上层)NPU抽屉对应编号5/6/7/8。OSFP模组:每个NPU抽屉内置1块OSFP模组,为NPU抽屉提供电源管理、低速信号汇聚、UB、UBoE直通模组或UBEXP模组等功能接口。为4个NPU模组提供16路光模块的管理通道。UBoE直通模组与UB EXP模组:每个NPU抽屉可配置2个UBoE直通模组或2个UB EXP模组,每个模组提供2个400Gbps光纤接口。UB EXP模组前面板Speed指示灯绿色表示400Gbps,橙色表示200Gbps。H2:CPU抽屉部件详解——3U抽屉内的通用算力与存储。CPU基础板:CPU抽屉内部集成1块鲲鹏高性能基础板。CPU基础板上主要包含24个DDR内存接口、2个12V供电接口、多个高速/低速连接器接口。CPU处理器在iBMC界面中编号为BCU1(CPU0和CPU1)。内存配置:CPU基础板最大提供24个内存插槽,每个处理器均提供12条内存通道。配置24根内存时最大传输速率为6400MT/s,单根内存条容量最大支持96GB,整机最大支持2304GB。内存安装原则: 每个CPU必须至少配置一根内存条。 同一台CPU抽屉不允许混合使用不同规格(容量、位宽、rank、高度等)的内存,必须为相同Part No. 建议配置完全平衡的内存条以实现最佳内存性能。 未安装内存条的槽位需要安装假模块。Riser模组与PCIe插槽:CPU抽屉共包含3个Riser模组。最多支持5个PCIe 5.0扩展插槽。Slot5最大支持150W的PCIe卡。若安装SDI 6.0,仅支持安装在Slot5。存储配置:最大支持8×2.5寸NVMe+2×2.5寸SATA硬盘。槽位2~9仅支持NVMe硬盘,槽位0~1支持SATA/NVMe硬盘。H2:Atlas 650E服务器部署运维指南——从上架到日常维护。上架前准备: 确认机柜符合标准19英寸安装要求(IEC60297或GB/T19520)。 确认机柜承重能力≥251kg(满配净重)。 确认供电容量≥14.5kW,支持220VAC或336VHVDC/240VHVDC双输入。 确认机房环境满足工作温度5℃~35℃、湿度8%~90% RH。 确认风冷散热条件满足最大风量3300 CFM要求。上架与安装: 走线齿需要在机框已经与机柜固定后再安装。 走线齿高度98.0mm,机柜前门和机柜方孔条距离应大于128.0mm,防止碰撞。日常维护: PSU电源模块:支持热插拔,支持不停机单次更换1个PSU电源模块。 风扇模组:支持热插拔更换,任一风扇失效后系统仍可正常运行。 NPU抽屉:支持断电插拔。 CPU抽屉:支持断电状态下的插拔。 硬盘:支持热插拔。故障处理: 观察故障诊断数码管——显示“。”表示正常,显示故障码表示有部件故障。 观察健康状态指示灯——绿色常亮正常,红色闪烁表示告警。 通过iBMC Web界面查看详细告警信息。 通过UID指示灯定位故障设备——短按UID按钮打开/关闭定位灯。避坑指南: ❌ 不要忽视PSU输入电压要求——低于200V AC或240V DC时无法支持5+1冗余。 ❌ 不要混用不同规格的内存条——同一CPU抽屉必须使用相同Part No. ❌ 不要在设备运行时插拔NPU/CPU抽屉——仅支持断电插拔。 ❌ 不要忽视走线齿安装顺序——需在机柜固定后安装。 ❌ 不要将调试串口用于日常网络连接——仅用于现场维护时客户端直连。FAQ区块。Q1:Atlas 650E服务器的抽屉模块支持热插拔吗?A1:NPU抽屉和CPU抽屉均支持断电插拔——需在设备断电状态下进行插拔操作。PSU电源模块、风扇模组和硬盘支持热插拔,可在设备运行状态下更换。Q2:Atlas 650E服务器的电源冗余方案是什么?A2:共配置6个PSU电源模块,支持任意5+1冗余。默认A路为主路全负载,B路为备路零负载。当输入电压低于200V AC或240V DC时,单PSU最大输出功率低于3kW,无法支持5+1冗余。Q3:Atlas 650E服务器的散热方案是否适用于通用风冷机房?A3:是的。整机采用风冷方式实现智能调节高效散热,满足通用风冷机房部署要求。整机集成30个风扇模组,支持N+1冗余。整机最大风量需求为3300 CFM。Q4:NPU模组在服务器中如何编号?A4:NPU模组编号为1~8。A1槽位(底层)NPU抽屉对应编号1/2/3/4,A2槽位(上层)NPU抽屉对应编号5/6/7/8,NPU5相对位置在NPU1正上方。Q5:Atlas 650E服务器支持哪些管理接口?A5:支持iBMC智能管理系统,兼容IPMI 2.0和Redfish规范。管理接口包括IPMI v2.0、CLI、HTTPS、SNMPv3。支持通过CCAE智能管理平台纳管运维,也支持通过Redfish接口被第三方网管集成。Q6:前面板的故障诊断数码管如何解读?A6:故障诊断数码管显示“。”表示设备正常;显示故障码表示设备有部件故障,详细故障码含义请参考《Atlas 650E服务器 iBMC告警处理》。数据来源说明。本产品信息来源于华为《Atlas 650E服务器 技术白皮书 01》(2026年6月30日发布),涵盖产品概述、组网拓扑、产品特点、物理结构、硬件描述、产品规格、系统管理等完整技术文档。
word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
1. **产品定位**:Atlas 650E服务器面向AI大模型训练/推理,基于鲲鹏950 CPU和Ascend 950DT NPU,提供高性能风冷计算系统。 2. **核心配置**:支持2×鲲鹏950 CPU+8×Ascend 950DT NPU,整机算力最高达14.274 PFLOPS(mxFP4),内存最大24×96GB DDR。 3. **组网与互联**:双机场景支持Full Mesh UB互联(800Gbps),单机通过以太网实现RoCE/UBoE协议。 4. **供电与散热**:最大功耗14.5kW,支持220V AC/336V HVDC,PSU效率96%;30个风扇N+1冗余,风冷散热。 5. **管理接口**:集成iBMC管理,支持IPMI/Redfish,提供带外管理、KVM over IP及虚拟媒体功能。 6. **物理规格**:14U机框,尺寸618.8×447×920mm,满配重量251kg,支持标准19英寸机柜。
Atlas 650E算力? 双机如何组网? 电源冗余几余?
客服
商务合作
小程序
服务号
折叠