开云体育下载地址在哪:立异展开 上海仪电助力新一代大模型推理网络架构ZCube初次在国产算力集群完结系统性验证
开云体育手机APP网页:
近来,由清华大学、上海仪电与上海驭驯联合展开的“新式智算集群组网架构ZCube”项目,依托互联网体系结构全国重点实验室上海智算分室,完结了扁平化组网架构相对传统组网架构的系统性比照验证。测验效果为,该架构在推理吞吐、呼应推迟等中心指标上全面优于当时干流Clos架构,为国产算力集群的规划化布置供给了技能参阅。
当时,智算集群遍及选用Clos多层交流架构,在大模型推理场景中易呈现部分链路拥塞,影响首字呼应速度与全体吞吐。ZCube选用全网扁平化拓扑规划,撤销Spine层,以“单轨+多轨”混合接入方法完结恣意GPU间仅两跳直达,从架构层面躲避结构性拥塞,一起可削减约三分之一交流机与光模块本钱。该规划论文已发表于网络范畴尖端会议ACM SIGCOMM 2025。
本次测验在1024卡国产算力集群规划上以背靠背独立测验方法比照ZCube与Clos架构。推理场景中,在PD别离布置下,掩盖8种不同节点调度方法。均匀首Token时延(TTFT)下降22%至30%,总吞吐提高7%至10%。练习场景中,在Qwen3 235B(EP8 PP8)MoE模型上,掩盖十余种装备,ZCube单次迭代时刻与Clos根本相等,部分装备略有优化。调集通讯使命中,AlltoAll优势随规划扩展而增强,最高完结14.7%的吞吐优势;Allgather与Allreduce两者功能相等。
在本年5月,智谱已在GLM-5.1 coding推理服务的千卡出产集群完结ZCube实践布置,完结交流机与光模块开销下降33%、GPU推理吞吐提高15%、TTFT P99下降40.6%。本次国产渠道复现效果与前期定论方向共同,中心优势得到再次验证。
现在,此项技能与工业使用事例入围2026年度国际人工智能大会杰出人工智能引领者奖(SAIL奖)TOP 30,效果孵化的上海驭驯已落地并入驻上海仪电旗下仪智空间,完结产学研效果闭环孵化。技能上,本次验证证明ZCube扁平化组网思维不依赖特定GPU品牌或类型,具有跨渠道推行潜力。团队后续将环绕更大规划集群与更多类型国产算力卡继续适配,稳步推动ZCube成为下一代智算中心建造规范。
下一篇:新一代大模型推理网络架构ZCube初次在国产算力集群完结系统性验证