全球AI算力需求持续升温,中国厂商正加速布局“超节点”架构。百度近日披露,昆仑芯P800已完成规模化验证,基于该芯片的天池256卡超节点将于6月正式上市,支持按需搭建数十万卡级集群。

超节点是一种大规模算力集群架构,最早由英伟达提出。它将数百至上万颗GPU或NPU、高速网络交换器与高密度存储设备紧密耦合,形成单一的高性能计算单元,用于大模型训练和推理。
百度集团执行副总裁沈抖13日透露,天池256卡超节点的吞吐性能较上一代提升25%,已完成文心、DeepSeek、GLM、MiniMax等主流模型的适配,推理效率提升50%,并可扩展至百万卡规模。
除百度外,华为、紫光股份、华勤技术等也在加速推进。华为展出昇腾384超节点,已部署超过300套,服务20余家客户;今年第四季度将推出昇腾950超节点,算力达8 EFLOPS FP8或16 EFLOPS FP4.紫光股份旗下新华三发布S80000超节点系列,单机柜最高支持128卡,可扩展至16384卡。华勤技术的超节点产品已于第二季度开始小批量出货,预计下半年批量发货,全年收入或超过人民币100亿元。
需求端方面,今年3月中国移动首次启动AI超节点设备采购,规模达6208卡。开源证券指出,2025年下半年起,各家云服务商、算力芯片厂商和ICT厂商已陆续推出超节点样品。机构分析认为,随着国产AI芯片量产推进,2026年或成为超节点放量元年。