华为日前在深圳举行的“华为中国合作伙伴大会2026”上,正式推出搭载昇腾950PR处理器的Atlas 350加速卡。华为方面披露,该卡单卡算力达到英伟达H20的2.87倍,是目前中国国内唯一支持FP4低精度推理的产品。

华为昇腾计算业务总裁张迪煊介绍,Atlas 350的HBM内存容量为112GB,是H20的1.16倍,多模态生成速度可提升60%。内存访问粒度从512字节缩减至128字节,小算子访存效率提升4倍。快科技数据显示,该卡FP4算力达1.56P,带宽1.4TB/s,功耗600W,约为H20的1.5倍。
支持FP4低精度推理,意味着在模型推理环节可用精度换取效率。以700亿参数规模模型为例,FP4精度下仅需35GB显存即可单卡加载,而FP16精度则需要140GB显存。
华为副总裁马海旭在大会上表示,Atlas 350的上市,标志着昇腾950PR芯片如期进入商用阶段。昆仑、华鲲振宇、神州鲲泰、长江计算、宝德、软通华方及百信等7家合作伙伴同步发布了基于Atlas 350的整机产品。科大讯飞也宣布,新一代星火大模型将适配昇腾910与950系列算力底座。
据华为方面介绍,昇腾目前已支持50多个第三方开源社区与项目,累计贡献650多项关键特性。华为与合作伙伴联合打造了400多款行业一体机,服务客户超过2700家。近期伴随“养龙虾”等AI代理应用兴起,已有十多家合作伙伴推出基于昇腾的一体机产品。