阿里巴巴集团旗下通义千问团队近日推出新一代大模型Qwen3-Next。该模型采用高稀疏MoE新架构,并对Transformer核心模块进行重构,通过混合注意力机制显着提升训练与推理效率,在实现更强性能的同时大幅降低计算成本。

在新架构基础上,团队推出总参数量达800亿、实际激活仅30亿的Qwen3-Next-80B-A3B系列模型,包括指令与推理两个版本。新模型在计算效率明显提高的同时,性能可媲美此前发布的2350亿参数千问3旗舰模型。
新架构和模型发布引发业界广泛关注,资本市场反应积极。阿里巴巴美股11日收盘大涨近9%,创近四年新高;其港股12日也上涨逾5%,收盘报约150.8港元(约合人民币140元)。