中国人工智能企业深度求索5月29日低调上线DeepSeek-R1-0528模型,开发者实测显示其编程能力已逼近OpenAI旗舰产品o3-high。新模型在代码测试平台Live CodeBench中表现惊艳,更实现单任务连续60分钟的逻辑推演,创下国产AI长时思考新纪录。
据开源平台HuggingFace更新日志,此次升级基于DeepSeek V3 Base架构,重点强化逻辑推理与文本生成。实测用户反馈三大突破:代码生成质量提升至国际一线水平;文本输出更自然流畅,格式规范性提升40%;“幻觉”现象减少近半。有开发者称其推理过程“兼具速度与缜密度,风格独树一帜”。
深度求索同步披露技术细节:新模型融入强化学习技术,在前端开发、中文创作等场景表现突出。3月发布的V3-0324版本已借鉴R1训练方法,但本次升级未沿用"V4"命名体系,引发业内对版本迭代标准的讨论。
尽管市场期待已久的R2模型仍未亮相,但工程师社区注意到新版本思维链模式发生显着变化。深度求索在官方社交回应称,将持续优化现有架构,"当技术突破足以定义新时代时,R2自会到来"。目前该模型已在HuggingFace开源。