Deepseek发布的最新开源数学模型正在推动其与OpenAi和谷歌等科技巨头竞争。 DeepSeekMath-V2模型在号称全球最难的数学竞赛中达到了金牌级别,成为第一个实现这一成就的开源模型,标志着开源人工智能复杂推理能力的重大突破。昨天,Deepseek宣布推出其最新数学推理模型DeepseekMath-V2,在模拟2025年国际数学奥林匹克(IMO)中解决了6道题中的5道,达到金牌水平。这一成就使其成为第一个在 IMO 级别竞赛中获得金牌的开源模型,引起了 AI 研究和开发者社区的高度关注。这个表现是直接对标行业巨头的。仅在今年 7 月,谷歌 Deepmind 的 Gemini Advanced 版本和一个实验性智能OpenAi 的 gence 模型也达到了 IMO 2025 黄金标准,也解决了 5 个问题。它们是第一个达到这一水平的人工智能模型。不过,与Google和OpenAi的闭源实验模型不同的是,DeepSeekMath-V2模型权重已在Apache 2.0许可下公开发布,可供公众下载。值得一提的是,DeepseekMath-V2采用了创新的自我验证训练框架。该方法的核心是训练一个专家“验证者”,其任务是评估证明过程的质量而不是最终答案的正确性。并且为了防止模型过度拟合自身的验证机制,Deepseek通过增加计算量和自动标记难以验证的证明来不断提高验证过程的难度,确保验证器和生成器同时进化。此举被视为民主进程中的重要一步人工智能的化。这一模型的发布不仅证明了开源社区有能力在前沿AI研究领域赶上甚至与领先的闭源实验室相媲美,而且还可能重新引发市场关于开源模型是否会消除闭源产品商业护城河的讨论——这个话题目前将回避英伟达等AI巨头的投资者信任。跻身顶尖行列:与OpenAi、Google竞争 出色表现 DeepseekMath-V2标志着其与复杂推理领域全球领先的AI实验室处于同一起跑线。国际数学奥林匹克(IMO)通常被认为是世界上最艰难的高中数学竞赛。在2025年的比赛中,630名人类参赛者中只有72人获得了金牌。除了在 IMO 2025 上取得的成绩外,该模型还在其他具有挑战性的数学竞赛中表现出色。昂斯。据Deepseek称,它还在中国顶级全国竞赛——中国数学奥林匹克(CMO)中达到了金牌水平。在普特南本科生数学竞赛(Putnam 2024)中,该模型完美解决了 12 道题中的 11 道,并且仅在另一道题中犯了一个错误。最终模型得分为118/120,远高于人类竞赛90分的最高分纪录。开源里程碑:社区称赞“一个很棒的版本” 与Google和OpenAi尚未公开的实验模型相比,DeepseekMath-V2的主要吸引力在于其彻底的开放性。模型的权重在开源社区发布,允许研究人员和开发人员免费下载。 Hugging Face 联合创始人兼首席执行官 Clement Delangue 登上社交平台 2025 年黄金级模特。 ”他强调,用户可以不受限制地探索、微调、优化模型,并在自己的硬件上运行。另一网网友Elie还评论道:“Deepseek Math V2是第一个开放地图模型吗?它会达到IMO的黄金标准吗?而且我们还得到了一份技术报告,这确实是一个令人惊叹的发布。”有网友评论说,他们喜欢5-7个想法,每个想法都很简单,一直坐着,结果出人意料地变得越来越好,这看起来更像工程,而不是像定理证明这样的研究数学任务,需要严格的逐步推导,而不仅仅是数值答案。为了解决这个问题,DeepSeekMath-V2采用了一种创新的自验证训练框架,该方法的核心是训练一个专门的“验证器”,其任务是评估证明过程的质量而不是最终答案的正确性,然后将这个验证器用作奖励模型来引导独立的证明生成器。至于检查机制——即只学会欺骗自己的验证器。这是一种动态演化方法。团队通过增加计算量和自动标记难以验证的证明来不断增加验证过程的难度,确保验证器和生成器同时进化。 Deepseek在技术文件中解释说,这种方法允许他们“扩展验证计算以自动标记新的、难以验证的证明,从而创建新的训练数据以进一步改进验证器。”通过这种闭环生成机制和元验证机制,模型可以实现全自动数据标注和持续性能优化,证明了学习系统或自我激励解决复杂数学推理任务的可行性。
特别声明:以上内容(如有则包括照片或视频)由自媒体平台“网易号”用户上传发布。本平台仅提供信息关于存储服务。
注:以上内容(包括图片和视频,如有)由网易HAO用户上传发布,网易HAO为社交媒体平台,仅提供信息存储服务。
第一个在数学奥林匹克竞赛中获得金牌的开源模型! DeepSeek新模式获网友称赞:技术文档公开了,太神奇了!
2025-11-28
