紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

：2025年03月04日：扬子晚报网

分享到：

AI大语言模型虽然是目前最热门的话题，不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现，通过低成本地训练，对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14...

AI大语言模型虽然是目前最热门的话题，不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现，通过低成本地训练，对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导，它们的数学推理能力就开始暴涨，甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者，联合南通大学的嵇天博，以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型（LLM）解决复杂数学问题的能力，其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题，涉及有理函数的多项式表示，其首个反例直到1927年才被发现，至今仍是一个重要的数学难题，在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法，仅用2张A100显卡训练4小时的DeepSeek的7B小模型，不仅在准确率上超越671B参数的DeepSeek-V3，响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练，经过优化的模型自主构建出一个全新多项式，成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索，而AI仅用数小时就实现了创造性突破。研究者预言，AI大语言模型离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻 宋世锋

校对盛媛媛

[我要纠错]

文：王振袢&发表于江苏

关键词：语言模型虽然目前热门

来源：本文内容搜集或转自各大网络平台，并已注明来源、出处，如果转载侵犯您的版权或非授权发布，请联系小编，我们会及时审核处理。
声明：江苏教育黄页对文中观点保持中立，对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证，不对文章观点负责，仅作分享之用，文章版权及插图属于原作者。

点个赞

踩一脚

上一篇惊蛰 | 万物生长，奋发向上

下一篇镇江句容：从小学雷锋长大做先锋

您在阅读：紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

最热文章

更多>>

教育百科

更多>>

紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

文：王振袢&发表于江苏

关键词：语言模型虽然目前热门

您在阅读：紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

最热文章

教育百科

相关新闻

联系我们

用户服务

客户服务

网站公告

媒体我们

微信公众号

新浪微博

全国统一热线： 025-81550000

紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

文：王振袢&发表于江苏

关键词： 语言 模型 虽然 目前 热门

最新文章

您在阅读：紫牛热点|南航领衔团队低成本训练4小时，DeepSeek数学能力暴涨

最热文章

教育百科

相关新闻

联系我们

用户服务

客户服务

网站公告

媒体我们

微信公众号

新浪微博

全国统一热线： 025-81550000

关键词：语言模型虽然目前热门