• 停止校园欺凌、建设平安校园
  • 江苏自考报名-南京网络教育-教育培训--江苏教育黄页
  • 小宋通信商铺江苏移动手机套餐优惠多多
  • 司法考试 公务员考试 PHP教程 自考 注册会计师 会计证 统统免费下

紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨

:2025年03月04日 扬子晚报网
分享到:

AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14...

AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的DeepSeek的7B小模型,不仅在准确率上超越671B参数的DeepSeek-V3,响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI大语言模型离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻 宋世锋

校对 盛媛媛

[我要纠错]
文:王振袢&发表于江苏
关键词: 语言 模型 虽然 目前 热门

来源:本文内容搜集或转自各大网络平台,并已注明来源、出处,如果转载侵犯您的版权或非授权发布,请联系小编,我们会及时审核处理。
声明:江苏教育黄页对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。

点个赞
0
踩一脚
0

您在阅读:紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨

Copyright©2013-2024 JSedu114 All Rights Reserved. 江苏教育信息综合发布查询平台保留所有权利

苏公网安备32010402000125 苏ICP备14051488号-3技术支持:南京博盛蓝睿网络科技有限公司

南京思必达教育科技有限公司版权所有   百度统计

最热文章
最新文章
  • 阿里云上云钜惠,云产品享最低成本,有需要联系,
  • 卡尔蔡司镜片优惠店,镜片价格低
  • 苹果原装手机壳