AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14...
AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。
这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。
研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的DeepSeek的7B小模型,不仅在准确率上超越671B参数的DeepSeek-V3,响应速度还提升50倍以上。
他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI大语言模型离破解这类数学难题又近了一步。
扬子晚报/紫牛新闻 宋世锋
校对 盛媛媛
来源:本文内容搜集或转自各大网络平台,并已注明来源、出处,如果转载侵犯您的版权或非授权发布,请联系小编,我们会及时审核处理。
声明:江苏教育黄页对文中观点保持中立,对所包含内容的准确性、可靠性或者完整性不提供任何明示或暗示的保证,不对文章观点负责,仅作分享之用,文章版权及插图属于原作者。
Copyright©2013-2024 JSedu114 All Rights Reserved. 江苏教育信息综合发布查询平台保留所有权利
苏公网安备32010402000125
苏ICP备14051488号-3技术支持:南京博盛蓝睿网络科技有限公司
南京思必达教育科技有限公司版权所有 百度统计