紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨

紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨

AI大语言模型虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型DeepSeek的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升大语言模型(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的DeepSeek的7B小模型,不仅在准确率上超越671B参数的DeepSeek-V3,响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI大语言模型离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻记者 宋世锋

校对 盛媛媛

特别声明:[紫牛热点|南航领衔团队低成本训练4小时,DeepSeek数学能力暴涨] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

罗家英四度患癌花光积蓄,汪明荃不拿钱被指无情,网友评论两极化(罗家英如何抗癌)

接着罗家英称以前几度患癌,他都是发现哪里长东西,就直接做手术切除掉,所以他根本不害怕,发现问题就及时处理掉。 还有人指出两人都是二婚,所以在一起更像是搭伙过日子,彼此都没有什么归属感,但也有网民替汪明荃平反…

罗家英四度患癌花光积蓄,汪明荃不拿钱被指无情,网友评论两极化(罗家英如何抗癌)

山东航空空服如此,女明星们穿上空服又将是如何景象呢?(山东航空服务态度怎么样)

袁泉饰演的乘务长毕男则是一种标杆,笔挺的制服配合利落的发髻,冷静的眼神与挺拔的姿态,传递出乘务长的权威感。 **惊艳时刻:甜心空乘与神仙姐姐** 还有杨颖在《中国机长》中客串空姐,凭借一张丸子头的剧照就引发了…

山东航空空服如此,女明星们穿上空服又将是如何景象呢?(山东航空服务态度怎么样)

液压传动测试实验装置,机械基础创新综合设计实验平台(液压传动实验指导书)

功能特点:1、电气控制线路元器件都装在作为挂板的安装板上,操作方便、更换便捷,便于扩展功能或开发新实训,操作内容的选择具有典型性和实用性;2、操作台只需三相四线的交流电源,即可投入使用;3、技能培训用的控制…

液压传动测试实验装置,机械基础创新综合设计实验平台(液压传动实验指导书)

三大巨头,同日官宣!(三大巨头啥意思)

三家基础电信企业要求,如果用户明确拒绝电话营销的业务,就不能再继续呼叫打扰用户;电话营销必须全面准确介绍营销内容,不虚假宣传、诱导消费,不隐瞒资费标准、适用场景、有效期限、限制性条件等关键信息,所有向用户推…

三大巨头,同日官宣!(三大巨头啥意思)

免洗柔顺护发素好吗?面试必杀技,HR忍不住夸的‘职场发质’(免洗柔顺护发素怎么用)

如果你也想告别“炸毛日常”,不妨试试这几款口碑发膜,亲测能让你从“头”开始,轻松拥有女明星同款顺滑!如果你也想告别“稻草头”,拥有顺滑亮丽的秀发,那就试试黛熙梦臻萃修护发膜吧! 干性发质的我,邂逅了沙宣的洗护…

免洗柔顺护发素好吗?面试必杀技,HR忍不住夸的‘职场发质’(免洗柔顺护发素怎么用)