紫牛热点|南航领衔团队低成本训练4小时,『DeepSeek』数学能力暴涨

紫牛热点|南航领衔团队低成本训练4小时,『DeepSeek』数学能力暴涨

AI『大语言模型』虽然是目前最热门的话题,不过它们的数学能力一直存在短板。南京航空航天大学联合南通大学、牛津大学组成的团队发现,通过低成本地训练,对国产开源AI大模型『DeepSeek』的7B小版本和Qwen2.5-14B进行推理指导,它们的数学推理能力就开始暴涨,甚至成功构造出困扰全世界数学家的关键反例。

这项发表于2024年2月27日的研究由南京航空航天大学的研究者李可晨担任第一作者,联合南通大学的嵇天博,以及牛津大学的两位研究者共同完成。研究聚焦于提升『大语言模型』(LLM)解决复杂数学问题的能力,其突破性成果直指著名的“希尔伯特第十七问题”——这个由德国数学大师大卫·希尔伯特在1900年提出的世纪难题,涉及有理函数的多项式表示,其首个反例直到1927年才被发现,至今仍是一个重要的数学难题,在自动驾驶算法、量子计算验证等前沿领域具有重要应用价值。

研究团队创新性地开发了“结构化推理指导”训练法,仅用2张A100显卡训练4小时的『DeepSeek』的7B小模型,不仅在准确率上超越671B参数的『DeepSeek』-V3,响应速度还提升50倍以上。

他们对另一个国产开源模型Qwen2.5-14B进行这样的训练,经过优化的模型自主构建出一个全新多项式,成功挑战了希尔伯特问题的现有理论边界——这类关键反例的发现通常需要数学家数十年探索,而AI仅用数小时就实现了创造性突破。研究者预言,AI『大语言模型』离破解这类数学难题又近了一步。

扬子晚报/紫牛新闻记者 宋世锋

校对 盛媛媛

特别声明:[紫牛热点|南航领衔团队低成本训练4小时,『DeepSeek』数学能力暴涨] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

雪蕾『香氛』博物馆以“香”为媒,奏响十五运倒计时50天序曲(雪蕾『香氛』博物馆开放了吗)

作为全球TOP级的沉浸式『香氛』文化体验场馆,雪蕾『香氛』博物馆以独特的嗅觉叙事方式,特别为十五运调制的“23个城市香味”与“5个全运体育香味”特色香型体系,成为本次活动的独特记忆。这一场精彩的 “跨界对话”,共…

雪蕾『香氛』博物馆以“香”为媒,奏响十五运倒计时50天序曲(雪蕾『香氛』博物馆开放了吗)

演练公告!(演练公告京东大道站)

演练公告!(演练公告京东大道站)

败家子邓兆尊:三女共侍他,每人每月拿50万工资,不结婚也不生子(败家仔百科)

香港豪门公子邓兆尊的另类人生:三位女友和谐共处的秘密,经历过家族纷争的他,对婚姻制度彻底失去信心,开创出自己独特的感情模式——与三位女友维持长期稳定关系,却坚持不婚不育。 "有钱就能为所欲为"是邓兆尊在节

败家子邓兆尊:三女共侍他,每人每月拿50万工资,不结婚也不生子(败家仔百科)

PE颗粒包装机_面膜冻干粉包装机_保温材料包装机(颗粒包装机工作原理)

●: 吨袋 (可选) (不同的物料,会用到不同类型的包装机,它们有什么区别,请联系我们的销售人员,谢谢!2、选配便捷给料方式:可选水平螺旋喂料或旋转阀加振动给料的方式,兼具自动取样功能,操作简单便捷。 的…

PE颗粒包装机_面膜冻干粉包装机_保温材料包装机(颗粒包装机工作原理)

女星许玮甯孕期胖12公斤!邱泽从务实男变身“梦幻老爸”(许玮甯是谁的老婆)

当记者追问育儿细节时,许玮甯眼带笑意描述着这位新晋奶爸的转变:从精算师秒变造梦师,连尿布台都要布置成卡通主题的梦幻程度堪比迪士尼在逃王子。 这场亮相最扎心的莫过于:当普通人还在和产后赘肉苦苦缠斗时,有人已经轻…

女星许玮甯孕期胖12公斤!邱泽从务实男变身“梦幻老爸”(许玮甯是谁的老婆)