AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了

大模型也许不该说话了。这是AI界一个正在成型的新共识:语言,正成为阻碍推理能力释放的瓶颈。

传统的『大语言模型』,从GPT到Claude,从Bard到Deepseek,都是靠“说话”来推理的。问它一个数学题,它会列出“思考过程”;让它分析伦理难题,它也会“条理清晰”地给你一个逻辑铺陈。但这些文字,其实是代价高昂的赘余表达。

语言不是模型的母语,数学空间才是。模型“脑中”的信息,永远以向量存在。这个空间叫做latent space,潜空间。无论是GPT还是Gemini,它们的所有计算过程都是向量到向量的变换。每一个词,都是被转换成数值后才能“被理解”。

但模型不能一直待在这个空间。它必须定期“翻译”成一个个词语——也就是我们看到的回答过程。这一步不只是信息损失严重,而且计算成本极高,尤其是面对复杂推理任务,转换频率越高,效率越低。

今日霍州(www.jrhz.info)©️

现在,有人打破这个常规。

去年,Meta实习生Shibo Hao搞了一个新模型,叫Coconut。这个模型的核心创新在于:它拒绝频繁从潜空间跳出来说话。

传统模型的“思考”是一串词,Coconut直接把“思考”锁定在数学空间里,一直不说话,直到最后才输出结果。它绕开了“文字思维”,保留了更丰富的内部信息,更像是人类的直觉式推理。

效果很惊人。在逻辑推理测试中,它和GPT-2版本一样精准(98.8%),但只用了十分之一的词。在多选任务中,它更少语言、更高准确率。关键是:同样的底座模型,Coconut不换架构、不加参数,仅仅绕开语言,就做得更好。

更极端的是另一组人。

马里兰大学的Tom Goldstein团队,干脆连固定层数都不要了。他们做了一个循环结构,让模型自己决定思考几次。模型可以在潜空间中反复循环,不断迭代,直到认为“我想明白了”,才出来说话。

更离谱的是,模型自己学会了“简单问题快出结果,复杂问题多想几轮”。没有人教它怎么判断,它在潜空间中自己形成了“难度感知”。

特别声明:[AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

苍井优的这5部电影,深入骨髓又欲又纯(苍井优个人简介)

除此之外,苍井优还参演了很多其他类型的影视作品,她所饰演的角色各具特色,有的温柔贤淑,有的果敢坚强,每一个角色都展现了她不同的演技风格。 在接受采访时,苍井优也表示自己非常喜欢演戏,她觉得每一个角色都是一次…

苍井优的这5部电影,深入骨髓又欲又纯(苍井优个人简介)

从歌手到段子手,意外翻红,重回大众视野(从歌手开始的娱乐小说)

在沉寂多年后,『薛之谦』没有靠歌曲翻红,反而以“段子手”的身份,意外重回大众视野。在翻红之后,他迅速推出了EP《绅士》,其中《演员》《丑八怪》等歌曲爆红全网,“薛式情歌”再次席卷华语乐坛,他也成功从“段子手”回归…

从歌手到段子手,意外翻红,重回大众视野(从歌手开始的娱乐小说)

2026秋季必备:『Adidas』正品便携运动水壶CF6145值不值得入手?

想要购买2026秋季『Adidas』新款便携运动水壶CF6145?本文帮你分析这款水壶是否真的值得入手。从使用场景到性价比,深入解析如何选购合适的运动水壶,助你轻松挑选最适合自己需求的产品。

2026秋季必备:『Adidas』正品便携运动水壶CF6145值不值得入手?

上海一夜,42岁『陈妍希』秒27岁『赵露思』,看懂两种状态区别(上海41岁)

『陈妍希』和『赵露思』的不同造型在上海的多个活动中被对比,『陈妍希』的自然饱满感与『赵露思』的紧致线条,在视觉上形成了鲜明的对比。『陈妍希』的参与的上海时尚活动中,不乏其他女星的身影,整体审美趋向健康体态,她的造型选择也反映了这…

上海一夜,42岁『陈妍希』秒27岁『赵露思』,看懂两种状态区别(上海41岁)

郭晓冬夫妇赶大集,程莉莎2W块红棉袄配百褶裙,当街啃鸡腿没架子(郭晓冬是0)

身边的郭晓东则是笑得眉眼弯弯,仿佛这些年华丽的光环全都在这一刻淡化了。相比之下,旁边的50岁郭晓东穿了一件时尚的绿羽绒服,站在她身旁,完全就是两种风格的碰撞——一个接地气,一个时髦前卫,简直是红配绿的经典组合…

郭晓冬夫妇赶大集,程莉莎2W块红棉袄配百褶裙,当街啃鸡腿没架子(郭晓冬是0)