AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了

大模型也许不该说话了。这是AI界一个正在成型的新共识:语言,正成为阻碍推理能力释放的瓶颈。

传统的『大语言模型』,从GPT到Claude,从Bard到Deepseek,都是靠“说话”来推理的。问它一个数学题,它会列出“思考过程”;让它分析伦理难题,它也会“条理清晰”地给你一个逻辑铺陈。但这些文字,其实是代价高昂的赘余表达。

语言不是模型的母语,数学空间才是。模型“脑中”的信息,永远以向量存在。这个空间叫做latent space,潜空间。无论是GPT还是Gemini,它们的所有计算过程都是向量到向量的变换。每一个词,都是被转换成数值后才能“被理解”。

但模型不能一直待在这个空间。它必须定期“翻译”成一个个词语——也就是我们看到的回答过程。这一步不只是信息损失严重,而且计算成本极高,尤其是面对复杂推理任务,转换频率越高,效率越低。

今日霍州(www.jrhz.info)©️

现在,有人打破这个常规。

去年,Meta实习生Shibo Hao搞了一个新模型,叫Coconut。这个模型的核心创新在于:它拒绝频繁从潜空间跳出来说话。

传统模型的“思考”是一串词,Coconut直接把“思考”锁定在数学空间里,一直不说话,直到最后才输出结果。它绕开了“文字思维”,保留了更丰富的内部信息,更像是人类的直觉式推理。

效果很惊人。在逻辑推理测试中,它和GPT-2版本一样精准(98.8%),但只用了十分之一的词。在多选任务中,它更少语言、更高准确率。关键是:同样的底座模型,Coconut不换架构、不加参数,仅仅绕开语言,就做得更好。

更极端的是另一组人。

马里兰大学的Tom Goldstein团队,干脆连固定层数都不要了。他们做了一个循环结构,让模型自己决定思考几次。模型可以在潜空间中反复循环,不断迭代,直到认为“我想明白了”,才出来说话。

更离谱的是,模型自己学会了“简单问题快出结果,复杂问题多想几轮”。没有人教它怎么判断,它在潜空间中自己形成了“难度感知”。

特别声明:[AI界最新共识:语言,不是模型的母语,数学空间才是!它该闭嘴了] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

如何选择适合2025年夏季的食品保冷工具,确保生日蛋糕和饮品新鲜送达?(如何选择适合『肿瘤』患者的营养补充剂,下列描述正确的是?)

随着消费升级,选择合适的食品保冷袋成为保障食品新鲜的重要一环。尤其针对生日蛋糕、奶茶这类对外卖温度敏感的产品,在挑选保冷袋时,除了注重其材质外,还需兼顾保冷时长和便携性。本文详细解析如何根据送餐距离、保温需求及使用场景选择最合适的保冷工具,

如何选择适合2025年夏季的食品保冷工具,确保生日蛋糕和饮品新鲜送达?(如何选择适合『肿瘤』患者的营养补充剂,下列描述正确的是?)

令人惊叹!这些古人造的东西,放到现在看,依然相当炸裂…(真是令人惊叹啊)

18世纪时,清朝广东十三行向欧洲出口的贝母扇子非常精美,扇面上雕刻着当时十三行的繁荣景象,历史气息浓厚。 印度有一件400年历史的折叠古兰经支架,制作精美,且由一整块玉石雕刻而成,旋扣的雕刻…

令人惊叹!这些古人造的东西,放到现在看,依然相当炸裂…(真是令人惊叹啊)

中年男人的“梦中情表”,越戴越上头

激动的心情溢于言表,朗格奥德修斯的美沁人心脾!40.5毫米表径和手腕的贴合度相当不错,标志性的大星期与大日历窗对称布局,完全符合一个中年男人的对称审美,日历和星期快调的手感相当丝滑。 ▲德表的快调设计理念都很…

中年男人的“梦中情表”,越戴越上头

突发!曝『李湘』前夫李厚霖被刑拘,哥哥妹妹也被牵连,欠债10多亿(『李湘』2021)

更蹊跷的是,他的账号更新,就像突然被按了暂停键,最后一条视频定格在九月份,之后再无声响。早在2023年2月,他一手创办的“恒信”钻石王国就宣告破产,公司被执行的金额加起来超过了八千万,那数字看着都让人眼晕。…

突发!曝『李湘』前夫李厚霖被刑拘,哥哥妹妹也被牵连,欠债10多亿(『李湘』2021)

如何在 NVIDIA GPU 上使用 Unsloth 微调『大语言模型』(LLM)(如何在家无声的把屁股打烂)

DGX Spark 基于 NVIDIA Grace Blackwell 架构打造,最高可提供 1 PFLOP 的 FP4 AI 性能,并配备128GB 的 CPU-GPU 统一内存,使开发者能够在本地运行…

如何在 NVIDIA GPU 上使用 Unsloth 微调『大语言模型』(LLM)(如何在家无声的把屁股打烂)