速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码

速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码

图片来源:1X

谷歌于3 月 25 日发布下一代人工智能推理模型,Gemini 2.5,这是一个新的 AI 推理模型家族,它在回答问题之前会“思考”一下。

为了启动这一新模型家族,谷歌推出了Gemini 2.5 Pro Experimental,这是一个多模态推理 AI 模型,谷歌称其为迄今为止最智能的模型。

谷歌表示,未来其所有新的AI 模型都将内置推理能力。

自OpenAI 于 2024 年 9 月推出首个 AI 推理模型 o1 以来,科技行业竞相开发自己的模型以匹配或超越其能力。如今,Anthropic、DeepSeek、谷歌和 xAI 都拥有 AI 推理模型, 这些模型利用额外的计算能力和时间进行事实核查和问题推理,然后再给出答案。

推理技术帮助AI 模型在数学和编程任务中达到了新的高度。科技界的许多人认为,推理模型将成为 AI 代理的关键组成部分,这些自主系统可以在很大程度上无需人类干预地执行任务。然而,这些模型也更为昂贵。

谷歌之前已经尝试过AI 推理模型,去年 12 月发布了“思考”版本的 Gemini。但 Gemini 2.5 代表了该公司迄今为止在超越 OpenAI 的“o”系列模型方面最认真的尝试。

谷歌声称,Gemini 2.5 Pro 在多个基准测试中优于其之前的尖端 AI 模型,以及一些领先的竞争 AI 模型。具体来说,谷歌表示他们设计 Gemini 2.5 是为了在创建视觉上引人入胜的网页应用和代理编码应用方面表现出色。

在一项名为Aider Polyglot 的代码编辑评估中,谷歌表示 Gemini 2.5 Pro 得分为 68.6%,优于 OpenAI、Anthropic 和中国 AI 实验室 DeepSeek 的顶级 AI 模型。

然而,在另一项衡量软件开发能力的测试中,SWE-bench Verified,Gemini 2.5 Pro 得分为 63.8%,超过了 OpenAI 的 o3-mini 和 DeepSeek 的 R1,但表现不如 Anthropic 的 Claude 3.7 Sonnet,后者得分为 70.3%。

在Humanity’s Last Exam(人类最后的考试)中,这是一项由数千个众包问题组成的多模态测试,涉及数学、人文和自然科学,谷歌表示 Gemini 2.5 Pro 得分为 18.8%,表现优于大多数竞争对手的旗舰模型。

首先,谷歌表示Gemini 2.5 Pro 将配备 100 万个 token 的上下文窗口,这意味着该 AI 模型可以一次性处理大约 75 万个单词。这比整个《指环王》系列书籍还要长。很快,Gemini 2.5 Pro 将支持双倍输入长度(200 万个 token)。

特别声明:[速递|《指环王》级文本吞吐,谷歌发布Gemini2.5 Pro的能效比突破密码] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

马斯克放话:3到6个月后 特斯拉车主将能边开车边打游戏(马斯克终于说实话)

来源:快科技快科技8月5日消息,今日,特斯拉CEO马斯克在X平台表示,很快司机就能在驾驶时玩视频游戏,这一疯狂的功能最快将在3至6个月内上线,前提是获得所在地监管机构的批准。 据悉,近日X上流传的一段视频显…

马斯克放话:3到6个月后 特斯拉车主将能边开车边打游戏(马斯克终于说实话)

智慧小区安防管控系统解决方案(36页 PPT)(智慧安防小区建设方案)

从实际需求来看,无论是基层管理部门还是居民,都对更智能、更高效的安防系统有着迫切期待:管理人员希望通过技术减轻工作负担,精准掌握社区动态;居民则渴望在家门口就能感受到实实在在的安全感。 智慧安防小区的核心,在…

智慧小区安防管控系统解决方案(36页 PPT)(智慧安防小区建设方案)

格力取得空调摆叶相关专利,防止摆叶表面冷凝水沿导风面被吹飞至环境当中(格力空调摆叶拆除图解)

金融界2025年8月5日消息,国家知识产权局信息显示,珠海格力电器股份有限公司取得一项名为“空调摆叶、导风装置及空调器”的专利,授权公告号CN223191803U,申请日期为2024年10月。其中的空调摆叶包…

格力取得空调摆叶相关专利,防止摆叶表面冷凝水沿导风面被吹飞至环境当中(格力空调摆叶拆除图解)

0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”(整治训练虚假)

海量数据为AI模型提供了充足的训练素材,使其得以学习数据的内在规律和模式,实现语义理解、智能决策和内容生成。受到数据污染的人工智能生成的虚假内容,可能成为后续模型训练的数据源,形成具有延续性的“污染遗留效应”…

0.01%虚假训练文本可致有害内容增加11.2% 警惕人工智能“数据投毒”(整治训练虚假)

“唐僧”迟重瑞:入赘豪门35年,称老婆为董事长,今73岁卖力带货

在三十多年的婚姻里,陈丽华与迟重瑞的相处模式也与常人很是不同,吸引了很多人的关注...... 有网友调侃他“晚年拼命赚钱,是不是因为在豪门中没地位”,不过我想婚姻总归是两个人的事情,人情冷暖,恐怕也只有自…

“唐僧”迟重瑞:入赘豪门35年,称老婆为董事长,今73岁卖力带货