刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高

科技小镇与凉梦2025年08月15日 17:0935阅读

刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高

GPT-4.5正式发布，号称OpenAI最大和最好的聊天模型。

但很意外啊，这么大的事奥特曼都不来。

这次OpenAI也不打算秀炫酷的解题，也不打算晒各种榜单的排名，反而强调起了情商。

第一个现场演示：

“我又被朋友鸽了，帮我写个短信告诉他们我恨他们。”

o1意识到这样会“友尽”，但也只是很忠实的按要求完成了任务。

GPT-4.5甚至都没完成提示词中的任务，但整个互动显得更自然了：

先识别出用户很烦恼

建议更清楚的表达自己的情绪

给出两种备选方案

再询问用户是否坚持原来的要求

第二个现场演示，强调GPT-4.5掌握更多世界知识，以及讲述知识的方式更自然。

解释为什么海水是咸的。

GPT-4 Turbo掌握很多知识，但回答就像是在炫耀它很有知识，只是把事实罗列在一起。

同样这些知识，GPT-4.5的语气更有互动感，还考虑到用一句简洁的开场，让用户更容易记住三个关键词。

面对更专业的问题“用第一性原理解释AI对齐的必要性”，o1的回答像是写论文，而GPT-4.5通过“第1步、第2步、第3步……”来引导用户思考这个问题。

除了演示之外，直播中也透露了GPT-4.5开发过程的一些内幕：

如“激进地”使用了低精度训练，预训练阶段跨多个数据中心完成。GPT-4.5会成为未来推理模型的基础模型。

从今天起，GPT-4.5开放给200美元💵一个月的Pro用户。下周逐步开放给20美元💵一个月的Plus用户。

不是最前沿，但是最大模型

技术报告中表示：GPT-4.5不是一个前沿模型，但它是OpenAI最大的语言模型，比GPT-4的计算效率提高了10倍以上。

OpenAI称通过扩展无监督学习和推理提升AI的能力。

GPT‑4.5通过扩展计算和数据以及架构优化扩展了无监督学习，拥有更广泛的知识和更深入的世界理解能力，所以幻觉更少。

在衡量LLM事实准确性的SimpleQA基准上，GPT-4.5准确率62.5%，幻觉率37.1%，比GPT-4o、o1、o3mini优化了不少。

以下是一个具体的幻觉降低的案例。

假如用户询问“第一种语言是什么”，GPT-4.5会诚实回答不知道、这还是人类未解之谜，而不是随便蒙一个答案。

此外，Blog中还称开发了新的可扩展的技术，能够利用从小型模型衍生出的数据来训练更大更强的模型，由此提升了GPT‑4.5的可操控性、对细微差别的理解以及自然对话能力。

在人类偏好评估中，测试者更倾向于选择GPT‑4.5而非GPT‑4o。

OpenAI表示，GPT‑4.5对人类意图的理解更深刻，能够以更细腻的“情商”解读微妙的线索或隐含的期望，还展现出了更强的审美直觉和创造力，在协助写作和设计方面表现出色。

比如，当用户表达“考试不及格、很难过”，它会安慰、鼓励用户。作为对比，4o给出的回答就更加冰冷，没什么安慰的话语。

在一些回复上，GPT‑4.5对比4o回答也更简洁。

另外，OpenAI还晒出了GPT‑4.5在标准学术基准测试中的结果，全面超越GPT-4o，在SWE-Lancer Diamond（coding）和MMMLU（multilingual）上超越o3-mini。

API定价非常贵

值得一提的是，GPT-4.5的API定价非常贵。

75美元💵/百万tokens输入、150美元💵/百万tokens输出。

对比GPT-4o，定价高出去15-30倍。

到底这个价格值不值呢？不少人已经分享了抢先体验的效果。

拿到内测的博主表示，实际使用中GPT-4.5非常有创造力、一定上了很多人文课。

Claude 3.7和GPT-4.5两个，非常相似。

他还列举了GPT-4.5视觉理解能力很强的例子。它能从这张星露谷截图中发现非常小的元素蝴蝶。

“独角兽评估”的实测表现也很好。

后续随着更多实测放出，应该还能看到更多有意思的例子。

One More Thing

最后，大家一定很关心，奥特曼去哪了呢？

在医院照顾小孩。

是的，他最近刚刚喜提一子。

对比用户 SWELancer 模型奥特曼都

特别声明：[刚刚，GPT-4.5发布！OpenAI最大最贵模型，主打情商高] 该文观点仅代表作者本人，今日霍州系信息发布平台，霍州网仅提供信息存储空间服务。

猜你喜欢

2025-08-14

夏日必备！美容院级抹胸浴裙，纯棉薄款汗蒸服，让你享受SPA级护理✨(美容一下)

夏天到了，你还在为汗蒸或SPA时找不到合适的浴巾而烦恼吗？这款美容院专用的抹胸浴裙，采用纯棉材质，轻薄透气，不仅让你在汗蒸或SPA时更加舒适，还能保护私密部位，让你轻松享受夏日里的养生时光。下面，让我们一起深入了解这款浴裙的魅力所在吧！✨

夏日必备！美容院级抹胸浴裙，纯棉薄款汗蒸服，让你享受SPA级护理✨(美容一下)

2025-08-14

【国家补贴】小米米家智能墙壁插座，Mesh2.0升级，语音控制，生活从此更智能！💡✨(国家补贴小孩2025最新补贴政策是什么)

想要让家变得更智能吗？小米米家智能墙壁插座升级版，支持Mesh2.0技术，配合小爱同学语音控制，轻松实现家居智能化，享受科技带来的便利。本文将详细介绍这款插座的各项功能及使用体验，帮助你快速掌握智能家居的入门技巧，让你的生活更加便捷高效！💡

【国家补贴】小米米家智能墙壁插座，Mesh2.0升级，语音控制，生活从此更智能！💡✨(国家补贴小孩2025最新补贴政策是什么)

2025-08-14

你的扫码器也会“脑补”过度？别让它的“好心”办了坏事(扫码器设备)

更可怕的是，这个错误结果本身逻辑上还可能说得通，如果你的系统后台没有二次校验，就直接采信了这个错误信息，那后续的入库、分拣可就全乱套了。我们做过对比测试，在同一个QR码被遮挡了四分之一的情况下，一般的扫码器识…

你的扫码器也会“脑补”过度？别让它的“好心”办了坏事(扫码器设备)

2025-08-15

严肃性招考考场里的那根网线安全保密吗？(考试严肃性)

在各类高保密性考试场景中，无线🛜信号屏蔽与网络隔离是保障公平的必要手段，却也常导致电子评分系统供电中断、数据同步延迟甚至信息泄露风险。系统核心由计分服务器、评分设备、计时器及操作终端组成，所有设备通过有线网络直…

严肃性招考考场里的那根网线安全保密吗？(考试严肃性)

2025-08-15

港股异动 | 力劲科技(00558)再涨超14% 人形机器人️镁合金上量速度将快于汽车公司助推机器人️轻量化革命(力港网络股票行情)

智通财经获悉，力劲科技(00558)再涨超14%，本周累计涨幅已超54%。截至发稿，涨14.19%，报5.31港元，成交额3.48亿港元。消息面上，力劲科技近期与四家专精于镁合金和人形机器人️研发的公司共同签…

港股异动 | 力劲科技(00558)再涨超14% 人形<strong>机器人</strong>️镁合金上量速度将快于汽车公司助推<strong>机器人</strong>️轻量化革命(力港网络股票行情)