就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1(阻击手已就位)

机器之心报道

机器之心编辑部

你会掏钱吗?

你说巧不巧,就在 Sam Altman 官宣两个开源推理模型之前的半个小时,却被 Anthropic 抢先一步,发布了新模型 Claude Opus 4.1。

以前只有 OpenAI 抢占别人家的风头,这次轮到 OpenAI「被截胡」了!历史总是充满戏剧性!

对比他们发推时间,算下来就是前后脚的功夫,不知是 Anthropic 提前得知了消息,还是刚巧赶上了,又或者是 Anthropic 以为 OpenAI 要发 GPT-5,提前放出模型,时间挨的那么近,应该不是巧合。大家觉得呢?

总之,国外这几家公司上新模型,基本都在按照这个循环进行。

Claude Opus 4.1 登场

最新 Claude Opus 4.1 模型,基于 Claude Opus 4 构建,后者在今年 5 月末发布。可以看出 Anthropic 模型迭代速度还是非常快的。Claude Opus 4.1 主要在智能体任务、真实世界编程和推理能力上有了大幅提升,具有 200K 上下文窗口。

对于商业用户和个人用户而言,Claude Opus 4.1 已面向 Claude Pro、Max、Team 和 Enterprise(企业)用户开放使用。

对于开发者而言,Claude Opus 4.1 可通过以下平台使用:

Anthropic APIAmazon BedrockGoogle Cloud 的 Vertex AI

此外,Claude Opus 4.1 也已集成至 Claude Code 中。

在 API 价格方面,Claude Opus 4.1 的定价为:

每百万输入 token 15 美元💵每百万输出 token 75 美元💵

如果启用提示缓存(prompt caching),最多可节省 90% 的成本;使用批处理可节省多达 50% 的成本。

定价:https://www.anthropic.com/pricing#api

在性能方面,Opus 4.1 在 SWE-bench Verified 基准上达到 74.5%,此外,该模型还在深度研究和数据分析等方面有所提升,尤其是在细节追踪和智能体搜索方面。

根据 GitHub 评估,Claude Opus 4.1 在大多数能力上相较于 Opus 4 都有所提升,尤其在多文件代码重构方面表现出显著进步。

企业用户方面,Rakuten Group 发现,Opus 4.1 在处理大型代码库时,能够精准定位需要修改的部分,且不会做出不必要的更改或引入新的 bug。这种精确性让他们的团队更愿意在日常调试任务中使用它。

还有企业用户称,在他们的初级开发者评估基准测试中,Opus 4.1 相比 Opus 4 提升幅度很大,其性能飞跃大致相当于 Sonnet 3.7 升级至 Sonnet 4 的提升幅度。

Anthropic 建议所有用户将 Opus 4 升级至 Opus 4.1。在 API 中,开发者只需使用 claude-opus-4-1-20250805 即可接入新版模型。

使用场景

Claude Opus 4.1 提供了混合推理模式,既可以实现即时响应,也可以展示推理过程。API 用户还可对思维预算进行精细控制,以实现成本与性能的最优平衡。

其典型应用场景包括但不限于:

高级编程能力:Claude Opus 4.1 在 SWE-bench 基准上处于领先地位,能够完成耗时数日的工程任务,并在成千上万步操作中提供连贯且具备上下文感知的解决方案。得益于更优的代码品味与 32K 的输出 token 支持,它可以灵活适应特定的编程风格,在大规模代码生成与重构项目中展现出卓越的质量表现。

智能体搜索与研究:Claude Opus 4.1 能够高效地检索外部和内部数据源,在复杂的信息环境中综合出全面的洞见。凭借其在智能体搜索任务中的强大表现,它可以进行长达数小时的自主研究 —— 同时分析包括专利数据库、学术论文和市场报告在内的多种资料,为决策提供战略性洞察。

最后,随着新模型的发布,Anthropic 还发布了系统卡,感兴趣的读者,可以前去阅读。

地址:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf

大家也是期待新模型可以解决屎山问题。

不过,面对高昂的订阅费,大家也是吐槽:太贵,买不起。

「太吃token了。」

对了,在谷歌攒的 AI 国际象棋比赛第一天,Claude Opus 4 败给了 Gemini 2.5 Pro,不知 Claude Opus 4.1 要是参战的话,结局会不会改写。

特别声明:[就是阻击OpenAI,Claude抢先数十分钟发布Claude Opus 4.1(阻击手已就位)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

你知道铸铁壶铃合模线是怎么去除的吗?(铸铁壶制作视频)

壶铃是灰铁铸件,硬度较高,需要打磨灰铁铸件中的合模缝,就必须要用大扭矩主轴来进行加工,搭配浮动和『机器人』️一起进行打磨,主轴转速30000转,精度1μm,组合大扭矩马达,搭配上浮动,浮动范围±5°,给主轴提供浮…

你知道铸铁壶铃合模线是怎么去除的吗?(铸铁壶制作视频)

2025宝宝湿巾新宠!植护湿巾新生婴儿手口屁专研纯水湿巾大包实惠装怎么选?(婴儿湿巾超标名单)

随着2025新国标的推行,如何为新生婴儿挑选优质的湿巾?本文深入剖析植护湿巾新生婴儿手口屁专研纯水湿巾,解读纯水配方、大包装实惠等亮点,助您轻松找到最适合的产品。从选购技巧到使用建议,全面满足新手爸妈需求。

2025宝宝湿巾新宠!植护湿巾新生婴儿手口屁专研纯水湿巾大包实惠装怎么选?(婴儿湿巾超标名单)

2025年AI写作工具选择指南 学术场景高效适配推荐(ai智能写作app)

1.全流程学术需求首选:无论你是大学生完成毕业论文、研究生开展课题研究,还是教师发表科研论文,PaperRed的全流程辅助与免费AIGC检测功能都能精准匹配需求,堪称“学术写作标配工具”;2. 理工科选京…

2025年AI写作工具选择指南 学术场景高效适配推荐(ai智能写作app)

马斯克豪言xAI若挺过关键期 将在AI赛道击溃所有对手(马斯克说shib)

这场内部会议上,马斯克着重阐述了xAI在算力、数据基础设施及融资能力上的核心优势,认为这些要素是公司实现"超级智能"目标的关键支撑。这种产业联动已产生实际成果——特斯拉今年早些时候将Grok AI集成至车

马斯克豪言xAI若挺过关键期 将在AI赛道击溃所有对手(马斯克说shib)

『明星』️苍蝇馆聚餐,阿如那清秀,雷佳音肚大腰粗油腻,『郑恺』不理苗苗(『明星』️苍蝇馆聚餐是哪一集)

一踏入这喧闹之地,墨镜🕶️便随意挂在领口,仿佛卸下了所有星光,只剩老友相聚的松弛。 领奖台上,他仿佛被一层忧郁的薄雾笼罩,是经典的文艺片男主形象;而私下与兄弟勾肩搭背、笑靥全开时,那份“孤独”早已被热闹的情谊蒸发…

『明星』️苍蝇馆聚餐,阿如那清秀,雷佳音肚大腰粗油腻,『郑恺』不理苗苗(『明星』️苍蝇馆聚餐是哪一集)