探索AI写代码极致:Claude Opus 4.1模型登场,软件工程能力再攀新高峰(ai识别代码)

8 月 6 日消息,Anthropic 公司今天(8 月 6 日)发布公告,宣布推出 Claude Opus 4.1 模型,相比较今年 5 月推出的 Claude 4 系列模型,主要改进了编码、推理和执行指令的能力。

Anthropic 表示,Claude Opus 4.1 在 SWE-bench Verified 上(用于评估软件工程准确性)提升到了 74.5%,作为对比,Claude Sonnet 3.7 的准确率为 62.3%,而 Claude Opus 4 的准确率为 72.5%。具体来说,更新后的模型在“深度研究和数据分析技能,尤其是在细节追踪和代理搜索方面”表现得更加出色。

与 Opus 4 相比,Opus 4.1 在大多数功能上都有所提升,特别是在多文件代码重构方面表现尤为突出。附上相关数据如下:

Rakuten Group 发现,Opus 4.1 不做不必要的调整或引入新的错误,能够精确地在大型代码库中定位并修正错误。

Windsurf 报告称,Opus 4.1 在其初级开发者基准测试中,比 Opus 4 表现提高了标准差的一个单位,这一性能飞跃与从 Sonnet 3.7 到 Sonnet 4 的跳跃相当。

最新的模型今日起面向 Claude 客户开放,可以通过 Claude Code、Anthropic 的 API、亚马逊 Bedrock 和谷歌云的 Vertex AI 使用。

同时,Anthropic 在『社交媒体』上表示,计划在未来几周内发布“对我们模型的重大改进”,因此可以期待 Claude 系列模型的更多升级。OpenAI 也预计将在本周发布新消息。(故渊)

特别声明:[探索AI写代码极致:Claude Opus 4.1模型登场,软件工程能力再攀新高峰(ai识别代码)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

多粗的线配多大的开关怎么选?(多粗线配多大空开和漏保)

匹配开关时需根据负载功率调整:若为普通混合负载(如厨房多电器同时工作),适配20A开关,预留一定安全余量;若为单一大功率设备(如2匹空调,额定电流约12A),可适配25A开关,避免频繁跳闸。这类电路需选用“C…

多粗的线配多大的开关怎么选?(多粗线配多大空开和漏保)

日本大尺度影片《温柔的美兽》修道院暗影下的反抗,杀手的自我救赎与逃亡(日本大尺度影片教师)

影片通过玛丽亚的视角,带领观众走进修道院这个神圣而又神秘的地方,揭开了隐藏在其背后的种种虚伪与黑暗,展现了信仰崩塌后的内心挣扎与反抗,最终通过帮助他人找到了自我救赎的真正意义。 三、帮助他人实现自我救赎在小村…

日本大尺度影片《<strong>温柔的美兽</strong>》修道院暗影下的反抗,杀手的自我救赎与逃亡(日本大尺度影片教师)

权威解析控油保湿男士护肤品排行榜,告别外油内干(控油有什么用)

品牌定位: 作为日本美妆巨头资生堂旗下的男士专属系列,资生堂男士秉承了品牌精简、高效的护肤哲学,专为注重护肤仪式感与温和功效的亚洲都市男性♂️打造。品牌在保湿与舒缓领域拥有技术优势,其配方常采用高浓度的有效成分…

权威解析控油保湿男士护肤品排行榜,告别外油内干(控油有什么用)

全世界最赚钱的擦边女王,一年赚了5.8亿(全世界最赚钱的24个人)

岁末,当打工人们还在为年终奖斤斤计较时,21岁的擦边网红索菲·雷恩(SophieRain)在『社交媒体』上轻描淡写地晒出了自己Onlyfans的后台数据: 作为全球第二大成人网站,Onlyfans2023年的…

全世界最赚钱的擦边女王,一年赚了5.8亿(全世界最赚钱的24个人)

黄金大跳水 记者实探深圳水贝 金价巨幅波动引发关注(黄金跳水对股市的影响)

2026年初,国际金价经历了剧烈波动。现货黄金价格从约4320美元💵盎司迅速攀升,突破多个关键价位,最高达到5598美元💵盎司,累计涨幅一度高达29%,两周内涨幅达21%。然而,从北京时间1月29日22:30起,金价开始大幅下跌

黄金大跳水 记者实探深圳水贝 金价巨幅波动引发关注(黄金跳水对股市的影响)