【关注】字节跳动发布『豆包』大模型2.0，主打真实世界复杂任务执行力(title: (字节跳动新游戏)) #科技 #字节 #Agent #推理 #成绩 #模型

在连续发布Seedance 2.0视频模型、Seedream 5.0 Lite图像模型之后，2月14日，字节跳动宣布推出『豆包』大模型2.0（Doubao-Seed-2.0）系列。『豆包』2.0针对大规模生产环境的使用需求进行系统性优化，旨在更好地完成真实世界的复杂任务。

在语言模型基础能力上，『豆包』2.0 Pro旗舰版取得IMO、CMO数学竞赛和ICPC编程竞赛金牌🥇成绩，也超越了Gemini 3 Pro在Putnam基准测试上的表现，数学和推理能力达到世界顶尖水平。

大模型执行长链路复杂任务，需要丰富的世界知识。『豆包』2.0加强了长尾领域知识覆盖，在SuperGPQA等多项公开测试集上表现突出，科学领域知识测试成绩与Gemini 3 Pro和GPT 5.2相当，在跨学科知识应用上也排名前列。

在教育、娱乐、办公等众多场景中，大模型需要理解图表、复杂文档、视频等内容。对此，『豆包』2.0全面升级多模态理解能力，视觉推理、空间感知、长上下文理解等权威测试均取得业界最佳表现。

面对动态场景，『豆包』2.0增强了对时间序列与运动感知的理解能力，还可实现实时视频流分析、环境感知与主动交互，广泛应用于健身指导、『穿搭』建议、看护陪伴等生活场景。

今日霍州(www.jrhz.info)©️

Agent及推理能力部分评测成绩

Agent能力是大模型具备行动力的关键。测试成绩显示，『豆包』2.0 Pro在指令遵循、工具调用和Search Agent等评测中达到顶级水平，在HLE-Text（人类的最后考试）上更是获得54.2的最高分，大幅领先于其他模型。

目前，『豆包』2.0 Pro已在『豆包』App、电脑客户端和网页版上线，用户选择「专家」模式即可对话体验。火山引擎也已上线『豆包』2.0系列模型API服务。

据悉，『豆包』2.0 Pro按“输入长度”区间定价，32k以内的输入定价为3.2元/百万tokens，输出定价为16元/百万tokens，相比Gemini 3 Pro和GPT 5.2有较大的成本优势。『豆包』2.0 Lite更是极具性价比，综合性能超越两个月前发布的上一代主力模型『豆包』1.8，百万tokens输入价格仅为0.6元。（心月）