当前,大模型赛道进入“多模态混战”阶段,图文、视频生成技术路线尚未收敛,国内外厂商轮番刷新SOTA。GPT-4o图像生成功能引爆关注后,谷歌Gemini 2.5 Flash Image迅速登顶主流榜单,Meta也借Midjourney数据加速自研图像模型;视频领域,阿里、字节等不断突破生成质量,谷歌更是将视频模型演进为具备实时交互能力的通用世界模型。尽管『DeepSeek』等开源项目推动“模型平权”,但闭源模型凭借资源、人才与技术积累,依旧保持性能领先。预训练Scaling Law放缓虽缩小了开源与闭源差距,但OpenAI、谷歌等通过“开源轻量版+闭源主模型”策略,既激活开发者生态,又反哺主模型持续领先,形成技术与商业闭环。
算力层面,海内外云厂商资本开支持续攀升。海外四大CSP自2023年Q3起连续多个季度环比上升,并上调未来指引;国内厂商为缩小技术差距,也在加大投入。为满足AI训练与推理需求,『芯片』厂商加速新品迭代。『英伟达』从Blackwell向Rubin过渡,AMD MI350对标GB200,MI400将为下一代『服务器』“Helios”奠基;华为通过CloudMatrix 384实现多卡互联,提升整体算力。同时,云巨头自研ASIC节奏加快,北美CSP平均每1~2年推出一代新品,国内阿里、百度、腾讯等也相继发布自研方案,算力竞争进入白热化阶段。
应用层面,AI Agent加速向企业级场景落地。据头豹研究院预测,中国AI Agent市场将从2023年的554亿元增长至2028年的8520亿元,年均复合增长率达72.7%,其中B端占比高达98.5%。相比通用型Agent,企业级Agent更强调与业务流程深度融合,需在特定场景下提供稳定、可靠、可追溯的服务。其价值落地依赖两大核心:一是模型可靠性,通过大模型迭代降低幻觉率,提升事实准确性;二是业务闭环,需将行业隐性知识转化为模型可执行参数,并打通ERP、CRM等系统数据,实现流程自动化与智能化。未来,AI Agent将在高复杂度、数据密集的toB场景中释放更大价值,成为企业『数字化』转型的关键抓手。