今天分享的是:2025多模态大模型和应用发展趋势及商业化进程分析报告
报告共计:31页
该报告围绕2025年多模态大模型及应用发展趋势与商业化进程展开分析。
多模态是大语言模型发展的必然趋势,分为非原生和原生两种架构。非原生MLLM通过Pipeline形式连接多模态与LLM,依赖预训练单模态模型和额外对齐层,训练简单但效率较低;原生MLLM不依赖预训练模型,从头同步训练,具有更好的统一性和效率,不过训练成本高,头部厂商如OpenAI、Google是领先者,国内尚未有旗舰原生多模态模型,但大厂已开始尝试,预计2025年下半年将逐渐发力。
商业化方面,海外进展快于国内,全球一级公司快于二级,多模态产品商业化快于文本产品。海外像OpenAI、Anthropic等公司年化收入高,国内多模态产品出海比例高,美图、快手等公司表现突出。国内外二级公司在2C/2B AI收入贡献度上差距不显著。
多模态产品持续迭代,图像生成从追求高质量转向易用性与整合度,各玩家寻求差异化;视频生成是国内厂商发力的主要赛道,在时长、清晰度等方面不断突破,字节、MiniMax等厂商的模型有显著更新。
国内大模型发展存在瓶颈,核心是算力受限,还面临高价值用户数据少、受海外闭源模型影响等问题;商业化难点在于模型差距和用户付费习惯,突破点在于多模态应用先行,互联网厂商依托自身场景有先发优势。
以下为报告节选内容