自动保存草稿 - 2025-07-27 13:54:52(草稿箱怎么保存到手机)

自动保存草稿 - 2025-07-27 13:54:52(草稿箱怎么保存到手机)

作者 | 邓咏仪

编辑 | 苏建勋

以往在大模型上一直低调行事,但在AI应用上,腾讯这回终于不藏着了。

7月26日,世界人工智能大会(WAIC)在上海开幕。明显可见的是,腾讯在WAIC上,让AI智能体成为14亿用户的“数字好友”,用智能体构建起了一个“好友圈”,覆盖用户生活中的

腾讯也发布了从自研大模型到智能体的多项新品,可以说是“AI全家桶“,包括:

  • To B一侧:新发布混元世界模型1.0,能够应用在VR,游戏开发,场景编辑,物理仿真等;接下来还要开源多个混元小体量模型;
  • To C一侧,发布了超过10个Agent(智能体),朱啊哟围绕生活、学习、工作场景,包括旅游规划Agent
  • 平台层面:发布了智能体开发平台、具身智能开放平台Tairos、AIGC内容生成平台、端侧大模型平台、AI教育平台

“现在的AI是从到短期记忆到长期记忆的演进”,腾讯云副总裁、腾讯云智能负责人、腾讯优图实验室负责人吴运声表示,在很长一段时间里面,大模型只能记住比较短的上下文,这对复杂任务是不够的。

而腾讯大力投入到智能体中,也是对技术演进路线的探索。比如多智能体协同——吴运声表示,AI技术正在从图文问答向全方位的多模态(视频、图像、音频等)交互演进,全模态的无缝的交互在以后是不要的。而如果有不同的智能体负责不同的专业,去让各种各样智能体做协同,才能去完成更加复杂的任务。

△来源:腾讯

2023年,腾讯云刚刚发布混元大模型家族时,讲的还是“行业大模型”的故事——从金融、政务、运营商等10大行业,主打“行业大模型”的路线,一口气抛出超过50个解决方案。

但到现在,叙事已经改变,从语言模型迅速扩展到多模态、具身智能。

这次WAIC上,腾讯也首次重点发布了具身智能相关的进展。腾讯旗下的Robotics X实验室与福田实验室,联合发布了“具身智能开放平台Tairos”。

△来源:腾讯

这是国内首个以模块化的方式提供大模型、开发工具和数据服务的具身智能软件平台,即插即用,且面向『机器人』️行业开放,为『机器人』️本体开发商与应用开发商补齐关键的软件能力。

模型和To B/ To C应用两手抓

在模型侧,这次腾讯正式发布的重点是混元3D世界模型 1.0,并宣布全面开源。

如果说『大语言模型』(LLM)的技术演进路线已经逐步明晰,从扩大规模Scale up,到以强化学习(Reinforce Learning)为主的下半场;那么多模态的发展阶段还在早期,无论是技术选型、高质量数据、模型工程都有多项难点。

多模态则是今年各家比拼的重点,而世界模型也是多模态的一个重要分支,在2024年12月才兴起。

简单来说,腾讯混元3D世界模型1.0融合了全景视觉生成与分层3D重建技术,同时支持文字和图片输入,实现了高质量、风格多样的可漫游3D场景生成。

△来源:腾讯

过去,3D建模和渲染是个巨大的工程,需要专业建模团队数周才能搭建。现在,只需一句文字或一张图片,几分钟内即可生成。

谈及世界模型的训练难点,数据是其中一个。腾讯混元3D负责人郭春超在接受包括36氪等媒体采访时表示,目前3D资产主要依赖于艺术家或建模师的手工制作,因此其数量仅为几千万级,与百亿、千亿级的图片数量相比,存在数量级上的差距,这种获取难度较大的情况是客观存在的。

对于未来的发展重点,郭春超表示,混元世界模型的目标有两方面:一是提升3D资产生成的质量,使其达到更高的商用水平。目前,3D资产生成已达到中等水平,但与顶尖水平仍有差距。通过提高生成质量和泛化性,他们希望能更好地满足游戏、自动驾驶、XR、动漫及影视等行业的需求,降低成本并缩短周期;

二则是改进场景生成和交互模型,构建更完整、真实模拟物理规律的世界模型,今年重点开展,在明年达到更高成熟度。

今年年初,『DeepSeek』 R1的经验已经证明,在崭新的技术领域,抢占技术话语权,并且做出令人尊敬的工作,能够获得巨大的市场回报。

在那之后,各家都纷纷加快了开源步伐。事实上,除本次发布即开源的混元 3D 世界模型 1.0,混元还将在月底开源一系列小尺寸模型,包含0.5B、1.8B、4B、7B混合推理模型,更轻量、好部署。

腾讯由于游戏、社交等内容领域的积累,在多模态的探索上,已经是国内第一梯队的选手。现在,腾讯已经对外提供接近商业模型性能的开源基座,方便社区基于业务和使用场景定制。

据腾讯发布的公开数据,如今腾讯的图像、视频衍生模型数量分别达到1400和1600个,混元3D系列模型社区下载量超过230万,已成为全球最受欢迎的3D开源模型。

除了世界模型之外,腾讯混元还披露了包括端侧混合推理语言模型、多模态理解模型、游戏视觉模型等在内的一系列开源计划。

比如,即将开源的混元-large-vision,就是在LMArena Vision榜单拿下国内第一的多模态理解模型;而专为游戏场景优化的、交互式游戏视频生成框架“混元GameCraft”,也会在近期对外开源。

落地,还是落地

在大模型的战略上,腾讯一而贯之的风格是务实,这次的WAIC上,腾讯的主题也是“让‘好用的AI’成为普惠生产力”。

腾讯已经将Agent的能力,嵌入到腾讯多个To B及To C应用中,覆盖生活、工作、学习、娱乐等场景。

在学习场景,QQ浏览器QBot提供AI搜索、AI浏览、AI办公、AI学习、AI写作等功能;ima AI工作台可以辅助完成日常学习和工作任务,并长期沉淀为个人的智能化知识库,也支持加入别人的共享知识库进行精准问答。

又比如,旅游规划Agent。它可以根据参观者需求,一键生成旅行攻略,还可随时对生成的攻略进行个性化编辑。同时通过内置小程序直接实现无缝下单,真正实现一次输入,多项指令一步到位。

△来源:腾讯

在娱乐创作方面,QQ音乐也上线了“AI作歌”及“AI唱”功能,帮助用户创作或者高质量“演唱”歌曲。此前,QQ音乐就推出了全球首位AI歌手“AI力宏”。

腾讯不止自己做智能体,也上了配套的智能体“创作工具”。比如,“腾讯云智能体开发平台”和“腾讯元器”两大智能体开发平台,就可以大大降低AI Agent搭建与使用的门槛,帮助企业客户和创作者搭建属于自己的智能体。

此前,和企业上私有云类似,行业大模型定制化程度高,市场常有“落地成本高”“落地难”的疑问。在大模型这两年不断提升能力之后,智能体目前收到追捧。

有了智能体之后,行业大模型的意义在什么地方?吴运声对36氪表示,智能体和行业大模型更多是配合作用。在行业大模型上,企业客户可以和腾讯云共创,将行业Know-how沉淀到行业大模型中,这些能力可以服用;而智能体则可以通过MCP等协议,在企业客户的前端场景中,解决更小单元的问题。

“智能体能够放大大模型价值,是解决业界落地问题的重要形态。”吴运声对36氪表示。

特别声明:[自动保存草稿 - 2025-07-27 13:54:52(草稿箱怎么保存到手机)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

碳纤维高尔夫球具、球头制备-热压成型机(碳纤维高尔夫球杆多少钱)

独特的发热系统装置,可分段、分区控制温度和压力,整体温差可控制在±3度内,确保热压温度的稳定性,大大提高产品的良率。首先将碳纤维材料放入模具中,然后通过加热系统将模具加热至一定温度,最后通过压力控制系统将模具…

碳纤维高尔夫球具、球头制备-热压成型机(碳纤维高尔夫球杆多少钱)

21.9收视炸场,TVB今年的王炸藏不住了(节目收视)

她的角色是白天被老板PUA、被假闺蜜(刘佩玥饰)抢单的职场“背锅侠”,晚上回家还要面对父母偏心的普通人。 当镜头怼近张曦雯那张写满疲惫的脸,观众仿佛能触摸到她每一寸紧绷的神经——这不是简单的哭戏,而是当代打…

21.9收视炸场,TVB今年的王炸藏不住了(节目收视)

『张译』:我只要和她拍两口子的戏,她老公就抱孩子探班,真的很无语(『张译』说过一句经典话)

更令人哭笑不得的是,这位1"不速之客1"总会选择最佳观赏位置,全程目不转睛地注视着拍摄现场。1"这让『张译』彻底明白了这对夫妻独特的相处模式。《辣妈正传》杀青时,『邓超』特意送上花束,卡片上1&

『张译』:我只要和她拍两口子的戏,她老公就抱孩子探班,真的很无语(『张译』说过一句经典话)

他是中国最牛演员!五个儿子都是大腕!大儿子火过『成龙』、『周星驰』(他是中国最牛的英文)

通过电影这个载体,袁家父子成功地将中国文化介绍给了世界,并通过动作设计使外国观众对中国武术产生了浓厚的兴趣.他们在跨文化交流中扮演了至关重要的角色.他们的作品不仅让世界看到了中国武术的魅力,更让世界感受到了…

他是中国最牛演员!五个儿子都是大腕!大儿子火过『成龙』、『周星驰』(他是中国最牛的英文)

孙浩:26岁上春晚走红,得罪杨坤20年不说话,55岁至今未婚没孩子(孙浩锎的年龄)

但谁能想到,这位如今被夸"演技封神"的戏骨,早年拍《天皇巨星》时还觉得"演戏就是份工钱"。 非常戏剧性的是当年在夜总会当音乐总监时,他大笔一挥划掉了个新人——后来这首歌

孙浩:26岁上春晚走红,得罪杨坤20年不说话,55岁至今未婚没孩子(孙浩锎的年龄)