央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎(央企背后)

央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎(央企背后)

允中 发自 凹非寺

量子位 | 公众号 QbitAI

7月26日,在世界人工智能大会(WAIC)上,中国移动正式发布了MoMA多模型与智能体聚合及服务引擎

MoMA引擎通过汇聚业界多种优质模型与智能体,能够根据应用场景,自动匹配及调用最优专家模型和专用智能体,形成超级大模型能力服务基座,为解决复杂任务提供更为强大的解决方案。

01.当前主要的问题与挑战

目前,国内外已发布多款模型,每个模型在不同时间段内在某些应用场景表现出卓越的能力,例如代码编写、写作、数学、翻译等。

未来将是多种模型共存的局面,HuggingFace已有数百万个这些模型的微调变体。因此,企业在应用这些模型时面临如下挑战:

一是调度与组合难题:如何选择不同能力和接口各异智能体、模型进行有效的组合解决具体问题;二是意图理解与规划挑战:用户指令语义丰富且目标模糊,要求智能体具备更强的意图探测能力,以规划更优执行路径。三是成本收益平衡:如何平衡效率、效果和成本三者关系,达到提速降本的目标。

MoMA通过多级路由技术,主要解决了模型的路由选择和能力规划调度的基础问题,为企业及个人用户解决上述痛点与挑战提供了具体方案。

02.MoMA是什么?

九天MoMA(Mixture of Models and Agents)即多模型与智能体聚合及服务引擎,通过标准化接口广泛汇聚业界优质大模型与专用智能体,面向复杂行业场景提供“场景-模型-智能体”的自动感知、动态编排与最优调用能力,形成具备持续进化特性的超级大模型服务基座,提供高准确率、高安全、高可靠、高效能的大模型推理服务。

MoMA核心主要包括三部分:

MoMA模型

MoMA根据对模型能力的探测和智能体能力的评估,以及对用户意图的理解和识别,明确不同组合下的协同优势与潜在冲突;根据对用户输入的分析,判断模型和智能体的依赖关系及其能力范围,自动选择最佳方案。

同时,通过闭环监控反馈机制,构建“实时感知-动态调整-持续验证”的循环链路,以更好地适应数据变化、业务需求和环境波动。

模型能力洞察及构建主要通过对模型和智能体能力的深入探测,从成本、效果和难易程度等方面构建其能力高维表征,实现用户需求与智能体路由的快速匹配;通过评分机制,评估不同模型和智能体的效果,便于分层路由模型进行快速任务分发。

通过原创性地提出“问题难度-领域矩阵”(Problem-difficulty vs. Domain Matrix, PD²-Matrix)的大语言模型(LLM)系统性框架,核心目标是通过标准化分类与评估,全面揭示模型在不同任务场景下的表现边界,以及不同模型在相同领域问题上的排名情况。

该框架将任务按照问题复杂度与知识领域两个正交维度进行系统化分类,并在每个矩阵单元设计差异化的评估指标。其核心创新在于将大语言模型的“黑箱”能力转化为结构化的“能力矩阵”,通过正交维度分类、探测工具和可视化分析,实现了从“笼统评估”到“精准诊断”的跨越。

在PD²-Matrix框架下,采用Pareto优化拟合给定任务分布上 T的模型得分(效果)S(T)与成本C的得分–成本(S-C)曲线,实现了效果和成本之间的动态权衡和调整。

通过上述流程,不仅在 PD²-Matrix 框架下实现了对性能-成本关系的可解释建模,还能以任务分布T为条件,为不同下游应用提供个性化的资源-性能权衡策略,最终达到“用最小的成本获得所需的性能”这一核心目标。

MoMA工程引擎

以分层路由与动态编排为核心,通过标准的协议连接模型、智能体、工具,形成超级大模型能力基座,实现对任务类型、资源分配、执行流程的动态管理,在效果、成本、效率三重约束下完成最优决策,提速降本。

多级路由机制及动态洞察

在分层路由模型机制中,多级路由各司其职,分层次完成复杂任务的拆解与实现。其中一级路由完成专家模型、简单任务、复杂任务的分发;二级路由在综合准确度和成本的条件下,根据复杂度把问题分发到具备不同参数规模或者是专长的专家模型予以响应;采用Monitor Model对推理内容进行实时监控、复盘两级路由模型的分发质量,同时丰富标注数据集动态优化路由模型。

复杂任务去中心化

对于用户多意图及复杂任务,MoMA工程引擎采用了Planner-Executor-Summarizer架构,能够根据具体任务动态地采用ReAct、Route、Parallelize、Swarm等混合模式,实现任务的自动拆解、编排与并行调用。

传统AI系统通常采用固定模式回答问题,规划执行的步骤越多,所需的计算资源也越多,在某些任务中,AI可能在无需人工干预的情况下执行数十个步骤。通过采用复杂任务路由技术,将请求发送给专门的规划模型,选择不同的执行模式或混合模式,将用户的意图分配至合适的智能体或大模型,并通过监控推理输出内容,进行动态接管与调整,从而保证回答的效果和效率。

此外,这种方式还避免了或减少了依赖中心规划模型对智能体或工具输出内容的重复推理评估,降低了输出幻觉,提升了整体响应时间,全面优化了用户体验。

MoMA协议体系

目前针对模型与外部工具、数据源之间,智能体与智能体之间的协同问题,业界已有部分协议尝试对其进行规范化。主流协议包括Anthropic公司提出的MCP(Model Context Protocol,模型上下文协议)和Google提出的A2A(Agent2Agent)。

其中MCP是一种用于规范模型或智能体与外部数据源、工具和服务之间的交互的开放协议,其通过结构化的输入/输出将模型或智能体与工具、API和资源连接起来,可以将其视为模型或智能体扩展自身能力的标准方式。

A2A协议则是一种用于智能体之间通信与互操作性的开放标准,其为由不同框架、不同语言或不同厂商构建的智能体提供了一套通用的语言与交互接口。原生的MCP协议没有对模型和工具之间交互的安全性进行限制,同时工具对模型的可调度性也缺少规约。

MoMA在兼容业界规范的基础上拓展统一认证、安全通信等能力,对工具的可调度性进行了增强,在此基础上构建了中国移动特色的A2A,MCP协议,实现对业界智能体生态的兼容,形成开放、安全、可信、高效的中国移动智能体技术体系的服务底座。

03.MoMA应用

MoMA聚合包括九天大模型、Qwen和DeepSeek等15+个高质量内外部模型,涵盖通用模型和专业模型,涉及编程、数学、翻译、医疗等多个领域,并接入了20多个专家智能体,例如日常管理、会议助手、咪咕音乐和深度报告等,帮助用户迅速解决专业领域的问题,精准匹配用户需求。

在覆盖百万级用户的情况下,MoMA的动态路由机制在不同参数模型(1B、3B、8B、75B、200B)之间灵活切换,整体速度相比固定的75B参数模型提升了42%。

目前,MoMA已应用于中国移动的灵犀智能体2.0,助力灵犀智能体全面升级为跨领域、多任务、自规划的通用型智能体,为用户在“通信、生活、出行、办公、家庭”等多元化场景中提供特色服务。

04. 商业化落地愿景

中国移动在新技术研发的道路上一直持续深耕并获得广泛认可,MoMA聚合引擎的发布提供了中国移动与各产业合作的新范式。

随着更多行业实践的深入,中国移动将持续释放生产力价值,致力于为开发者及大模型企业提供人工智能快速解决方案,在技术创新、产品迭代与生态建设方面,持续前进,为广大用户提供更好的产品与服务,带动产业与技术的创新与规模化发展。

通过MoMA多模型与智能体聚合及服务引擎,中国移动将依托充沛的算力资源,实现业界优质大模型及智能体的汇聚及灵活调度,构建起百模互联、千智协同的全新产业协同生态,打造AI能力聚合和普惠服务的全新智能服务范式,将驱动中国人工智能产业迈入发展新阶段。

特别声明:[央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎(央企背后)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

缉毒烈士的扫墓现场全屏马赛克 家属千里祭英魂(缉毒警察牺牲算烈士吗)

近日,在云南芒市烈士陵园,一对老人颤抖着抚过墓碑上的名字。这里是烈士姚元军长眠的地方。他的父母和姐姐从甘肃远道而来,只为亲口说一声“想你了”。这是他的父母第一次也是最后一次来探望他

缉毒烈士的扫墓现场全屏马赛克 家属千里祭英魂(缉毒警察牺牲算烈士吗)

大唐阳城发电取得液态式冷却降温装置专利,实现热源本体温度灵活调节(山西大唐阳城发电公司)

专利摘要显示,本实用新型公开了一种液态式的冷却降温装置,包括热源结构、调节结构和冷却结构。 天眼查资料显示,大唐阳城发电有限责任公司,成立于2005年,位于晋城市,是一家以从事电力、热力生产和供应业为主的企…

大唐阳城发电取得液态式冷却降温装置专利,实现热源本体温度灵活调节(山西大唐阳城发电公司)

提现0.01元也只收0.01元,微信这次不只是降手续费那么简单(0.3元提现天天提提现秒到账,每天都可以免费提现去提现)

大力财经认为这次调整的背后,是微信在平衡“银行成本”与“用户体验”这杆天平时的精妙操作,更是在激烈竞争下的必然选择。但在移动支付下半场,当流量红利见顶,竞争的焦点便从“跑马圈地”转向了“精耕细作”。 这将…

提现0.01元也只收0.01元,微信这次不只是降手续费那么简单(0.3元提现天天提提现秒到账,每天都可以免费提现去提现)

云南贵金属实验室取得PEM电解水制氢铱钌合金催化剂制备方法专利(云南贵金属实验室有限公司)

金融界2025年8月2日消息,国家知识产权局信息显示,云南贵金属实验室有限公司取得一项名为“一种PEM电解水制氢铱钌合金催化剂的制备方法”的专利,授权公告号CN116727679B,申请日期为2023年06月…

云南贵金属实验室取得PEM电解水制氢铱钌合金催化剂制备方法专利(云南贵金属实验室有限公司)

漫威索尼官宣《蜘蛛侠4》定档2026.7.31!荷兰弟回归,萨迪・辛克加盟(漫威与索尼的最新谈判)

乔伯恩瑟(《惩罚者》)将客串饰演 “惩罚者” 弗兰克卡塞尔,这也是该角色首次在 MCU 真人电影中亮相。 索尼与漫威在 2024年达成新协议,允许荷兰弟继续出演六部电影,包括《蜘蛛侠 4-6》及《复仇者联…

漫威索尼官宣《蜘蛛侠4》定档2026.7.31!荷兰弟回归,萨迪・辛克加盟(漫威与索尼的最新谈判)