华为升级行业Agent算法架构!MindScale自己写prompt和工作流,KV Cache减少5.7倍token(华为升级涨工资吗)

允中 发自 凹非寺

量子位 | 公众号 QbitAI

在大模型的多种应用形态中,执行专业功能的行业Agent,无疑是提升生产效率、实现价值创造的利器。

然而,千行百业包含着大量的私域知识、专家经验和工具使用逻辑,使得智能体的行业应用构建存在各类门槛。

为了提升开发效率,业界提出了诸如Skills、OpenClaw等优秀的工程框架,使得专业Agent的开发门槛日益降低,也让针对Agent应用的多维度算法优化需求愈发凸显。

在此背景,华为诺亚方舟实验室近期在官网更新了面向行业应用的算法包MindScale,这一项目融合了实验室的算法创新基因与华为行业智能化业务实践经验。

其系统性梳理了Agent时代将“大模型”转化为“生产力”的算法技术挑战,并给出了对应的技术论文昇腾代码实现,为行业用户与开发者提供了直接的“上手指南”。

制约行业Agent发展的四大核心挑战

  • 工作流手工维护:依赖专家将业务规则“翻译”为Agent工作流;

  • 历史知识复用难:历史推理路径与反馈无法有效使Agent系统自演进;

  • 训推效率瓶颈:大量模型部署与迭代需求+思考路径变长,成本压力陡升;

  • 复杂推理测评:多步、多工具交织推理,单精度指标无法准确反映模型效果。

实现工作流自进化与提示词自动化闭环

为了应对这些挑战,诺亚的研究人员与多所合作单位一道,给出了自己的解决方案。

例如,面向行业Agent开发中最常见的工作流(Workflow)开发场景,算法包中包含了自进化的Agent算法EvoFabric

与手动提取工作流高度依赖专家经验不同,使用SOP2Workflow可以快速从自然语言文档与历史工具库,直接生成可执行的Workflow。

由用户书写的网页功能测试SOP→自动生成的整个Workflow

为了实现这样灵活的Workflow生成,研究人员采用了基于状态图引擎内核的Agent实现,原生支持混编Agent、工具等多种图节点,支持状态的改写和分组融合处理,实现多智能体、多工具、多记忆形态的深度混编,图引擎还支持DSL文件的导入与导出,实现复杂智能流程的快速复制、迁移与部署。

同时,该算法框架还可以实现基于记忆的演进——多轮执行时,记忆模块利用轨迹记忆,以及当时的评估结果形成经验优化上下文,实现Agent越用越好。

另一个有趣的功能,是让模型开始自己进行“prompt优化”

首先,基于前期已经先行发布的prompt在线优化算法SCOPE,开发者可以实现在每步推理之间进行prompt在线优化,通过注入萃取历史路径中的有效信息实现提示词的快速优化,在HLE和GAIA等agentic reasoning的场景里可以取得20%以上的精度提升。

此外,研究人员还提出了“大模型prompt优化器”C-MOP,通过创新的样本选取与梯度更新策略,解决了“文本梯度”的冲突问题,实现了基于正负例反馈的prompt自动优化,真正做到了“反馈->演进”的prompt优化闭环。

C-MOP:融合正误双向样本感知与时序动量梯度的提示词优化器榨干算力潜能并适配国产硬件生态

除了精度提升,MindScale也注重面向行业场景模型的训推效率优化,例如:

  • 其中的TrimR用一个已预训练、指令微调的轻量验证器在线检测并截断无用中间思路,全程无需微调大模型或验证器;

  • 配套工业级异步在线系统,适配大并发生产场景。

在MATH、AIME、GPQA等基准与多款LRM上,TrimR在几乎不影响准确率的前提下,将推理时延显著降低,大并发场景最高可达约70%提速,实现实际应用场景中的Test Time Scaling。

TrimR:工业级思维链动态压缩算法框架

此外,为了适配行业场景高并发的推理压力,MindScale还提供了新的基于KV Cache的推理方案。

与通用方案中KV Cache只是用来加速解码的“幕后工具”不同,研究人员提出KV-Embeddings,把KV Cache视作一种“免费附赠”的轻量表示,无需额外计算或存储完整隐状态,可以在链式表示推理(Chain-of-Embedding)和快慢思考切换等关键场景中,基于多款主流模型上实现性能持平或反超专用embedding模型,同时将生成token数最高减少5.7×。

这些结果表明——KV Cache不只是加速器,更是一块尚未被充分利用的“思考缓存”,为大模型推理阶段的表示复用打开了新的想象空间。

此外,诺亚方舟实验室与相关合作团队还在任务记忆、Agentic RAG、通用算法发现框架等多个方向上,沉淀了大量经过实战检验的、围绕行业智能优化的创新算法技术架构。

同时,MindScale还也包含了适配昇腾硬件的代码实现,可以让行业开发的小伙伴们,基于国产算力实现高精度、高效的Agent构建。

特别声明:[华为升级行业Agent算法架构!MindScale自己写prompt和工作流,KV Cache减少5.7倍token(华为升级涨工资吗)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

Talbots亮片背心清仓大促,十月95%聚酯材质,村里100纯聚酯竞品,选哪个更划算?

九月清仓季,Talbots亮片背心以95%聚酯和5%氨纶的舒适面料搭配闪耀细节。同时村里的100聚酯纯背心也强势来袭。作为消费者该如何做出选择呢?本篇文章将从面料特性、性价比等方面进行详细分析。帮助您挑选到心仪且性价比高的亮片背心。

Talbots亮片背心清仓大促,十月95%聚酯材质,村里100纯聚酯竞品,选哪个更划算?

何树成开直播庆祝:『赵本山』答应房产过户,以后就让你更烦我!(何树成的采访视频)

12月2日的晚上,何庆魁的儿子何树成突然开始直播,刚一亮相,他便笑得合不拢嘴,激动得连手都微微发颤,对着『直播间』里的网友们说:跟大家说个乐呵的事,本山老师同意把海南那套房子转给我爸啦! 让人更摸不着头…

何树成开直播庆祝:『赵本山』答应房产过户,以后就让你更烦我!(何树成的采访视频)

盘点:全球公认含金量最高的5个人工智能认证(全球最具)

Level I定位为入门与普及,旨在帮助零基础或跨领域学习者快速建立人工智能的知识框架,重点掌握其基本概念、发展脉络、核心原理及当前主流工具(如Prompt工程)的应用,特别强调AI在不同商业场景下的赋能。它…

盘点:全球公认含金量最高的5个人工智能认证(全球最具)

色素沉着一般多久能退(色素沉着一般多久能消失)

色素沉着,这一听起来有些陌生的词汇,其实是皮肤科中常见的一种现象。它并非特指某种疾病,而是描述皮肤上出现与正常肤色不同的区域。这可能是由于黑素细胞数量增多或活性增强,导致色素沉积

色素沉着一般多久能退(色素沉着一般多久能消失)

深圳女子弯腰换鞋突发肺栓塞 久坐与贫血成“沉默杀手”(深圳女子弯腰换衣服)

48岁的熊小敏咳嗽发烧十多天,没想到在家弯腰换鞋时眼前一黑、心跳如擂鼓,差点晕厥。家人迅速将她送往深圳市人民医院。心脏彩超结果显示她的右心室异常肿大,血色素也仅有正常女性♀️的一半。医生诊断为急性肺栓塞,立即实施了介入手术,成功挽救了她的生命

深圳女子弯腰换鞋突发肺栓塞 久坐与贫血成“沉默杀手”(深圳女子弯腰换衣服)