谷歌《Agents》白皮书(google and antitrust)

智能体:生成式 AI 的能力拓展者

在生成式 AI 飞速发展的当下,智能体(Agents)作为其重要拓展,正逐渐成为研究与应用的焦点。

一、核心定义

(一)智能体的本质

智能体可以被定义为一种自主的、以目标为导向的应用,它通过观察环境并调用工具来实现目标。其核心特性包括自主性、主动推理以及与环境的互动能力。这种智能体聚焦于以语言模型为核心的应用,而非广义的 AI 智能体。

智能体的三大核心组件是模型(Model)、工具(Tools)和编排层(Orchestration Layer)。模型作为决策中枢,负责推理、规划及工具选择,能够采用不同的推理框架来指导行动。工具是智能体与外部世界互动的桥梁,包括扩展(Extensions)、函数(Functions)和数据存储(Data Stores)等多种类型。编排层则负责管控信息处理、推理和行动的循环过程,同时维护记忆和状态。

与传统生成式模型相比,智能体的核心差异在于其能力边界和交互方式。智能体能够通过工具与外部系统进行实时交互,而传统模型则受限于其训练数据。

二、智能体的工作原理

(一)工作原理类比

智能体的工作原理可以类比为一位忙碌的大厨。大厨在厨房中需要明确目标(制作美味菜肴),收集信息(食材和顾客需求),进行内部推理(如何烹饪),执行行动(烹饪过程),并根据反馈进行调整(优化菜肴)。类似地,智能体通过目标设定、信息收集、内部推理、执行行动和观察调整等步骤来实现其目标。

(二)三大主流推理框架

ReAct:将推理与行动紧密结合,减少幻觉,提高输出结果的准确性和可靠性。

思维链(Chain-of-Thought, CoT):通过分解复杂问题为多个中间步骤,提升逻辑推理的准确性,适用于需要逐步分析的场景。

思维树(Tree-of-Thoughts, ToT):探索多条可能的路径,支持复杂问题的解决,适用于需要多路径探索的任务。

这三种推理框架为智能体提供了不同的推理方式,可以根据具体任务的需求进行选择和组合。

(三)智能体连接外部的三大核心工具

扩展(Extensions):简化智能体与 API 的交互,通过示例指导智能体动态选择合适的工具,支持复杂规划和实时信息获取。

函数调用(Function Calling):在客户端执行 API 调用,适用于需要安全控制、异步处理或数据预处理的场景,为开发者提供更细粒度的控制。

数据存储(Data Stores):作为外部记忆库,通过 RAG 技术解决知识过时问题,确保智能体能够基于最新信息进行决策和行动。

三、提升智能体性能:三大靶向学习方法

为了进一步提升智能体的性能,靶向学习方法显得尤为重要。这些方法包括:

在上下文中学习(In-context learning):通过在推理时提供示例和工具,让模型“即时学习”如何使用工具。

基于检索的上下文学习(Retrieval-based in-context learning):动态检索相关信息、工具和示例,结合外部知识库,提升模型的推理能力。

基于微调的学习(Fine-tuning based learning):通过在特定数据集上进行微调,让模型提前学习如何使用工具,适用于需要高精度的任务。

结合使用这些方法可以实现优势互补,提升智能体在复杂任务中的表现。

四、总结与未来展望

(一)核心要点总结

智能体扩展了生成式 AI 的能力边界:通过工具与外部世界互动,智能体能够完成复杂的任务。

编排层是智能体的核心:管控信息、推理和行动的循环,确保智能体高效运行。

工具是连接现实世界的关键:根据具体场景选择合适的工具类型,如扩展、函数调用或数据存储。

靶向学习提升模型的工具使用能力:通过多种学习方法,增强智能体在实际任务中的表现。

(二)未来展望

智能体链(Agent Chaining):将复杂任务拆解并分配给多个专业智能体,实现更高效的任务执行和更精准的结果输出。

更强大的工具交互:支持多模态工具和对物理设备的控制,拓展智能体在现实世界中的应用范围。

更优的推理能力:融合记忆增强和多模态信息处理,提升智能体对复杂情况的理解和应对能力。

智能体开发的迭代性:智能体的开发是一个持续优化的过程,需要不断实验和调整以适配具体业务需求。

智能体作为生成式 AI 的重要延伸,正在不断拓展其能力边界。随着技术的不断进步,智能体将在更多领域发挥重要作用,为人类社会的发展创造更多价值。

特别声明:[谷歌《Agents》白皮书(google and antitrust)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

揭秘10公斤商用冷冻鳗鱼片背后的秘密(十公斤可以装多少东西)

为何这种特殊规格的冷冻鳗鱼片在餐饮业悄然兴起?这不仅是一种食材创新,更蕴含了从传统工艺到现代科技的转变。 本文将为你揭示这种100g片、10kg箱的商品化鳗鱼片的制作过程、应用场景及其对日韩烤肉行业的影响。

揭秘10公斤商用冷冻鳗鱼片背后的秘密(十公斤可以装多少东西)

『英伟达』CFO:与OpenAI协议仍未敲定 合作仍在继续(『英伟达』显卡oc)

『英伟达』首席财务官Colette Kress表示,到2026年,Blackwell和Rubin人工智能『芯片』的5000亿美元💵预订额中,并不包括公司目前与OpenAI正在进行的下一阶段协议的工作

『英伟达』CFO:与OpenAI协议仍未敲定 合作仍在继续(『英伟达』显卡oc)

罗纹炫彩:短跑健儿背后的秘密武器

为什么短跑运动员偏爱螺纹紧身设计?罗纹炫彩田径运动服不仅是视觉盛宴,更是提升表现的关键装备。本文将深入解析这一创新服饰的功能、应用及选购指南。

罗纹炫彩:短跑健儿背后的秘密武器

苹果iPhone 17 Pro升级影像,却砍了人像夜景拍摄功能(苹果iphone17promax哪个颜色最好看)

苹果公司的一份官方支持文档证实,此前相机📷️应用中的一项功能已被移除:人像模式下不再支持夜景模式拍摄。iPhone 17 Pro配备了全新的“人物居中”(Center Stage)前置摄像头、后置三摄系统均升级…

苹果iPhone 17 Pro升级影像,却砍了人像夜景拍摄功能(苹果iphone17promax哪个颜色最好看)

『陈学冬』有多倒霉?被车撞2次,被同行拖4次,如今生活无法自理(『陈学冬』有多倒霉了)

反复累加上后,他参演的那十一部作品里头没有了九部,并非是扑街,而是被已经抹除的状态,别说演员了,若你作为一名厨师去做十道菜,其中有九道直接被送进了垃圾桶🗑️,你还能够笑得出来吗? 但我确实知道这样的一件事,一个…

『陈学冬』有多倒霉?被车撞2次,被同行拖4次,如今生活无法自理(『陈学冬』有多倒霉了)