谷歌《<strong>Agents</strong>》白皮书(google and antitrust) #科技 #进行 #推理 #数据 #信息 #核心

智能体：生成式 AI 的能力拓展者

在生成式 AI 飞速发展的当下，智能体（Agents）作为其重要拓展，正逐渐成为研究与应用的焦点。

一、核心定义

（一）智能体的本质

智能体可以被定义为一种自主的、以目标为导向的应用，它通过观察环境并调用工具来实现目标。其核心特性包括自主性、主动推理以及与环境的互动能力。这种智能体聚焦于以语言模型为核心的应用，而非广义的 AI 智能体。

智能体的三大核心组件是模型（Model）、工具（Tools）和编排层（Orchestration Layer）。模型作为决策中枢，负责推理、规划及工具选择，能够采用不同的推理框架来指导行动。工具是智能体与外部世界互动的桥梁，包括扩展（Extensions）、函数（Functions）和数据存储（Data Stores）等多种类型。编排层则负责管控信息处理、推理和行动的循环过程，同时维护记忆和状态。

与传统生成式模型相比，智能体的核心差异在于其能力边界和交互方式。智能体能够通过工具与外部系统进行实时交互，而传统模型则受限于其训练数据。

二、智能体的工作原理

（一）工作原理类比

智能体的工作原理可以类比为一位忙碌的大厨。大厨在厨房中需要明确目标（制作美味菜肴），收集信息（食材和顾客需求），进行内部推理（如何烹饪），执行行动（烹饪过程），并根据反馈进行调整（优化菜肴）。类似地，智能体通过目标设定、信息收集、内部推理、执行行动和观察调整等步骤来实现其目标。

（二）三大主流推理框架

ReAct：将推理与行动紧密结合，减少幻觉，提高输出结果的准确性和可靠性。

思维链（Chain-of-Thought, CoT）：通过分解复杂问题为多个中间步骤，提升逻辑推理的准确性，适用于需要逐步分析的场景。

思维树（Tree-of-Thoughts, ToT）：探索多条可能的路径，支持复杂问题的解决，适用于需要多路径探索的任务。

这三种推理框架为智能体提供了不同的推理方式，可以根据具体任务的需求进行选择和组合。

（三）智能体连接外部的三大核心工具

扩展（Extensions）：简化智能体与 API 的交互，通过示例指导智能体动态选择合适的工具，支持复杂规划和实时信息获取。

函数调用（Function Calling）：在客户端执行 API 调用，适用于需要安全控制、异步处理或数据预处理的场景，为开发者提供更细粒度的控制。

数据存储（Data Stores）：作为外部记忆库，通过 RAG 技术解决知识过时问题，确保智能体能够基于最新信息进行决策和行动。

三、提升智能体性能：三大靶向学习方法

为了进一步提升智能体的性能，靶向学习方法显得尤为重要。这些方法包括：

在上下文中学习（In-context learning）：通过在推理时提供示例和工具，让模型“即时学习”如何使用工具。

基于检索的上下文学习（Retrieval-based in-context learning）：动态检索相关信息、工具和示例，结合外部知识库，提升模型的推理能力。

基于微调的学习（Fine-tuning based learning）：通过在特定数据集上进行微调，让模型提前学习如何使用工具，适用于需要高精度的任务。

结合使用这些方法可以实现优势互补，提升智能体在复杂任务中的表现。

四、总结与未来展望

（一）核心要点总结

智能体扩展了生成式 AI 的能力边界：通过工具与外部世界互动，智能体能够完成复杂的任务。

编排层是智能体的核心：管控信息、推理和行动的循环，确保智能体高效运行。

工具是连接现实世界的关键：根据具体场景选择合适的工具类型，如扩展、函数调用或数据存储。

靶向学习提升模型的工具使用能力：通过多种学习方法，增强智能体在实际任务中的表现。

（二）未来展望

智能体链（Agent Chaining）：将复杂任务拆解并分配给多个专业智能体，实现更高效的任务执行和更精准的结果输出。

更强大的工具交互：支持多模态工具和对物理设备的控制，拓展智能体在现实世界中的应用范围。

更优的推理能力：融合记忆增强和多模态信息处理，提升智能体对复杂情况的理解和应对能力。

智能体开发的迭代性：智能体的开发是一个持续优化的过程，需要不断实验和调整以适配具体业务需求。

智能体作为生成式 AI 的重要延伸，正在不断拓展其能力边界。随着技术的不断进步，智能体将在更多领域发挥重要作用，为人类社会的发展创造更多价值。

谷歌《Agents》白皮书(google and antitrust)

猜你喜欢

揭秘10公斤商用冷冻鳗鱼片背后的秘密(十公斤可以装多少东西)

『英伟达』CFO：与OpenAI协议仍未敲定合作仍在继续(『英伟达』显卡oc)

罗纹炫彩：短跑健儿背后的秘密武器

苹果iPhone 17 Pro升级影像，却砍了人像夜景拍摄功能(苹果iphone17promax哪个颜色最好看)

『陈学冬』有多倒霉？被车撞2次，被同行拖4次，如今生活无法自理(『陈学冬』有多倒霉了)