图源:百度
AI Agent从“可用”到“好用”的鸿沟,被百度文库跨过去了?
8月18日,在百度AI Day 开放日上,百度文库联合百度网盘,发布全球首个全端通用智能体GenFlow 2.0。根据我在现场的了解,该产品支持超100个专家智能体同时干活,3分钟并行完成超5项复杂任务。
百度文库相关负责人称,它就是一个“AI专家团”,执行任务时的生成速度,超过主流同类型产品10倍,在行业内率先做到「分钟级交付、过程可干预、记忆可追溯」。
这也意味着,AI Agent已经跨过从“能说会道”,向“能做会干”进化的关键节点。
像人类专家团一样干活
这个效果实际也是GenFlow 2.0为解决通用Agent描述难、等待久、交付差、不可编辑等行业难题,推出的“首创”级别能力。
针对问题难描述场景,文库GenFlow 2.0让用户能够更自由的表达,深度、精准地理解用户意图并规划执行,自主切换简单对话、复杂任务等多重协作模式。
比如,你可以问一个简单问题:“今天北京天气怎么样?”,也可以提出复杂任务,它都能根据难易程度自主理解,并展开协作。
图源:简单对话 vs. 复杂任务·百度
在任务进行过程中,你可以根据场景需要随时打断GenFlow 2.0,暂停、追问、修改思考内容,还能上传更多文件📄(比如在你授权后,调用网盘中的文件📄)供补充参考。
举个例子,当你让GenFlow 2.0帮你做课后习题时,也许它生成的内容与预想方向不一致,你可以随时喊停,对大纲进行修改、重新规划,将它“拉回正轨”再继续输出~
针对过程等待久的问题,文库GenFlow 2.0采用自研Multi-Agent基础架构,实现分钟级并行工作和交付。
在APP端,GenFlow 2.0的工作并行更加直观:对比目前主流智能体的串行“瀑布式”工作流,升级为“并列式”,用户能够清楚同屏看到不同任务的工作进程,提高交互体验。
如果你给GenFlow 2.0同时布置多个任务,比如完成和新能源汽车市场趋势相关的PPT、研报、思维导图等多项材料,各个任务将在一个处理页面内同时出现、并行处理。
在交付能力上,GenFlow 2.0可以调用由100+多模态Agent组成的“AI专家团”,它能够并行生成PPT、研报、HTML、代码、游戏、网站等多模态内容。
同样是了解新能源汽车市场趋势的例子,得到各项材料需要调用许多工具,这时候,GenFlow 2.0的「专家智囊团」便上线了。
只需一段提问,它便能交付各种类别的材料:PPT、可视化图表、产业链思维导图、行业趋势研究报告、新媒体配图……。
针对千篇一律的AI味,GenFlow 2.0有两个“去AI味”的优势。一个是百度自身的生态,其通过连接起百度文库、学术、地图等百度生态资源,不仅能调用百度学术超6.8亿文献库、百度文库超14亿专业文档,在用户授权后,还能随时检索、调用百度网盘中储存的指定资料,结合用户已有的“弹药库”进行去除。
比如,如果你想要温习中国古代史中“唐朝”部分的重要知识点,GenFlow 2.0除了调用网络检索的信息,还能基于百度文库文档、学术研究结果,以及网盘中已有的材料,尽可能全面地梳理、呈现。
另外一个是,GenFlow 2.0拥有独属于你的“独家记忆”:在文库、网盘的历史沟通记录、上传下载文件📄、搜索偏好等,都可以被记录并加以分析,GenFlow 2.0会据此生成更契合你的个性化内容。
比如,你前一个任务被打断时,可以直接再下达指令,“继续完成论文的PPT演示版”。它就能直接沿着上次的任务扩展执行。
科技评论作者“卫夕指北”还进行了几个脑洞大开的实测。比如,“请根据《甄嬛传》设计一款桌游。”
他评价称,最终产出看,Agent准确把握了桌游设计的核心要素:有多阵营角色扮演机制、有宫斗策略系统、有经典剧情事件。体现了《甄嬛传》的IP特色,非常老司机。
对此,文库事业部、网盘事业部负责人王颖评论,“这里面的玩法,我也是没想到,没有做不到只有想不到。”
还有一点🕐️,在「编辑」上,GenFlow2.0自研了AI编辑器,用户在任务过程中可随时进行在线编辑,生成内容后还可导入到个人知识库,或导入到自由画布里进行编辑。
值得一提的是,涉及百度文库、网盘的个人资料,GenFlow 2.0的权限机制可以称为“一票否决”,也就是,用户只有同意智能体调用,其才开始运行工作。否则,智能体便不会再调用私域资料,提示“工具调用失败”。
这不难理解,无论是百度,还是其他大厂,AI Agent的落地实践,用户个人隐私以及私域数据的保护,是一条不可逾越的红线。
百度文库,超越了工具
今年4月,百度文库、百度问盘推出内容操作系统“沧舟OS”,并基于此系统推出“GenFlow1.0”,短短4个月内,其能力得到巨大提升。
这得益于文库网盘在技术基座上的持续投入。王颖表示,文库网盘自AI重构以来,坚持MoE(底层专家模型)。可基于不同任务、步骤调用不同模型。GenFlow 2.0自建Multi-Agent引擎,积极优化上下文工程,为模型构建信息生态系统,实现对复杂任务的一站式端到端交付。
同时,GenFlow 2.0兼容MCP协议,可灵活接入第三方服务生态。基于文库网盘联合发布的内容操作系统沧舟OS,通过MCP Server与Agent to Agent的形式,GenFlow 2.0率先将MCP用于产品与生态连接,将文库与网盘能力全面开放,方便厂商、企业用户、智能体应用、开发者等不同用户使用。
这个价值在于,百度文库网盘并不想单打独斗,更多是把自身的能力开放出去,释放生态价值。
我从中也看到,百度文库在商业化上的伏笔,即在为C端用户提供“AI专家团”服务,跨过智能体从“可用”到“好用”的鸿沟时,其也在B端、企业侧已经进行深度布局。
百度文库产品负责人在分享中提到,他们已经在地方文旅、教育行业等多个领域,与相关企业、机构达成合作,并产生收益。
荣耀应邀上台分享,其AI生态产品负责人表示,作为全球首批接入MCP生态的硬件厂商,荣耀已将GenFlow 2.0原生接入荣耀智能助理YOYO,实现AI Agent与硬件厂商的系统级原生调度。
图源:百度
对于GenFlow2.0的发布,百度文库网盘给予极高的期待,认为这是打通了从“创编存管”到“找看用享”的全流程,让AI真正实现“无所不能、无处不在”。
不少媒体也评价称,这次迭代是文库网盘在通用Agent领域深厚野心的一次全面展现:GenFlow2.0所引领的“专家团”模式,则开启了“共创式”的人机交互新篇章。
撇开这些宏大的话术,我看到,百度文库在被大模型重构之后,把自己的路越走越宽了。
李彦宏曾预测,2025年将是AI应用爆发之年。行业后续的进展也验证了他的判断,比如字节押注豆包、剪映,阿里选择了夸克和通义,360在推出纳米AI超级搜索后,更是将企业路线图更新为“All in Agent”。
在投流拉新的性价比,特别是“AI六小龙”的泡沫被戳破后,大厂逐渐把重心转移到一批AI化改造的老产品上。
基于这个逻辑,百度文库和网盘全面融合贯通。他们的全新定位也被描述为,“一站式AI内容获取和创作平台”和““一站式内容服务平台”。二者协同的纽带就是“超级生产力”。
用王颖此前的说法就是,AI产品是原生还是改造,“难点在于怎么破局,避免历史成就沦为包袱,而是成为新产品的助力”。大模型让这两个产品从内容起点到消费终点为用户构建一个完整的桥梁。她希望用最先进的技术和产品,一站式解决用户所有需求。
GenFlow 2.0就是“超级生产力”这个方向的进阶,将AI Agent从“工具”晋升为“伙伴”,成为真正能够帮助用户干活、干好活的“智能搭子”。
换句话说,作为百度在移动互联网时代的两个“国民应用”,文库和网盘在AI时代的协同,既给现有AI市场格局带来了冲击,也让百度在AI to C以及生产力方向上有了能打的牌。
特别是后者,两个近亿级AI月活用户的AI 应用,为百度内部多个AI新业务的推进,提供了一个可靠的生态入口,探索AI Agent、应用落地与商业化之间的路径。
与此同时,百度文库网盘也和核心的搜索业务一起,在“人工智能的百度时代”构成其行业站位的两大 AI to C的支柱,向外辐射☢️,最终让AI真正走向实用,走向大众。
这个探索的价值,GenFlow和百度文库网盘正在接受用户的检验。
参考资料:
百度,《文库GenFlow 2.0!认领你的「AI专家团」》
光子星球,《百度的救命稻草,写在文库里》
我是唐辰同学,关注互联网科技及商业故事。原创内容,未经许可,谢绝转载。
「唐辰同学」
钛媒体、36氪、老虎财经热榜
澎湃新闻2024年最澎湃创作者
老虎财经2024年度优秀专栏
河南日报·顶端新闻2024年度影响力作者
界面新闻优质榜单
老虎财经2024年度优秀专栏
腾讯新闻年度优质热问答主
2023搜狐新闻年度优质创作者
人人都是产品经理2023年度优秀作者
2023网易新闻年度内容合伙人
界面、36氪、钛媒体、澎湃、21财经、蓝鲸、老虎财经等平台专栏认证作者