深度丨Perplexity CEO：不是对话框，也不是 App，浏览器才是 Agent 唯一能落地的入口 #科技 #App #Agent #用户 #Aravind #数据

在所有人都在问“AI Agent 何时落地”的当口，Perplexity CEO Aravind Srinivas 给出了一个与主流截然不同的答案：不是等模型变聪明，而是让 AI 回到人们每天使用的真实环境中——浏览器。

本期节目中，The Verge 副主编 Alex Heath 深入对谈这位前 OpenAI 研究员，聊透他如何将 Perplexity 从一个对话式搜索引擎，推进到 Comet 浏览器这一更大胆的方向。在 Srinivas 看来，Agent 的落地不靠幻想式对话交互，而要依托真实上下文、用户权限与前端容器——而浏览器，正是唯一满足所有条件的平台。它承载了用户的登录态、本地数据和行为习惯，也天然具备执行任务的能力。

Comet 的出现，背后是他对整个 AI 产品演化路径的反思与重构。他并不相信 Agent 能靠语言模型“自动涌现”，更不认可“工具整合即智能”的 MCP 路线。他押注的，是一种工程现实主义：让智能在用户已知的空间里生根，而不是创造一个全新的虚拟入口。

在这场持续两个小时的深度访谈中，Srinivas 分享了为何他认为聊天『机器人』️的竞争已成定局、浏览器才是通用智能真正的栖息地。他坦承 Comet 极度烧钱，但也阐述了如何通过使用强度定价、精准任务收费，让 Agent 成为“可被调用的认知资源池”，而不仅仅是个聊天界面。他也毫不避讳谈论与 Apple 的可能合作、与 Meta 的人才谈判、甚至是 Perplexity 的 IPO 计划。

在 Srinivas 的定义中，浏览器不是一款产品，而是一块 AI 的落地土壤。它不抢夺注意力，不制造幻觉，而是默默完成你不想做、做不了、做不快的事。真正的智能，不是说得动听，而是做得准确。这也许正是 Agent 进入现实的开始。

以下是全文翻译。

Alex Heath：在我们正式谈 Comet 和它的运作机制之前，我想先回顾一下今年 4 月我们在我的《Command Line》通讯里那次对话。当时你告诉我：“我们之所以要做浏览器，是因为这可能是构建 AI agent 的最佳路径。”

这个说法我一直记着。随着近期其他公司的发布，我认为它已经得到了印证。但在我们深入之前，能不能请你先展开说说这个想法——为什么你认为浏览器是打造 AI agent 的最佳路径？

Aravind Srinivas：当然可以。首先，什么是 AI agent？我们从这儿说起。人们对 AI agent 的大致期待是：它能真的为你“做事”。这个定义听上去很模糊，就像人们对 AI 聊天『机器人』️的期待一样——他们希望它能“回应一切”。Agent 也一样，人们希望它能从接收指令开始，一步步完成整个工作流程。

那它需要什么能力呢？它需要“上下文”。它需要从你的第三方应用中调取信息，并代表你在这些应用上执行操作。那就要求它能访问你已登录的第三方应用，能读取其中的数据，而且不能每次都反复让你授权。

同时，它不能是一个“黑箱”，当它搞不定任务时你还能随时接管。这很重要——毕竟现在的推理模型还远远不完美。你需要一个统一的『操作界面』，让人类和 agent 都能无缝协作：不需要你手动登录、不用担心数据隐私，而且操作自然，出错了你也可以轻松介入。

那么，哪个环境能最简单地承载这种协作，而不用搭建虚拟『服务器』、传递一堆登录凭据、让用户焦虑隐私问题？答案就是浏览器。

所有操作都发生在本地，数据是安全的。agent 获取信息的方式，和你自己访问网站时几乎一模一样。你能清楚看到 agent 做了什么，不满意就暂停或干预，让自己来完成。甚至你也可以设置权限——只让它在获得你同意后再执行某些操作。

正是因为浏览器拥有这种“既熟悉又透明”的体验，我们才认为它是引入 AI agent 概念的最理想入口。所以我们决定，重新想象浏览器。

Alex Heath：你们是怎么构建 Comet 的？当我第一次打开它时，感觉非常熟悉，像是在用『Chrome』。我的理解是它是基于 Chromium 开发的——也就是 Google 维护的开源项目，这也让数据迁移变得很方便。

我印象很深的是，我只点了一下，就能把我在『Chrome』上的所有使用上下文迁移过来，甚至包括浏览器扩展。所以我很好奇：你们为什么选择基于 Chromium，而不是完全从头构建一款浏览器？

Aravind Srinivas：首先必须说，Chromium 是一个伟大的开源项目。它在很多方面都做得非常好，比如把浏览器标签页视作独立进程的设计、安全架构、加密机制、核心渲染引擎的性能等等。

这些基础设施我们没必要重做一遍。而且它是开源的，这也让我们更容易招聘开发者来为 Comet 浏览器工作。我们甚至希望未来可以反哺这个生态，而不仅仅是“拿来主义”去构建产品。

其次，Chromium 是目前全球主导的浏览器架构。『Chrome』是显而易见的主流，Edge（微软的浏览器）也是 Chromium 的分支，包括 DuckDuckGo、Brave 等也都是基于 Chromium 的，只有 Safari 是基于 WebKit。

所以我们没有理由“重复造轮子”。

在用户界面（UI）方面，我们决定尽量保留大家熟悉的体验——坦白讲，就是『Chrome』的 UI。Safari 的 UI 稍有不同，有些人喜欢，有些人不喜欢，而且它的市场份额也更小。

迁移体验至关重要。如果用户发现自己的联系人、插件、设置都“丢了”，就会很抵触——没人愿意再去一个个重新登录所有应用。这种“迁移摩擦”太大了。

所以我们在 Comet 的“入门”阶段，不仅要让用户迁移顺畅，也要让 AI agent 能够无缝接入你的上下文。一旦你在『Chrome』中已登录了第三方应用，那么 Comet 中的 agent 就可以在相同的安全标准下读取这些数据，从而立即“释放魔法”。

Alex Heath：这些数据是 agent 在本地看到的，不是吗？Perplexity 本身不会收集我从『Chrome』迁移过来的所有数据、也不会用这些数据来训练模型吧？

Aravind Srinivas：不会。只有当你发出一个相关请求时，agent 才会“看到”对应的数据。

比如你说：“根据我上个月在 Amazon 上的购买记录，推荐一些新的营养补充品”；或者说：“帮我重新下单我经常购买的那款镁片”。agent 只会在那一刻读取与你 prompt 相关的数据，而且不会把你的 Amazon 历史保存在我们的『服务器』上。

你也可以随时设置让我们不保留任何 prompt，包括训练时使用的那些。哪怕我们以后想提升 agent 在 “Amazon 购物” 场景下的能力，也可以完全在不保留数据的前提下做到。

这是我们对隐私和安全的底线。

同时，我们的大模型运行依然是在『服务器』端完成的。这也解释了为什么 Apple 推出“Apple Intelligence”时会遇到那么多困难——他们想把所有智能部署在本地设备上。但其实，要实现高质量的推理，并不一定要“完全本地化”，只要安全架构设计得好，服务端也可以做到非常私密。

这正是我们在 Comet 上所采用的架构理念。

Aravind Srinivas：：确实，虽然上述那些用例都很酷、很“吸睛”，但说实话，目前真正的主流用法是：在你当前网页上调用 sidecar，让它为你完成事情。

而且不只是做简单总结，更是回答复杂问题。比如我正在看 Alex Heath 和扎克伯格的一期播客，我想知道 Zuckerberg 针对某个话题到底说了什么，然后我想把那段话摘出来发给团队的 Slack 群。

我只需要在网页上呼出 sidecar 助手，它就能即时获取 YouTube 的完整字幕，提取出与问题最相关的片段，还可以帮我把这段内容写成一条 Slack 消息。如果我愿意，它甚至能帮我定位视频中对应的时间戳并从那一秒开始播放，无需我从头翻全片。

这就是 Comet 能提供的体验。

Alex Heath：这几乎意味着：如果你时间紧张，就不该再单独“看完一整支 YouTube 视频”了。

Aravind Srinivas：对，尤其当视频内容更偏知识性或资讯性的时候。大多数人不可能总有时间一口气看完整个播客。

比如你正在上班，没空听完 The Verge 的播客，但你又想快速知道 Zuckerberg 在节目中有没有讲他对 AI 集群的看法——这个时候 Comet 的 AI 助手就特别适合你。而周末的时候你可以再回来看完整节目，这都不冲突。

所以我并不认为“传统浏览体验”会被取代，人们依然会刷『社交媒体』、看 Netflix、刷 YouTube，甚至更多——因为 AI agent 已经帮他们节省了很多“正事时间”，他们就能把更多精力花在娱乐上了。

当然，如果你恰好是那种把知识型内容也当作娱乐来消费的人——比如你喜欢看书、看博客文章、看长文分析，那 AI 其实也是在帮你“腾出时间”，去读那些你原本没时间读的内容。

Alex Heath：你们对 Comet 的宣传语是“以思维速度浏览网页”（Browse at the speed of thought）。我确实发现，它的“学习曲线”挺陡的，要真正搞懂它能干什么，需要时间。

Aravind Srinivas：顺便一提，Alex，我还想补充一个点。最近好像有一篇文章——可能是 The Verge 的，也可能是其他媒体的——写 Google 利用 Gemini 模型预测用户在 YouTube 上观看时长的最高点，然后选择那一刻来插入广告。而我们 Perplexity 推出的 Comet 浏览器则是反过来——我们是用 AI 帮用户节省时间，直接定位到视频最相关的时间戳，而不是故意“浪费你的时间”。

这就是我们和 Google 的根本动机差异。

Alex Heath：我确实还有一大堆关于你们商业模式的问题，特别是 Comet 的计算消耗非常高，运行成本不低……但回到这个“上手门槛”的问题，我想先请你谈谈：你们打算怎么降低这个门槛？

因为我第一次打开 Comet 时，其实并不知道它到底能做什么。虽然我看了你们 X 上的一些示例帖子，但从一个新用户的视角来看，使用门槛确实存在。

Aravind Srinivas：完全同意。其实我自己作为用户，在使用早期版本的时候也有同感。虽然我们构建了各种 agent 的用例，但我自己也花了不少时间，才逐渐放弃“传统做事方式”，开始习惯用 AI。

就连最简单的事，比如写邮件回复。我过去总是手动写，而不是用 Google 提供的智能建议，因为那些回复看起来太机械了，而且它也不会结合 Gmail 之外的上下文帮我构思。

或者是查看 Slack 消息，我一般就是开一个标签页，然后挨个点击几十个频道，把所有未读消息手动刷一遍。

这非常低效。

所以我们计划推出更多“实用场景”的教育内容，把这些用法展示给大众——尽量简单易懂、快速上手。

我认为它的发展路径会跟当年 ChatGPT 非常相似。还记得 ChatGPT 刚发布时，大多数人根本不知道怎么用它？直到今天，其实也只有少部分人真正把它融入了日常工作流里。

浏览器作为 AI 入口，也会经历这样的演变过程。

不过我们目前已经发现一个非常自然、几乎不需要教学的入口点：就是 sidecar（侧边栏助手）。它太直观了，用户一用就爱上，几乎变成一种“为什么我还要用没有 sidecar 的浏览器？”的感受。

Alex Heath：确实如此，有了 sidecar（侧边栏助手）之后，你会发现传统的聊天『机器人』️界面，比如 Perplexity 或 ChatGPT，反而显得有些“笨拙”。

Aravind Srinivas：没错。你看现在很多人使用 ChatGPT 的方式——他们收到一封邮件，想知道该怎么回复，就复制粘贴邮件上下文到 ChatGPT，问它怎么写，然后把结果再复制回来，粘贴到 Gmail 草稿里。

或者你在用 Google Sheets 或 Docs，也得重复类似的操作。

Comet 就让这一切变得自然得多。你在当前网页边上就有 assistant，它可以直接协助你修改邮件、整理文档、甚至帮你写一条推文。

比如 Elon Musk 发了条推，你想回复个好笑的评论，你只需要问 Comet：“给我起个搞笑的回应”，它就会自动起草一条你可以直接点“发布”的回复。

这种体验将极大减少用户来回打开新标签、重复操作 AI 的频次。你甚至可以直接在当前网页上启动 agent，让它去调取相关上下文信息，任务完成后再通过推送通知你。

这是真正意义上的“任务委托”。

Alex Heath：那你们目前有哪些数据能看出 Comet 哪些地方表现不佳，或者还存在问题？

Aravind Srinivas：很明显，它还不能完全胜任长周期、复杂的任务。比如处理需要 15 分钟以上、涉及多个环节的事情，现在还不是 Comet 的强项。

举个例子：

假设你想让我给你列一份清单——所有毕业于 Stanford、曾经在 Anthropic 工作过的『工程师』名单（不要求现在仍在 Anthropic）。我希望你能把他们的 LinkedIn 链接汇总到 Google Sheet 表格中，并尝试用 ZoomInfo 获取他们的邮箱，然后还要帮我草拟一封封针对性的冷启动邮件，用来约 coffee chat。

现在的 Comet 做不到完全自动完成这个流程。它可以完成其中一些步骤，但你仍然要扮演“总协调人”的角色，把流程拼接起来。

不过我相信——六个月到一年内，它可以全部自动完成。

Alex Heath：你认为进展会这么快吗？

Aravind Srinivas：我赌的是“推理模型的持续进化”。就像我们在 2022 年赌 GPT-4 和 Claude 3.5 Sonnet 的发布，使得 Perplexity 基本解决了幻觉问题（前提是你有好索引 + 好模型）。这次我们也相信，只要浏览器环境足够开放，工具链齐全，模型只要稍微再聪明一点——比如 GPT-5 或 Claude 4.5——就能完成这类全流程任务。

到那时，一名招聘者一周的工作量，可能就变成了一个 prompt。

而且不仅是这一步，你还需要“状态跟踪”——agent 要持续跟进，比如有人回了邮件，就更新 Google Sheet 状态，标注为“已回复”或“进行中”；然后安排回访，调整冲突日程，提前准备会议简报……

很多操作未来应该是主动触发的，甚至都不需要用户下达指令。

这是我们对浏览器的终极愿景：它将像操作系统一样，常驻后台，不断运行各种“认知进程”。

虽然这些今天还不成熟，但我们始终擅长捕捉技术临界点：找准“几乎可行”的场景，打磨产品细节，吸引早期用户，然后搭着推理模型进步的浪潮不断扩展能力。

这就是我们的战略。

Alex Heath：我不确定问题出在模型能力、产品早期还是我个人使用方式的问题——但我可以说，基于我初步体验，我会用“有些脆弱、不够稳定”来形容 Comet 的成功率。

比如我要求它帮我定位一班具体航班的订票页面，它做到了，还帮我预填了一些字段。这比普通聊天『机器人』️更进一步，挺好。

但当我要求它“列出所有在 X 平台关注我、并在 Meta 工作的人”，它只找出了一个，而我知道不止这一个。又比如我说“找出我上一次采访 Perplexity CEO 的那期节目”，它说找不到，但结果页上却又显示了正确的来源链接。这说明回答和引用信息不一致。

我想知道这类“易碎体验”是 bug 造成的，还是模型、架构设计本身的局限？

Aravind Srinivas：如果你愿意分享具体链接，我很乐意去看看。不过可以肯定地说：我们自己公开宣传的功能，都是我们预期能稳定实现的。

当然，它们不是每一次都 100% 成功，但我相信再过几个月，这些体验的稳定性会大幅提升。

你得踩准时机——别等一切“完美落地”才开始用，而是要比主流更早一点、敢试错一点。很多人其实就是享受这种“在风口浪尖上的感觉”。

大多数用户会等稳定性完全可靠之后再来；而这类人，我们已经通过 sidecar 给到了足够多的价值。他们甚至不必用到 agent，光用侧边栏助手、Gmail 集成功能、日历连接、LinkedIn 搜索、YouTube 内容摘要……就已经比『Chrome』好用很多了。

而一旦“多分钟级的复杂任务”也能稳定执行，那才真正进入 OS 级的体验。你就会发现：整台电脑里，最有意义的窗口，就是 Comet 浏览器本身。

Alex Heath：我们这次的开场就聊到了浏览器是构建 AI agent 的理想环境，而整个行业其实还有另一条很热门的技术路径，那就是 MCP（Model Context Protocol）。

它本质上是一个编排层，可以让大模型和 Airtable、Google Docs 等应用连接，代替用户完成操作——从目标来看，它和你们在 sidecar 上做的事很像。

你们走的是“浏览器 + 登录态”这条路径，而像 Anthropic、OpenAI 等都在押注 MCP。这两条路线你怎么看？你是对 MCP 不看好吗，还是觉得它更适合其他公司？

Aravind Srinivas：我并不是完全看空 MCP，我只是觉得它还没成熟，而我不想等。

我们行业已经花了两年时间反复“讨论” agent，但真正**“做出一个真的能用的 agent”的还几乎没有。我受够了。所以我们认为浏览器是当下最务实的选择**，能立刻落地。

我相信 MCP 在未来五年里一定会成为重要组成部分。但目前，它仍面临很多安全问题：比如从客户端往 MCP 『服务器』传认证令牌（token）、或者是 MCP 『服务器』再转发给别的客户端……这些都比本地持久登录态的浏览器要风险大很多。

OpenAI 的 Operator（agent 模块）也遇到了类似问题，它试图在服务端创建你所有 app 的“镜像副本”，但这仍然面临数据同步、权限控制、延迟响应等问题。

我们未来肯定会集成一些高质量的 MCP 连接器，比如 Linear、Notion 或 GitHub 的 MCP 插件。如果某些场景下，使用 MCP 比打开页面、模拟点击更高效，我们当然会选 MCP。但问题是——MCP 并不帮你“找数据”或“解决搜索问题”，你仍得让 agent 自己知道该提取什么、做什么操作、如何规划步骤、遇到错误怎么 retry……

MCP 只是一个协议，并不是整个编排框架。

而浏览器，是专门为人类操作设计的环境。从 DOM（页面文档结构）中提取操作路径、判断页面元素，这些事情推理模型已经变得相当擅长。

所以我们采用一种混合式策略，看哪种路径更可靠、更快、更便宜。假如 MCP 在某些任务上优于“浏览器 agent”，那我们就用 MCP。我们对工具没有执念，目标只有一个：效率、可靠性、成本最优。

Alex Heath：在 The Verge，我们很在意网页的呈现方式、排版、视觉体验等艺术性内容。但当 AI agent 大量涌入浏览器、开始主导 Web 操作后，我很想问：你认为网页本身的“设计感”是否会逐渐失去意义？

换句话说，Web 会不会变成一堆“agent 爬取数据的数据库”，而原本为用户打造的交互体验彻底消失？

Aravind Srinivas：我不这么认为。品牌仍然非常重要。

哪怕 AI 和人类都在“同时上网”，只要你有一个有影响力的品牌，人们依旧会主动关注你发布的内容——可能是你这个人，也可能是你所在的媒体，比如 The Verge，或是你们的某位作者。

就算在 The Verge 里面，我可能只对某些作者的文章感兴趣。品牌背后的“人”会越来越成为流量锚点。

而且现在很多访问量其实都不是来自传统搜索，而是来自『社交媒体』——比如你在 Instagram、X（推特）、LinkedIn 上发了新文章，人们是通过分享点击过来的。这和文章的视觉呈现、内容深度依旧息息相关。

倒是那些试图靠 SEO“刷排名”、靠关键词堆砌流量的新平台，我确实不看好。过去那套 SEO 技术手册，不再是流量增长的主路径了。

你得通过别的方式构建品牌。而已有品牌影响力的媒体，也需要用一套全新的方法去维持用户粘性，不能再靠“优化搜索引擎”这一招吃遍天下。

Alex Heath：Comet 的计算开销很大，而且现在仍是邀请制。我想你一定很希望能立刻向所有人开放，但如果真这么做，可能『服务器』就要爆了，或者 AWS 账单也炸了，对吧？

那你打算怎么扩大这个产品？不仅是从产品层面，让普通人容易理解和上手，也包括商业维度——毕竟你们是风投支持的公司，终归得盈利。像 Comet 这样一个甚至比聊天『机器人』️还要“烧算力”的产品，你打算如何规模化？

Aravind Srinivas：我认为只要 agent 的成功率够高、稳定性够好，人们是愿意为“单次使用”付费的。

比如我刚才提到的招聘任务：你要拉一份 Anthropic 员工名单，做 cold email 营销。这通常要花你几个小时，或者雇个猎头、外包给 sourcing consultant。

再举个例子：你想在 Instagram 上投广告，但你需要调研竞争品牌的广告样式、找 100 个关键词的投放单价、做竞价对比和预算分配。这些事，如果你自己搞，至少得花几个小时，而且也可能没搞清楚。而 AI不但能帮你省时间，还可能帮你找到套利空间。

虽然现在还处于早期阶段，但这些“可验证的用户需求”已经逐渐浮现。

而一旦用户把大量脑力劳动批量外包给 AI，并且 agent 能可靠完成——那它就像是你自己的“自然语言描述的 AWS 集群”，可以并行完成所有任务。

只要我们能够落地这个路径，推理模型持续进步，我们最终可以做出一款类似“Cloud Code for Life”的产品。

Cloud Code 本身月费就能上千美元💵，但大家愿意买，因为它能帮你升职、让你更快完成 KPI，ROI是显而易见的。

Alex Heath：你现在这么重押浏览器，是不是因为觉得聊天『机器人』️这场仗已经被 ChatGPT 赢了？那 Perplexity 现在的主产品，是不是也会逐步被 Comet 替代？

Aravind Srinivas：我不这么看。首先，我同意“聊天产品这场仗”从结果看，确实已经是 ChatGPT 的天下——人们日常聊天几乎不会去用别的产品了。

但我们从一开始就没想做“聊天产品”，我们是要重构搜索。哪怕现在每个 chatbot 都内嵌搜索引擎，但还是有很多人更偏好我们这种“搜索为主、对话为辅”的方式。

Google、Grok、Meta 都在努力追赶 ChatGPT 的聊天体验——但我个人觉得，那已经是浪费时间。

反而我们认为：浏览器是一个比聊天更大的机会。

它用户粘性更强，是唯一能承载 agent 的平台，是实现端到端工作流、个性化记忆、上下文管理的必经之路。

而且，它是一个极具挑战的产品：不仅涉及智能程度，还需要深度产品打磨、上下文工程、前端后端架构、安全、隐私……方方面面都要精细打磨。比聊天『机器人』️难多了。

Alex Heath：那你怎么看 OpenAI 要做浏览器这事？是不是他们也认可你说的这套？

Aravind Srinivas：我不知道他们是不是要做，我也只是看到了一些“泄露图”。有意思的是，这些爆料是在我们 Comet 发布后两个小时出现的。

你刚才还说 Perplexity 可能要被 Comet 替代——我不这么看。因为你不能做出一款好浏览器，而没有自己的搜索引擎。

很多人之所以夸 Comet 好用，是因为它不像传统浏览器，那是因为我们默认搜索引擎就是 Perplexity。

我们做了很多判断意图的优化——比如你是在找导航链接、图片、信息，我们都能一站式给你搞定。你可以在一个搜索框里完成导航、搜索、调用 agent。

而这一切的基础，是我们这两年多来对搜索引擎的持续打磨。

就像没有 Google 就无法支撑『Chrome』；你也不能没有 Perplexity 就造出 Comet。

Alex Heath：那 Comet 和 Perplexity 会分别有独立的移动端 App 吗？

Aravind Srinivas：会的，两个产品都会推出独立 App。

有些用户会把 Comet 当作主力浏览器来用，就像他们今天用『Chrome』或 Safari 一样——只不过这个浏览器自带 AI 助手，甚至支持语音交互。但也有人只是想直接访问一个网页、快速完成某项搜索，不需要太多智能功能，这时就会用 Perplexity 的独立 App。

所以我们也会在 Perplexity App 内集成一个“打包版 Comet 浏览器”，就像你在 iOS 上的 Google App 实际上也能打开网页。顺便说一句，不管是 Google App 还是『Chrome』，它们在 iOS 上其实都是 WebKit 内核，Android 上则是 Chromium。

我们会遵循类似的路线。

Alex Heath：说到竞争对手，你怎么看 The Browser Company 的 Dia？它和 Comet 几乎同期发布，显然也在向同样的方向靠近。他们在 Arc 浏览器时代就引发了不少关注，现在也押注“agent 浏览器”这条赛道了。

你用过 Dia 吗？你怎么看它和 Comet 的差异？

Aravind Srinivas：我本人还没试用过 Dia，但看过一些用户反馈。我觉得他们在视觉体验和前端交互上确实有不少创意。

如果我是他们，我可能会直接在 Arc 浏览器里实验这些功能，而不是重新做一个新产品来扩张分发。但无论如何，我们会持续关注所有相关产品。

不过我们目前的核心关注仍是『Chrome』，因为那才是真正的“大哥”。

我的策略是：哪怕我们只从『Chrome』用户里抢下 1% 设置成 Comet 默认浏览器，那对我们来说已经是巨大的胜利，同时也是对他们的一次重大打击——因为广告营收上的损失，在这个规模下是极其可观的。

Alex Heath：你们主要靠口碑增长吗？还是打算找一些渠道或平台分发合作？

Aravind Srinivas：我们初期仍会坚持靠口碑传播。这个策略在 Perplexity 本身就很有效，我们希望 Comet 也能复制这个轨迹。

而且我们现在已经有了 3000 到 4000 万 Perplexity 的基础用户。如果我们能让其中一部分人试用 Comet，并转化成设为默认浏览器的用户，那就已经是一场巨大胜利——不必依赖其他分发渠道。

当然，我们也会考虑把这种增长转化为更深层次的合作，比如 Google 跟很多厂商的那种 OEM 分发协议。

但我必须指出，这会非常难。我们以前也聊过这个话题： Google 确保每台 Android 设备默认浏览器都是『Chrome』，你想换掉它？你得付出巨额代价。

微软也是一样，几乎所有『Windows』设备都预装 Edge，而且你也几乎改不了。这些 OEM 厂商和平台有多年期的深度绑定协议，提前两年就在规划出厂设备了——你几乎没办法切入。

这其实是他们的“护城河”所在：不是产品本身，而是他们精心编织的法律和渠道锁定。

所以我很高兴美国司法部（DOJ）终于开始调查这些事，我们也提交了自己的建议清单，希望能带来改变。

Alex Heath：如果 DOJ 强制拆分『Chrome』，那确实会重置一切。

现在有很多人说 Apple 应该收购你们。Eddy Cue（Apple 高管）在 Google 垄断案的庭审上还公开表示他喜欢你们的产品，听说你们聊过合作的事。我知道你现在不能公布任何未官宣的事，但你怎么看 Apple？

Aravind Srinivas：首先，我很荣幸 Eddy Cue 会在庭上提到我们。他说他很喜欢我们的产品，而且他的圈子里也有人推荐过。我当然希望有机会和 Apple 合作，比如在 Safari、Siri、Apple Intelligence 等层面进行集成。

Apple 是一个人人都喜欢的品牌，某种意义上也是一种“身份象征”。很多人都希望成为 Apple 生态的一部分。

我觉得我们在设计理念上跟 Apple 很契合，追求极致体验。但与此同时，我的目标仍然是：让 Perplexity 尽可能做大，做强。

我们希望这个浏览器是平台无关的——能同时服务 Android 和 iOS 用户，也能在『Windows』和 macOS 上跑得很好。我们相信，就算不拥有操作系统，也能通过打造最好的搜索引擎和最好的浏览器，做出一家伟大的公司。就像 Google 曾经那样。

Alex Heath：我还听说 Zuckerberg 曾经想挖你去 Meta，加入他重启的 AI 项目。你当时是怎么考虑的？他怎么说服你？

Aravind Srinivas：Zuck 很棒，他真的在做很多令人兴奋的事。而且 Meta 本身就是一个非常有粘性的产品平台。我们也一直在学习他们是怎么在没有操作系统的前提下，构建起一家庞大的『互联网』公司的。

Alex Heath：你看到 Zuck 开出那些“九位数”级别的天价薪酬 package（有些甚至是几亿美元💵），惊讶吗？

Aravind Srinivas：有点吃惊，确实蛮大的数字。不过我知道这些 package 往往和股票挂钩，只有股价涨了才兑现，所以也不算“保底”那种。但确实非常高。

不过你看 xAI（Elon Musk 的 AI 公司），就没花那么多钱，也能训练出接近 OpenAI、Anthropic 的模型。所以我不觉得“砸钱”一定等于结果。

真正重要的是：你有没有一支协同顺畅的团队，有没有清晰的使命、清楚的里程碑。

Zuck 可能的想法是：“我给你人、给你算力、给你资源，但从现在起你必须执行得漂亮，否则你也明白会给我带来什么风险。”

Alex Heath：那你怎么看 Zuck 这波“天价挖人潮”对整个 AI 人才市场的影响？会不会像 NBA 转会市场一样，顶级选手身价暴涨？

Aravind Srinivas：确实像是 AI 界的“球星交易市场”了。一些『明星』️研究员现在的谈判能力非常强。

不过我注意到，**Anthropic 的研究员几乎没被挖走。**说明人家团队真的很团结，对使命有认同感。大家在那儿工作很开心、遇到新挑战、每天都在成长，而且也有财务回报。

这才是一个团队能长期稳定发展的关键，不只是钱。

Alex Heath：你会特别看重盈利目标吗？比如为的是更独立地掌控公司命运。

Aravind Srinivas：当然。盈利是必须的，我们会在 IPO 前实现。我们预计 2028 或 2029 年上市，我是非常希望 IPO 的。

我不想永远做一家私营公司——虽然保持私有状态确实在并购和决策效率方面有优势，但我认为 IPO 带来的品牌效应和用户信任，也是巨大的。

而且，成为“第一个可公开投资的 Google 替代品”，本身就是个超级重要的市场信号。

不过我们也不打算太早 IPO，得等公司收入破 10 亿美元💵，同时有稳定盈利才合适。

但这不代表我们现在就要“缩手缩脚”。现在是该冒险、该尝试新东西的阶段。

Alex Heath：你们是 3 年前推出 Perplexity 的，差不多也是 ChatGPT 发布前后。现在看来，这 3 年里你们经历的一切都不可思议。如果让你展望未来 3 年——比如你刚说的 2028 年 IPO，那时的 Perplexity 会是什么样子？

Aravind Srinivas：我希望那时候的 Perplexity 能成为你想到“要完成任何任务”时，第一时间会打开的工具。

它会与你保持深度同步，理解你所有的上下文，甚至主动帮你思考、主动为你减负，让你的生活真正变得更轻松。

Alex Heath：那我们今天就聊到这儿。谢谢你，Aravind！

Aravind Srinivas：谢谢你，Alex。

深度丨Perplexity CEO：不是对话框，也不是 App，浏览器才是 Agent 唯一能落地的入口

猜你喜欢

南京地图全攻略：导航、景点、交通一网打尽！(南京地图详细)

iOS26透明设计引争议，用户评价两极分化(ios透明桌面)

怎么给PDF文件设置奇偶页不同的页眉(怎么给pdf文件设置作者信息)

穿衣选择困难？用移乐AI换服装10秒出片，免费解锁『穿搭』新方式！(选衣服困难)

干咳胸闷憋气什么原因(胸闷干咳有点憋是咋回事)