深度丨Perplexity CEO:不是对话框,也不是 App,浏览器才是 Agent 唯一能落地的入口

深度丨Perplexity CEO:不是对话框,也不是 App,浏览器才是 Agent 唯一能落地的入口

在所有人都在问“AI Agent 何时落地”的当口,Perplexity CEO Aravind Srinivas 给出了一个与主流截然不同的答案:不是等模型变聪明,而是让 AI 回到人们每天使用的真实环境中——浏览器。

本期节目中,The Verge 副主编 Alex Heath 深入对谈这位前 OpenAI 研究员,聊透他如何将 Perplexity 从一个对话式搜索引擎,推进到 Comet 浏览器这一更大胆的方向。在 Srinivas 看来,Agent 的落地不靠幻想式对话交互,而要依托真实上下文、用户权限与前端容器——而浏览器,正是唯一满足所有条件的平台。它承载了用户的登录态、本地数据和行为习惯,也天然具备执行任务的能力。

Comet 的出现,背后是他对整个 AI 产品演化路径的反思与重构。他并不相信 Agent 能靠语言模型“自动涌现”,更不认可“工具整合即智能”的 MCP 路线。他押注的,是一种工程现实主义:让智能在用户已知的空间里生根,而不是创造一个全新的虚拟入口。

在这场持续两个小时的深度访谈中,Srinivas 分享了为何他认为聊天机器人的竞争已成定局、浏览器才是通用智能真正的栖息地。他坦承 Comet 极度烧钱,但也阐述了如何通过使用强度定价、精准任务收费,让 Agent 成为“可被调用的认知资源池”,而不仅仅是个聊天界面。他也毫不避讳谈论与 Apple 的可能合作、与 Meta 的人才谈判、甚至是 Perplexity 的 IPO 计划。

在 Srinivas 的定义中,浏览器不是一款产品,而是一块 AI 的落地土壤。它不抢夺注意力,不制造幻觉,而是默默完成你不想做、做不了、做不快的事。真正的智能,不是说得动听,而是做得准确。这也许正是 Agent 进入现实的开始。

以下是全文翻译。

Alex Heath:在我们正式谈 Comet 和它的运作机制之前,我想先回顾一下今年 4 月我们在我的《Command Line》通讯里那次对话。当时你告诉我:“我们之所以要做浏览器,是因为这可能是构建 AI agent 的最佳路径。”

这个说法我一直记着。随着近期其他公司的发布,我认为它已经得到了印证。但在我们深入之前,能不能请你先展开说说这个想法——为什么你认为浏览器是打造 AI agent 的最佳路径?

Aravind Srinivas:当然可以。首先,什么是 AI agent?我们从这儿说起。人们对 AI agent 的大致期待是:它能真的为你“做事”。这个定义听上去很模糊,就像人们对 AI 聊天机器人的期待一样——他们希望它能“回应一切”。Agent 也一样,人们希望它能从接收指令开始,一步步完成整个工作流程。

那它需要什么能力呢?它需要“上下文”。它需要从你的第三方应用中调取信息,并代表你在这些应用上执行操作。那就要求它能访问你已登录的第三方应用,能读取其中的数据,而且不能每次都反复让你授权。

同时,它不能是一个“黑箱”,当它搞不定任务时你还能随时接管。这很重要——毕竟现在的推理模型还远远不完美。你需要一个统一的操作界面,让人类和 agent 都能无缝协作:不需要你手动登录、不用担心数据隐私,而且操作自然,出错了你也可以轻松介入。

那么,哪个环境能最简单地承载这种协作,而不用搭建虚拟服务器、传递一堆登录凭据、让用户焦虑隐私问题?答案就是浏览器。

所有操作都发生在本地,数据是安全的。agent 获取信息的方式,和你自己访问网站时几乎一模一样。你能清楚看到 agent 做了什么,不满意就暂停或干预,让自己来完成。甚至你也可以设置权限——只让它在获得你同意后再执行某些操作。

正是因为浏览器拥有这种“既熟悉又透明”的体验,我们才认为它是引入 AI agent 概念的最理想入口。所以我们决定,重新想象浏览器。

Alex Heath:你们是怎么构建 Comet 的?当我第一次打开它时,感觉非常熟悉,像是在用 Chrome。我的理解是它是基于 Chromium 开发的——也就是 Google 维护的开源项目,这也让数据迁移变得很方便。

我印象很深的是,我只点了一下,就能把我在 Chrome 上的所有使用上下文迁移过来,甚至包括浏览器扩展。所以我很好奇:你们为什么选择基于 Chromium,而不是完全从头构建一款浏览器?

Aravind Srinivas:首先必须说,Chromium 是一个伟大的开源项目。它在很多方面都做得非常好,比如把浏览器标签页视作独立进程的设计、安全架构、加密机制、核心渲染引擎的性能等等。

这些基础设施我们没必要重做一遍。而且它是开源的,这也让我们更容易招聘开发者来为 Comet 浏览器工作。我们甚至希望未来可以反哺这个生态,而不仅仅是“拿来主义”去构建产品。

其次,Chromium 是目前全球主导的浏览器架构。Chrome 是显而易见的主流,Edge(微软的浏览器)也是 Chromium 的分支,包括 DuckDuckGo、Brave 等也都是基于 Chromium 的,只有 Safari 是基于 WebKit。

所以我们没有理由“重复造轮子”。

在用户界面(UI)方面,我们决定尽量保留大家熟悉的体验——坦白讲,就是 Chrome 的 UI。Safari 的 UI 稍有不同,有些人喜欢,有些人不喜欢,而且它的市场份额也更小。

迁移体验至关重要。如果用户发现自己的联系人、插件、设置都“丢了”,就会很抵触——没人愿意再去一个个重新登录所有应用。这种“迁移摩擦”太大了。

所以我们在 Comet 的“入门”阶段,不仅要让用户迁移顺畅,也要让 AI agent 能够无缝接入你的上下文。一旦你在 Chrome 中已登录了第三方应用,那么 Comet 中的 agent 就可以在相同的安全标准下读取这些数据,从而立即“释放魔法”。

Alex Heath:这些数据是 agent 在本地看到的,不是吗?Perplexity 本身不会收集我从 Chrome 迁移过来的所有数据、也不会用这些数据来训练模型吧?

Aravind Srinivas:不会。只有当你发出一个相关请求时,agent 才会“看到”对应的数据。

比如你说:“根据我上个月在 Amazon 上的购买记录,推荐一些新的营养补充品”;或者说:“帮我重新下单我经常购买的那款镁片”。agent 只会在那一刻读取与你 prompt 相关的数据,而且不会把你的 Amazon 历史保存在我们的服务器上。

你也可以随时设置让我们不保留任何 prompt,包括训练时使用的那些。哪怕我们以后想提升 agent 在 “Amazon 购物” 场景下的能力,也可以完全在不保留数据的前提下做到。

这是我们对隐私和安全的底线。

同时,我们的大模型运行依然是在服务器端完成的。这也解释了为什么 Apple 推出“Apple Intelligence”时会遇到那么多困难——他们想把所有智能部署在本地设备上。但其实,要实现高质量的推理,并不一定要“完全本地化”,只要安全架构设计得好,服务端也可以做到非常私密。

这正是我们在 Comet 上所采用的架构理念。

Aravind Srinivas::确实,虽然上述那些用例都很酷、很“吸睛”,但说实话,目前真正的主流用法是:在你当前网页上调用 sidecar,让它为你完成事情。

而且不只是做简单总结,更是回答复杂问题。比如我正在看 Alex Heath 和扎克伯格的一期播客,我想知道 Zuckerberg 针对某个话题到底说了什么,然后我想把那段话摘出来发给团队的 Slack 群。

我只需要在网页上呼出 sidecar 助手,它就能即时获取 YouTube 的完整字幕,提取出与问题最相关的片段,还可以帮我把这段内容写成一条 Slack 消息。如果我愿意,它甚至能帮我定位视频中对应的时间戳并从那一秒开始播放,无需我从头翻全片。

这就是 Comet 能提供的体验。

Alex Heath:这几乎意味着:如果你时间紧张,就不该再单独“看完一整支 YouTube 视频”了

Aravind Srinivas:对,尤其当视频内容更偏知识性或资讯性的时候。大多数人不可能总有时间一口气看完整个播客。

比如你正在上班,没空听完 The Verge 的播客,但你又想快速知道 Zuckerberg 在节目中有没有讲他对 AI 集群的看法——这个时候 Comet 的 AI 助手就特别适合你。而周末的时候你可以再回来看完整节目,这都不冲突。

所以我并不认为“传统浏览体验”会被取代,人们依然会刷社交媒体、看 Netflix、刷 YouTube,甚至更多——因为 AI agent 已经帮他们节省了很多“正事时间”,他们就能把更多精力花在娱乐上了。

当然,如果你恰好是那种把知识型内容也当作娱乐来消费的人——比如你喜欢看书、看博客文章、看长文分析,那 AI 其实也是在帮你“腾出时间”,去读那些你原本没时间读的内容。

Alex Heath:你们对 Comet 的宣传语是“以思维速度浏览网页”(Browse at the speed of thought)。我确实发现,它的“学习曲线”挺陡的,要真正搞懂它能干什么,需要时间。

Aravind Srinivas:顺便一提,Alex,我还想补充一个点。最近好像有一篇文章——可能是 The Verge 的,也可能是其他媒体的——写 Google 利用 Gemini 模型预测用户在 YouTube 上观看时长的最高点,然后选择那一刻来插入广告。而我们 Perplexity 推出的 Comet 浏览器则是反过来——我们是用 AI 帮用户节省时间,直接定位到视频最相关的时间戳,而不是故意“浪费你的时间”。

这就是我们和 Google 的根本动机差异

Alex Heath:我确实还有一大堆关于你们商业模式的问题,特别是 Comet 的计算消耗非常高,运行成本不低……但回到这个“上手门槛”的问题,我想先请你谈谈:你们打算怎么降低这个门槛?

因为我第一次打开 Comet 时,其实并不知道它到底能做什么。虽然我看了你们 X 上的一些示例帖子,但从一个新用户的视角来看,使用门槛确实存在。

Aravind Srinivas:完全同意。其实我自己作为用户,在使用早期版本的时候也有同感。虽然我们构建了各种 agent 的用例,但我自己也花了不少时间,才逐渐放弃“传统做事方式”,开始习惯用 AI。

就连最简单的事,比如写邮件回复。我过去总是手动写,而不是用 Google 提供的智能建议,因为那些回复看起来太机械了,而且它也不会结合 Gmail 之外的上下文帮我构思。

或者是查看 Slack 消息,我一般就是开一个标签页,然后挨个点击几十个频道,把所有未读消息手动刷一遍。

这非常低效。

所以我们计划推出更多“实用场景”的教育内容,把这些用法展示给大众——尽量简单易懂、快速上手。

我认为它的发展路径会跟当年 ChatGPT 非常相似。还记得 ChatGPT 刚发布时,大多数人根本不知道怎么用它?直到今天,其实也只有少部分人真正把它融入了日常工作流里。

浏览器作为 AI 入口,也会经历这样的演变过程。

不过我们目前已经发现一个非常自然、几乎不需要教学的入口点:就是 sidecar(侧边栏助手)。它太直观了,用户一用就爱上,几乎变成一种“为什么我还要用没有 sidecar 的浏览器?”的感受。

Alex Heath:确实如此,有了 sidecar(侧边栏助手)之后,你会发现传统的聊天机器人界面,比如 Perplexity 或 ChatGPT,反而显得有些“笨拙”。

Aravind Srinivas:没错。你看现在很多人使用 ChatGPT 的方式——他们收到一封邮件,想知道该怎么回复,就复制粘贴邮件上下文到 ChatGPT,问它怎么写,然后把结果再复制回来,粘贴到 Gmail 草稿里。

或者你在用 Google Sheets 或 Docs,也得重复类似的操作。

Comet 就让这一切变得自然得多。你在当前网页边上就有 assistant,它可以直接协助你修改邮件、整理文档、甚至帮你写一条推文。

比如 Elon Musk 发了条推,你想回复个好笑的评论,你只需要问 Comet:“给我起个搞笑的回应”,它就会自动起草一条你可以直接点“发布”的回复。

这种体验将极大减少用户来回打开新标签、重复操作 AI 的频次。你甚至可以直接在当前网页上启动 agent,让它去调取相关上下文信息,任务完成后再通过推送通知你。

这是真正意义上的“任务委托”。

Alex Heath:那你们目前有哪些数据能看出 Comet 哪些地方表现不佳,或者还存在问题?

Aravind Srinivas:很明显,它还不能完全胜任长周期、复杂的任务。比如处理需要 15 分钟以上、涉及多个环节的事情,现在还不是 Comet 的强项。

举个例子:

假设你想让我给你列一份清单——所有毕业于 Stanford、曾经在 Anthropic 工作过的工程师名单(不要求现在仍在 Anthropic)。我希望你能把他们的 LinkedIn 链接汇总到 Google Sheet 表格中,并尝试用 ZoomInfo 获取他们的邮箱,然后还要帮我草拟一封封针对性的冷启动邮件,用来约 coffee chat。

现在的 Comet 做不到完全自动完成这个流程。它可以完成其中一些步骤,但你仍然要扮演“总协调人”的角色,把流程拼接起来。

不过我相信——六个月到一年内,它可以全部自动完成。

Alex Heath:你认为进展会这么快吗?

Aravind Srinivas:我赌的是“推理模型的持续进化”。就像我们在 2022 年赌 GPT-4 和 Claude 3.5 Sonnet 的发布,使得 Perplexity 基本解决了幻觉问题(前提是你有好索引 + 好模型)。这次我们也相信,只要浏览器环境足够开放,工具链齐全,模型只要稍微再聪明一点——比如 GPT-5 或 Claude 4.5——就能完成这类全流程任务。

到那时,一名招聘者一周的工作量,可能就变成了一个 prompt。

而且不仅是这一步,你还需要“状态跟踪”——agent 要持续跟进,比如有人回了邮件,就更新 Google Sheet 状态,标注为“已回复”或“进行中”;然后安排回访,调整冲突日程,提前准备会议简报……

很多操作未来应该是主动触发的,甚至都不需要用户下达指令。

这是我们对浏览器的终极愿景:它将像操作系统一样,常驻后台,不断运行各种“认知进程”。

虽然这些今天还不成熟,但我们始终擅长捕捉技术临界点:找准“几乎可行”的场景,打磨产品细节,吸引早期用户,然后搭着推理模型进步的浪潮不断扩展能力。

这就是我们的战略。

Alex Heath:我不确定问题出在模型能力、产品早期还是我个人使用方式的问题——但我可以说,基于我初步体验,我会用“有些脆弱、不够稳定”来形容 Comet 的成功率。

比如我要求它帮我定位一班具体航班的订票页面,它做到了,还帮我预填了一些字段。这比普通聊天机器人更进一步,挺好。

但当我要求它“列出所有在 X 平台关注我、并在 Meta 工作的人”,它只找出了一个,而我知道不止这一个。又比如我说“找出我上一次采访 Perplexity CEO 的那期节目”,它说找不到,但结果页上却又显示了正确的来源链接。这说明回答和引用信息不一致。

我想知道这类“易碎体验”是 bug 造成的,还是模型、架构设计本身的局限?

Aravind Srinivas:如果你愿意分享具体链接,我很乐意去看看。不过可以肯定地说:我们自己公开宣传的功能,都是我们预期能稳定实现的。

当然,它们不是每一次都 100% 成功,但我相信再过几个月,这些体验的稳定性会大幅提升。

你得踩准时机——别等一切“完美落地”才开始用,而是要比主流更早一点、敢试错一点。很多人其实就是享受这种“在风口浪尖上的感觉”。

大多数用户会等稳定性完全可靠之后再来;而这类人,我们已经通过 sidecar 给到了足够多的价值。他们甚至不必用到 agent,光用侧边栏助手、Gmail 集成功能、日历连接、LinkedIn 搜索、YouTube 内容摘要……就已经比 Chrome 好用很多了。

而一旦“多分钟级的复杂任务”也能稳定执行,那才真正进入 OS 级的体验。你就会发现:整台电脑里,最有意义的窗口,就是 Comet 浏览器本身。

Alex Heath:我们这次的开场就聊到了浏览器是构建 AI agent 的理想环境,而整个行业其实还有另一条很热门的技术路径,那就是 MCP(Model Context Protocol)。

它本质上是一个编排层,可以让大模型和 Airtable、Google Docs 等应用连接,代替用户完成操作——从目标来看,它和你们在 sidecar 上做的事很像。

你们走的是“浏览器 + 登录态”这条路径,而像 Anthropic、OpenAI 等都在押注 MCP。这两条路线你怎么看?你是对 MCP 不看好吗,还是觉得它更适合其他公司?

Aravind Srinivas:我并不是完全看空 MCP,我只是觉得它还没成熟,而我不想等。

我们行业已经花了两年时间反复“讨论” agent,但真正**“做出一个真的能用的 agent”的还几乎没有。我受够了。所以我们认为浏览器是当下最务实的选择**,能立刻落地。

我相信 MCP 在未来五年里一定会成为重要组成部分。但目前,它仍面临很多安全问题:比如从客户端往 MCP 服务器传认证令牌(token)、或者是 MCP 服务器再转发给别的客户端……这些都比本地持久登录态的浏览器要风险大很多

OpenAI 的 Operator(agent 模块)也遇到了类似问题,它试图在服务端创建你所有 app 的“镜像副本”,但这仍然面临数据同步、权限控制、延迟响应等问题。

我们未来肯定会集成一些高质量的 MCP 连接器,比如 Linear、Notion 或 GitHub 的 MCP 插件。如果某些场景下,使用 MCP 比打开页面、模拟点击更高效,我们当然会选 MCP。但问题是——MCP 并不帮你“找数据”或“解决搜索问题”,你仍得让 agent 自己知道该提取什么、做什么操作、如何规划步骤、遇到错误怎么 retry……

MCP 只是一个协议,并不是整个编排框架。

而浏览器,是专门为人类操作设计的环境。从 DOM(页面文档结构)中提取操作路径、判断页面元素,这些事情推理模型已经变得相当擅长。

所以我们采用一种混合式策略,看哪种路径更可靠、更快、更便宜。假如 MCP 在某些任务上优于“浏览器 agent”,那我们就用 MCP。我们对工具没有执念,目标只有一个:效率、可靠性、成本最优。

Alex Heath:在 The Verge,我们很在意网页的呈现方式、排版、视觉体验等艺术性内容。但当 AI agent 大量涌入浏览器、开始主导 Web 操作后,我很想问:你认为网页本身的“设计感”是否会逐渐失去意义?

换句话说,Web 会不会变成一堆“agent 爬取数据的数据库”,而原本为用户打造的交互体验彻底消失?

Aravind Srinivas:我不这么认为。品牌仍然非常重要。

哪怕 AI 和人类都在“同时上网”,只要你有一个有影响力的品牌,人们依旧会主动关注你发布的内容——可能是你这个人,也可能是你所在的媒体,比如 The Verge,或是你们的某位作者。

就算在 The Verge 里面,我可能只对某些作者的文章感兴趣。品牌背后的“人”会越来越成为流量锚点。

而且现在很多访问量其实都不是来自传统搜索,而是来自社交媒体——比如你在 Instagram、X(推特)、LinkedIn 上发了新文章,人们是通过分享点击过来的。这和文章的视觉呈现、内容深度依旧息息相关。

倒是那些试图靠 SEO“刷排名”、靠关键词堆砌流量的新平台,我确实不看好。过去那套 SEO 技术手册,不再是流量增长的主路径了。

你得通过别的方式构建品牌。而已有品牌影响力的媒体,也需要用一套全新的方法去维持用户粘性,不能再靠“优化搜索引擎”这一招吃遍天下。

Alex Heath:Comet 的计算开销很大,而且现在仍是邀请制。我想你一定很希望能立刻向所有人开放,但如果真这么做,可能服务器就要爆了,或者 AWS 账单也炸了,对吧?

那你打算怎么扩大这个产品?不仅是从产品层面,让普通人容易理解和上手,也包括商业维度——毕竟你们是风投支持的公司,终归得盈利。像 Comet 这样一个甚至比聊天机器人还要“烧算力”的产品,你打算如何规模化?

Aravind Srinivas:我认为只要 agent 的成功率够高、稳定性够好,人们是愿意为“单次使用”付费的

比如我刚才提到的招聘任务:你要拉一份 Anthropic 员工名单,做 cold email 营销。这通常要花你几个小时,或者雇个猎头、外包给 sourcing consultant。

再举个例子: 你想在 Instagram 上投广告,但你需要调研竞争品牌的广告样式、找 100 个关键词的投放单价、做竞价对比和预算分配。这些事,如果你自己搞,至少得花几个小时,而且也可能没搞清楚。AI不但能帮你省时间,还可能帮你找到套利空间。

虽然现在还处于早期阶段,但这些“可验证的用户需求”已经逐渐浮现。

而一旦用户把大量脑力劳动批量外包给 AI,并且 agent 能可靠完成——那它就像是你自己的“自然语言描述的 AWS 集群”,可以并行完成所有任务。

只要我们能够落地这个路径,推理模型持续进步,我们最终可以做出一款类似“Cloud Code for Life”的产品。

Cloud Code 本身月费就能上千美元,但大家愿意买,因为它能帮你升职、让你更快完成 KPI,ROI是显而易见的

Alex Heath:你现在这么重押浏览器,是不是因为觉得聊天机器人这场仗已经被 ChatGPT 赢了?那 Perplexity 现在的主产品,是不是也会逐步被 Comet 替代?

Aravind Srinivas:我不这么看。首先,我同意“聊天产品这场仗”从结果看,确实已经是 ChatGPT 的天下——人们日常聊天几乎不会去用别的产品了。

但我们从一开始就没想做“聊天产品”,我们是要重构搜索。哪怕现在每个 chatbot 都内嵌搜索引擎,但还是有很多人更偏好我们这种“搜索为主、对话为辅”的方式。

Google、Grok、Meta 都在努力追赶 ChatGPT 的聊天体验——但我个人觉得,那已经是浪费时间。

反而我们认为:浏览器是一个比聊天更大的机会

它用户粘性更强,是唯一能承载 agent 的平台,是实现端到端工作流、个性化记忆、上下文管理的必经之路。

而且,它是一个极具挑战的产品:不仅涉及智能程度,还需要深度产品打磨、上下文工程、前端后端架构、安全、隐私……方方面面都要精细打磨。比聊天机器人难多了。

Alex Heath:那你怎么看 OpenAI 要做浏览器这事?是不是他们也认可你说的这套?

Aravind Srinivas:我不知道他们是不是要做,我也只是看到了一些“泄露图”。有意思的是,这些爆料是在我们 Comet 发布后两个小时出现的。

你刚才还说 Perplexity 可能要被 Comet 替代——我不这么看。因为你不能做出一款好浏览器,而没有自己的搜索引擎

很多人之所以夸 Comet 好用,是因为它不像传统浏览器,那是因为我们默认搜索引擎就是 Perplexity

我们做了很多判断意图的优化——比如你是在找导航链接、图片、信息,我们都能一站式给你搞定。你可以在一个搜索框里完成导航、搜索、调用 agent。

而这一切的基础,是我们这两年多来对搜索引擎的持续打磨。

就像没有 Google 就无法支撑 Chrome;你也不能没有 Perplexity 就造出 Comet。

Alex Heath:那 Comet 和 Perplexity 会分别有独立的移动端 App 吗?

Aravind Srinivas:会的,两个产品都会推出独立 App。

有些用户会把 Comet 当作主力浏览器来用,就像他们今天用 Chrome 或 Safari 一样——只不过这个浏览器自带 AI 助手,甚至支持语音交互。但也有人只是想直接访问一个网页、快速完成某项搜索,不需要太多智能功能,这时就会用 Perplexity 的独立 App。

所以我们也会在 Perplexity App 内集成一个“打包版 Comet 浏览器”,就像你在 iOS 上的 Google App 实际上也能打开网页。顺便说一句,不管是 Google App 还是 Chrome,它们在 iOS 上其实都是 WebKit 内核,Android 上则是 Chromium。

我们会遵循类似的路线。

Alex Heath:说到竞争对手,你怎么看 The Browser Company 的 Dia?它和 Comet 几乎同期发布,显然也在向同样的方向靠近。他们在 Arc 浏览器时代就引发了不少关注,现在也押注“agent 浏览器”这条赛道了。

你用过 Dia 吗?你怎么看它和 Comet 的差异?

Aravind Srinivas:我本人还没试用过 Dia,但看过一些用户反馈。我觉得他们在视觉体验和前端交互上确实有不少创意。

如果我是他们,我可能会直接在 Arc 浏览器里实验这些功能,而不是重新做一个新产品来扩张分发。但无论如何,我们会持续关注所有相关产品。

不过我们目前的核心关注仍是 Chrome,因为那才是真正的“大哥”。

我的策略是:哪怕我们只从 Chrome 用户里抢下 1% 设置成 Comet 默认浏览器,那对我们来说已经是巨大的胜利,同时也是对他们的一次重大打击——因为广告营收上的损失,在这个规模下是极其可观的。

Alex Heath:你们主要靠口碑增长吗?还是打算找一些渠道或平台分发合作?

Aravind Srinivas:我们初期仍会坚持靠口碑传播。这个策略在 Perplexity 本身就很有效,我们希望 Comet 也能复制这个轨迹。

而且我们现在已经有了 3000 到 4000 万 Perplexity 的基础用户。如果我们能让其中一部分人试用 Comet,并转化成设为默认浏览器的用户,那就已经是一场巨大胜利——不必依赖其他分发渠道。

当然,我们也会考虑把这种增长转化为更深层次的合作,比如 Google 跟很多厂商的那种 OEM 分发协议。

但我必须指出,这会非常难。我们以前也聊过这个话题: Google 确保每台 Android 设备默认浏览器都是 Chrome,你想换掉它?你得付出巨额代价。

微软也是一样,几乎所有 Windows 设备都预装 Edge,而且你也几乎改不了。这些 OEM 厂商和平台有多年期的深度绑定协议,提前两年就在规划出厂设备了——你几乎没办法切入。

这其实是他们的“护城河”所在:不是产品本身,而是他们精心编织的法律和渠道锁定。

所以我很高兴美国司法部(DOJ)终于开始调查这些事,我们也提交了自己的建议清单,希望能带来改变。

Alex Heath:如果 DOJ 强制拆分 Chrome,那确实会重置一切。

现在有很多人说 Apple 应该收购你们。Eddy Cue(Apple 高管)在 Google 垄断案的庭审上还公开表示他喜欢你们的产品,听说你们聊过合作的事。我知道你现在不能公布任何未官宣的事,但你怎么看 Apple?

Aravind Srinivas:首先,我很荣幸 Eddy Cue 会在庭上提到我们。他说他很喜欢我们的产品,而且他的圈子里也有人推荐过。我当然希望有机会和 Apple 合作,比如在 Safari、Siri、Apple Intelligence 等层面进行集成。

Apple 是一个人人都喜欢的品牌,某种意义上也是一种“身份象征”。很多人都希望成为 Apple 生态的一部分。

我觉得我们在设计理念上跟 Apple 很契合,追求极致体验。但与此同时,我的目标仍然是:让 Perplexity 尽可能做大,做强。

我们希望这个浏览器是平台无关的——能同时服务 Android 和 iOS 用户,也能在 Windows 和 macOS 上跑得很好。我们相信,就算不拥有操作系统,也能通过打造最好的搜索引擎和最好的浏览器,做出一家伟大的公司。就像 Google 曾经那样。

Alex Heath:我还听说 Zuckerberg 曾经想挖你去 Meta,加入他重启的 AI 项目。你当时是怎么考虑的?他怎么说服你?

Aravind Srinivas:Zuck 很棒,他真的在做很多令人兴奋的事。而且 Meta 本身就是一个非常有粘性的产品平台。我们也一直在学习他们是怎么在没有操作系统的前提下,构建起一家庞大的互联网公司的。

Alex Heath:你看到 Zuck 开出那些“九位数”级别的天价薪酬 package(有些甚至是几亿美元),惊讶吗?

Aravind Srinivas:有点吃惊,确实蛮大的数字。不过我知道这些 package 往往和股票挂钩,只有股价涨了才兑现,所以也不算“保底”那种。但确实非常高。

不过你看 xAI(Elon Musk 的 AI 公司),就没花那么多钱,也能训练出接近 OpenAI、Anthropic 的模型。所以我不觉得“砸钱”一定等于结果。

真正重要的是:你有没有一支协同顺畅的团队,有没有清晰的使命、清楚的里程碑。

Zuck 可能的想法是:“我给你人、给你算力、给你资源,但从现在起你必须执行得漂亮,否则你也明白会给我带来什么风险。”

Alex Heath:那你怎么看 Zuck 这波“天价挖人潮”对整个 AI 人才市场的影响?会不会像 NBA 转会市场一样,顶级选手身价暴涨?

Aravind Srinivas:确实像是 AI 界的“球星交易市场”了。一些明星研究员现在的谈判能力非常强。

不过我注意到,**Anthropic 的研究员几乎没被挖走。**说明人家团队真的很团结,对使命有认同感。大家在那儿工作很开心、遇到新挑战、每天都在成长,而且也有财务回报。

这才是一个团队能长期稳定发展的关键,不只是钱。

Alex Heath:你会特别看重盈利目标吗?比如为的是更独立地掌控公司命运。

Aravind Srinivas:当然。盈利是必须的,我们会在 IPO 前实现。我们预计 2028 或 2029 年上市,我是非常希望 IPO 的。

我不想永远做一家私营公司——虽然保持私有状态确实在并购和决策效率方面有优势,但我认为 IPO 带来的品牌效应和用户信任,也是巨大的。

而且,成为“第一个可公开投资的 Google 替代品”,本身就是个超级重要的市场信号。

不过我们也不打算太早 IPO,得等公司收入破 10 亿美元,同时有稳定盈利才合适。

但这不代表我们现在就要“缩手缩脚”。现在是该冒险、该尝试新东西的阶段。

Alex Heath:你们是 3 年前推出 Perplexity 的,差不多也是 ChatGPT 发布前后。现在看来,这 3 年里你们经历的一切都不可思议。如果让你展望未来 3 年——比如你刚说的 2028 年 IPO,那时的 Perplexity 会是什么样子?

Aravind Srinivas:我希望那时候的 Perplexity 能成为你想到“要完成任何任务”时,第一时间会打开的工具。

它会与你保持深度同步,理解你所有的上下文,甚至主动帮你思考、主动为你减负,让你的生活真正变得更轻松。

Alex Heath:那我们今天就聊到这儿。谢谢你,Aravind!

Aravind Srinivas:谢谢你,Alex。

猜你喜欢

“数智陇原”实践团与“东数西算”产业园会碰撞出怎样的火花?

“东数西算就是将东部的数据传输到西部来处理运算,算力就相当于农业时代的水利和工业时代的电力,它是我们现在数字经济时代的一个核心生产力…… 2025年12月,国家发展改革委等四部委批复同意甘肃启动建设全国一体…

“数智陇原”实践团与“东数西算”产业园会碰撞出怎样的火花?

巨型蛇梯棋盘惊现蓬皮杜:路易威登打造人生隐喻式时尚秀场(蛇梯棋玩法)

在2025年巴黎春夏时装周上,路易威登(Louis Vuitton)以一场别开生面的男装秀震撼亮相,展现了印度建筑师BijoyJain(Studio Mumbai)与品牌创意总监Pharrell Will…

巨型蛇梯棋盘惊现蓬皮杜:路易威登打造人生隐喻式时尚秀场(蛇梯棋玩法)

联华机电取得上料六轴机器人专利,有效提高六轴机器人主体的稳定性(联华机械有限公司)

金融界2025年7月19日消息,国家知识产权局信息显示,天津市联华机电有限公司取得一项名为“一种上料六轴机器人”的专利,授权公告号CN223115198U,申请日期为2024年09月。 专利摘要显示,本实用新…

联华机电取得上料六轴机器人专利,有效提高六轴机器人主体的稳定性(联华机械有限公司)

张艺凡无限成长可能,三大腿精舞者变演员,胡姬面具赋予郑平安尊严(张艺凡vlog)

张艺凡曾在采访中表示,很多人羡慕她的身高,却鲜有人能理解这一优势带来的困扰。 如今,张艺凡在《长安的荔枝》中饰演的胡姬,精准诠释了这个角色背后的沧桑与坚韧,她的演技既令人动容,又让人感同身受。张艺凡在一次采访…

张艺凡无限成长可能,三大腿精舞者变演员,胡姬面具赋予郑平安尊严(张艺凡vlog)

著名演员向梅:与丈夫携手64年,71岁脑梗发作,现年88岁近况如何?(著名演员向梅多么高)

随着家境的变化,父母开始觉得做演员并非稳定的职业,特别是在那个时代,演员整日曝光在镜头前并不被看作是个“靠谱”的选择。在这些作品中,向梅塑造了形形色色的角色,也从一个完全不懂表演的新人,成长为一位技艺精湛的演…

著名演员向梅:与丈夫携手64年,71岁脑梗发作,现年88岁近况如何?(著名演员向梅多么高)