2025年Perplexity Comet电商选购类任务测试报告

2025年Perplexity Comet电商选购类任务测试报告

今天分享的是:2025年Perplexity Comet电商选购类任务测试报告

报告共计:51页

四大AI工具电商购物能力实测:谁能成为你的"智能导购"?

随着人工智能技术的快速发展,AI工具在电商购物领域的应用愈发广泛。从帮你筛选商品、对比价格到直接加入购物车🛒,甚至完成支付,这些智能助手正试图简化我们的购物流程。近日,一份针对OpenAI Agent、Perp Comet、Manus、Genspark四大主流AI工具的电商购物能力测试报告引发关注,通过五大典型购物场景的实测,揭示了当前AI在消费领域的真实表现。

整体表现:速度与成功率的双重较量

测试从亚马逊商品复购、最快发货自行车查找、聚会杂物采购、指定预算风衣选购、特定条件冰箱挑选五个场景展开,综合评估四大AI工具的完成效率与成功率。

从平均耗时来看,Perp Comet以318秒的成绩领先,紧随其后的是Manus(408秒)和Genspark(521秒),OpenAI Agent则以1193秒的平均耗时差距明显。在成功率方面,Perp Comet和Genspark表现抢眼,五项任务全部成功;OpenAI Agent和Manus则各有一项任务失败,整体表现稍逊一筹。

这种差异在复杂任务中尤为明显。例如在"亚马逊商品复购"任务中,Perp Comet和Genspark能顺利访问历史订单(或在无历史记录时自主选购)并完成加购,而OpenAI Agent因跨域限制无法访问亚马逊页面,Manus则直接表示无法进入平台,最终均以失败告终。

场景实测:各有侧重的"购物技能"

在"查找最快发货自行车"任务中,Perp Comet展现了高效的信息整合能力,仅用20秒就从各品牌官网提取出发货时间、物流方式等关键信息,准确排序出送达时间,其数据来源的权威性和响应速度令人印象深刻。相比之下,OpenAI Agent虽然最终给出结果,但耗时长达720秒,且依赖网络搜索的信息存在杂乱、准确性难保证的问题。

聚会杂物采购场景更能体现AI的"主动性"。Perp Comet仅用4分钟就完成9件物品的筛选与加购,从气球拱门套装、串灯到一次性桌布,覆盖了聚会所需的各类装饰;Genspark则需要用户额外提示"打开网站并加入购物车🛒"才能行动,但最终选购的物品种类最多,达9种;OpenAI Agent能自主完成5件物品的加购,流程顺畅;而Manus仅能提供购物清单和购买方案,无法进行实际操作,更像一个"参谋"而非"执行者"。

指定预算选购风衣的任务,考验AI的细节筛选能力。要求"500美元💵以内、带腰带、双排扣、评分4星以上"的米色风衣,Genspark仅用300秒就完成筛选,不仅给出5款符合条件的商品,还详细标注了材质、可拆卸 hood 等细节,并整理成对比表格;Perp Comet则直接生成包含商品链接的谷歌文档,方便用户直接访问;Manus的筛选过程更像"人类逛街",会在多个平台间对比款式细节,最终给出的推荐附带用户评价分析,实用性较强。

最复杂的"特定条件冰箱选购"任务中,Genspark成为唯一完全成功者。它不仅从知乎、B站等平台收集评测信息,参考用户真实评价,还能按要求打开电商网站,将指定型号冰箱加入购物车🛒并模拟填写收货地址。Perp Comet、OpenAI Agent和Manus虽能提供选购建议,但均未完成实际加购操作,在"从信息到行动"的转化上存在短板。

能力梯度:从"看懂需求"到"完成支付"的差距

测试设置了从"意图解析"到"支付完成"的十级能力梯度,全方位评估AI在购物全流程中的表现。

前六级能力(理解需求、搜索执行、结果获取、智能筛选、精准匹配、方案整合)中,四大AI工具表现较为均衡,都能准确识别用户的购物目标,比如在选购风衣时,都能抓住"500美元💵以内""双排扣"等核心条件,说明在基础的语言理解和信息筛选层面,主流AI工具已较为成熟。

差异主要体现在高阶能力上。在"购物车🛒操作"和"订单预处理"环节,Manus明显落后,无法完成商品添加、地址填写等操作;OpenAI Agent、Perp Comet和Genspark则能顺畅完成这些步骤。最关键的"支付完成"环节,目前仅有Perp Comet被认为"大概率能完成",其他工具均止步于支付前,这也反映出AI在涉及资金交易的环节仍需突破技术与信任的双重壁垒。

用户体验:从"工具"到"助手"的距离

实际使用感受中,四大AI工具的定位差异明显。Perp Comet被测试者评价为"能力最强",它不仅能自主判断下一步操作,还能在无历史订单时主动提出替代方案,流程衔接自然,给人"无需过多干预"的体验。

Genspark则需要用户更多"指挥",比如在加购商品时,必须明确提示"打开XX网站并添加购物车🛒"才能行动,若能简化手动操作步骤,用户体验会进一步提升。OpenAI Agent虽然具备完整的加购和地址填写能力,但耗时过长成为短板,在"时间就是效率"的购物场景中略显吃力。

Manus的定位更偏向"方案提供者",在所有任务中均能给出详细的购物清单、平台对比和预算方案,但无法深入到实际操作环节,对于希望"一键搞定"的用户来说,实用性打了折扣。

结语:AI购物的"现在与未来"

从测试结果来看,当前AI工具已能胜任大部分基础购物辅助工作,在信息筛选、方案整合等方面展现出超越人工的效率。但在复杂操作衔接、支付环节突破等方面,仍有提升空间。

对于普通消费者而言,Perp Comet适合追求高效与自主操作的用户,Genspark适合愿意稍作引导的使用者,OpenAI Agent可作为备选方案,而Manus更适合需要详细参考资料的规划型购物者。随着技术的迭代,或许不久的将来,我们真能实现"一句话搞定所有购物"的轻松体验,让AI成为每个人身边贴心的"智能导购"。

以下为报告节选内容

报告共计: 51页

中小未来圈,你需要的资料,我这里都有!

特别声明:[2025年Perplexity Comet电商选购类任务测试报告] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

正品铂浪高水槽净水龙头525200526588怎么选?三合一抽拉真香吗?(铂浪高水槽怎么验真伪)

想给厨房升级净水体验?这款铂浪高525200526588 FONTAS-S II三合一抽拉龙头,集净水、抽拉、冷热出水于一体,是当下厨房升级的热门选择。本文带你全面解析它“为什么火”——从核心原理、净水技术、使用场景到选购避坑指南,帮你搞

正品铂浪高水槽净水龙头525200526588怎么选?三合一抽拉真香吗?(铂浪高水槽怎么验真伪)

美貌不输李嘉欣,却自甘堕落,21岁一脱未大红,又做黄任中情人(美貌不值钱)

然而就在所有人都以为郑艳丽即将一飞冲天之时,命运却悄然改变了她的轨迹。借种的成功让郑艳丽在风月片市场小有名气,但同时也将她牢牢地钉在了&34风月片演员🎭️&34的耻辱柱上。 就在郑艳丽事业陷入低谷之时,一个名叫…

美貌不输<strong>李嘉欣</strong>,却自甘堕落,21岁一脱未大红,又做黄任中情人(美貌不值钱)

刘圣书谭宁世锦赛女双冠军 国羽新星首战夺魁(刘圣书谭宁世锦赛丢一局)

在8月31日结束的2025年世界羽毛球锦标赛女双决赛中,中国组合刘圣书和谭宁击败了马来西亚组合陈康乐和蒂娜,赢得了冠军。这是刘圣书与谭宁首次搭档参加世锦赛,她们的成功也使她们成为了国羽历史上第14对夺得世锦赛女双冠军的组合

刘圣书谭宁世锦赛女双冠军 国羽新星首战夺魁(刘圣书谭宁世锦赛丢一局)

孙莉也没想到,从小富养的女儿黄多多,早就开始给黄磊“争光”了(孙莉是谁)

有人认为她凭借多年积累完全值得在大银幕上一展才华,也有人担心“起点过高”,甚至质疑其资源来源与父亲黄磊的人脉关系。在父母的艺术熏陶和自身努力下,多多早已不只是“星二代”,她用实力一步步为自己正名。无论外界如何…

孙莉也没想到,从小富养的女儿黄多多,早就开始给<strong>黄磊</strong>“争光”了(孙莉是谁)

牛低氧诱导因子1α (HIF-1α)酶联免疫试剂盒(牛低氧诱导因子是什么)

操作要点:室温平衡;样本必要时稀释;37℃孵育(标准品样本→酶结合物);洗板 5 次;TMB 避光显色约 10 分钟;硫酸终止后 15分钟内 450 nm 读数;每次做标准曲线并设复孔;试剂盒 2–8…

牛低氧诱导因子1α (HIF-1α)酶联免疫试剂盒(牛低氧诱导因子是什么)