2025年8月12日,郎瀚威及团队发布了Perplexity Comet电商购物能力测试报告,对OpenAI Agent、Perp Comet、Manus、Genspark四款AI工具的电商购物能力展开测试。
测试涵盖亚马逊商品购买及复购等5项任务,结果显示,Perp Comet和Genspark在5项任务中全部成功,OpenAI Agent和Manus则为4胜1负。在平均耗时上,Perp Comet以318秒居首,OpenAI Agent耗时最长,达1193秒。
电商购物十级能力梯度表评估显示,四款工具在1-7级能力节点表现一致,但8-10级差异明显。Perp Comet在10级支付环节大概率能完成,8-9级表现良好;Genspark和OpenAI Agent在8-9级表现不错,10级不行;Manus在8-10级均无法完成。
测试感受方面,团队成员认为Perp Comet能力最优,可完成支付流程;Genspark需手动调用工具,操作较繁琐;OpenAI Agent耗时久,部分场景访问受限;Manus仅能提供方案,无法深入操作。猫猫头则指出,电商购物场景虽非刚需,却是展示AI个性化理解等能力的绝佳舞台,能直观反馈AI能力。
此外,报告还分析了四款工具的流量及更新情况。Manus和Genspark流量有周末规律,推测有老用户留存;Perplexity Comet流量归入主站,参考性受限。各工具在5-7月均有功能更新,多集中于PPT、浏览器等功能强化。
总体而言,Perp Comet在电商购物能力上表现突出,Genspark和OpenAI Agent各有优劣,Manus相对较弱。
免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权©️归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除,如对报告内容存疑,请与撰写、发布机构联系