当前,电商平台普遍采用“召回、粗排、精排”的级联式搜索架构。该架构虽然成熟稳定,但仍面临诸多痛点:商品描述混乱、相关性问题突出、级联结构存在瓶颈以及冷启动难题,导致搜索结果往往不尽如人意。
为了解决这些挑战,快手(01024)提出了业界首个工业级部署的电商搜索端到端生成式框架——OneSearch,目前,该系统已在快手多个电商搜索场景中成功部署,每日服务数百万用户,产生数千万页面浏览量。
打破传统架构 提出创新解决方案
OneSearch框架集三大创新于一身:关键词增强层次量化编码(KHQE)模块、多视角用户行为序列注入策略以及偏好感知奖励系统(PARS)。
在关键词增强层次量化编码(KHQE)模块中,采用RQ-OPQ编码方案,从纵向与横向两个维度建模商品特征,为每个商品生成具备丰富语义层次的“智能身份证🪪”,极大提升生成式检索的区分能力和准确性。
多视角用户行为序列注入策略则让OneSearch能有效捕捉用户的近期偏好与长期兴趣,基于用户的长短期行为序列构建具有区分性的用户标识。使系统实现更全面、深层的用户意图理解,显著提升个性化搜索准确性与用户体验。
偏好感知奖励系统(PARS)是结合多阶段监督微调与自适应奖励强化学习机制,捕捉细粒度用户偏好信号。该机制在提升排序性能的同时,保障生成多样性,有效避免“奖励破解”问题。
订单量、买家数等多项指标实现大幅提升
离线实验表明,OneSearch相比现有级联式系统各项指标均有显著提升。在线部署结果更为突出:订单量提升3.22%,买家数增长2.4%。这是在大规模工业场景下,这是生成式模型首次在大规模工业场景中完整替代传统搜索链路,具备重要落地意义。
在人工评估中,OneSearch不仅在CVR和CTR上表现优异,还在页面整体满意度、商品质量及query-item相关性方面均显著优于传统级联系统。此外,系统在线性能同样亮眼:机器计算效率(MFU)相对提升达8倍,线上推理成本(OPEX)降低75.40%,资源利用效率得到极大优化。
特别值得关注的是,OneSearch在冷启动场景下表现尤为突出,效果明显优于常规场景,表面生成式检索模型能够有效应对长尾用户和新上架商品的排序挑战。
OneSearch的成功部署,标志着生成式模型在大规模工业搜索场景中取代传统链路的重大突破,为电商搜索技术的未来发展指明了方向。相关团队多项技术突破已发表在RecSys、CIKM、KDD等国际顶级会议上,引起业界广泛关注。
后续,快手将持续探索在线实时编码方案,缩小预定义编码与流式训练之间的差异。同时,还将引入更强大的强化学习机制以更精准地匹配用户偏好,并结合图像、视频等多模态商品特征,进一步提升模型的推理效果与用户体验。
随着技术的不断迭代,未来的电商搜索将更加智能、精准和“懂你”,让用户真正实现“一步到位”的理想搜索体验。