在AI原生浪潮推动下,阿里巴巴集团旗下高德地图与通义实验室宣布达成深度合作,并在近日发布的高德地图2025版本中落地多项共建成果。
双方围绕语音交互、大模型能力以及Agent等核心方向展开全面协同,共同推动高德地图从“连接世界”迈向“理解世界”的全新阶段。
全链路语音共建:更精准、更自然的交互体验
作为全球首个AI原生地图应用,高德地图2025的核心亮点之一,是推出业内首个专精出行生活的智能体“小高老师”,它可基于音频、文本输入等多模态方式,与用户直观交互。
在语音能力上,高德与通义实验室语音团队联合打造了覆盖唤醒、识别、理解、播报等环节的全链路能力,助力“小高老师”实现了行业领先的识别精度和交互流畅度。
双方构建的新一代语音语义感知系统,由高德导航专用ASR(语音识别)模型、通用领域大模型ASR、高德大模型综合理解能力等模型组成,全面覆盖导航、本地生活、日常闲聊三大场景。
此外,全双工语音技术的应用,让用户体验“小高老师”时可随时打断并发起新指令;抗回声处理则确保用户在复杂声学场景下依然能保持清晰、顺畅的交互体验。
大模型底座加持:通义Qwen赋能空间理解
在用户使用过程中,“小高老师”能高效调度高德内部近百种工具,将内外部数据资源整合分析,生成最佳回答反馈和地图交互动作。
支撑这一能力的,是高德和通义共建的大模型簇——该模型簇由多模态空间感知、行为认知、时空意图理解、总结输出交互和反馈观测评估等多个专业模型构成。
通义大模型具备全球领先的预训练规模与语义理解能力:Qwen2.5已在18万亿token上完成预训练,而Qwen3的数据量几乎翻倍,达到约36万亿token。
凭借强大的底座能力,通义大模型已成为全球主流的基座模型之一。综合Hugging Face、魔搭等社区数据,Qwen系列大模型的下载量已达4亿次,同时衍生模型数量超过14万个,位居全球第一。
基于通义Qwen模型的底座能力,高德通过SFT(指令微调)训练,显著提升了其在出行生活场景中的语义理解、上下文感知与响应能力。
智能Agent登场:出行决策化繁为简
在Agent领域,基于高德自研的DeepResearch框架,通义实验室和高德联合开发了地图领域的复杂POI推理Agent,可通过理解多重约束条件、有效使用地图和搜索工具以及整合实时联网信息,为用户提供精准的POI推荐与导航服务。
该DeepResearch框架融合了强大的规划(Planning)、反思(Reflection)和工具调用(Tool Calling)机制,具备对高德地图全栈工具的深度理解和使用能力,能够智能地拆解复杂任务、评估执行路径并高效协调各类工具。
基于此框架开发的推理Agent具备三大能力:
首先,基于双方共建的高德专属推理能力模型,该Agent具备了地图领域领先的多维POI推理能力,可实现复杂时空需求的理解以及复杂POI的解析及处理,支持对事件、地理、参与者、时间、交通、POI属性等多重约束的综合判断;
其次,该Agent为高德预置了专属地图API、实时天气查询、交通状况监测、POI数据查询API等工具,并能基于POI理解自主调度相关工具。同时,它还能轻松集成新的工具和数据源,以适应不断变化的场景需求,无论是新增的POI类型、交通方式还是实时数据,都能快速适配并提供相应服务。
最后,该Agent可实现复杂场景下的POI任务处理,例如多POI路线规划、实时约束下的POI推荐、定制化POI推荐以及长时间旅行规划建议等。
“模型+场景”深度融合:AI能力落地的行业范式
此次合作,不仅是高德与通义实验室技术能力的叠加,更是生态协同共建的深度实践。通义大模型的泛化能力与高德在空间场景上的深度积累,在AI原生地图中实现了前所未有的深度融合。
一方面,高德以通义大模型为AI底座,构建了具备理解真实世界能力的空间智能,这不仅赋能高德地图APP迭代升级,未来还能驱动智能汽车、智能眼镜、具身智能、低空飞行等领域的变革。
另一方面,通义实验室则通过高德地图这一海量用户场景,推动大模型能力的真实落地与验证,加速其在C端产品中的规模化应用。
可以预见,高德与通义实验室的合作将成为“模型+场景”跨域融合的行业范式,为AI能力在更多真实世界场景中的落地提供可复制的实践经验。