具体而言,R-UniAD的实施分为三个阶段:首先,利用冷启动数据,通过模仿学习在云端训练出一个端到端自动驾驶大模型;接着,基于强化学习,让云端的大模型与世界模型进行协同交互,持续优化模型的性能;最后,通过高…