元戎启行CEO周光:幼年期的VLA智驾,强于巅峰期的端到端(元戎启行 ipo)

记者 濮振宇

8月26日,元戎启行发布全新一代辅助驾驶平台——DeepRoute IO 2.0,该平台搭载自研的VLA(Vision-Language-Action)模型,融合视觉感知、语义理解与动作决策三大核心能力。

如今,从理想、小鹏等整车企业,到元戎启行等智驾供应商,越来越多企业开始布局VLA模型。VLA与现有的端到端架构的区别在哪里?它能给企业和用户带来什么?

让AI学会“害怕”

区别于端到端架构的模仿学习,VLA大模型的优势是通过强化学习不断进化,让机器尝试理解“为什么这样做”。

元戎启行对VLA模型的投入,源于元戎启行CEO周光对技术趋势的判断。

2023年底,GPT-4发布后展现出的多模态理解和逻辑推理能力,让周光看到了一条通往更高阶智能驾驶的路径,他认为“强AI时代”可能提前到来。

“它打破了我们对AI发展进程的认知——原来从弱AI到强AI可能只需要几年,而非过去认为的50年……如果我们不转型为大模型驱动的公司,未来很可能面临降维打击。”周光在接受经济观察报等媒体采访时说。

真正促使元戎启行坚定转向VLA的,是一个发生在2024年6月的具体场景。在深圳福田保税区入口,突然立起一块“车辆左转不受灯控”的指示牌。当时元戎启行的测试车在红灯前停下,却因无法理解牌面文字而被后车鸣笛催促。

“这类场景无法通过传统端到端学习解决,必须依靠对文字的理解。即便通过地图打标签也需要至少一周,而大模型则可以实时处理。”周光说。这件事让他意识到,基于CNN的端到端系统已经触及天花板,必须构建具备语义理解能力的新架构。

除了场景难题,量产规模也是促使端到端转型的一个重要的刺激因素。官方数据显示,元戎启行已获得超过10款车型的定点合作,并实现近10万辆具备城市领航辅助系统的量产车型交付,涵盖SUV、MPV、越野车等多个车型。

规模扩大带来了新挑战。周光坦言,当交付量达到10万辆级别后,任何问题都会被放大。“早期千台、万台的阶段发生问题的概率较低,但规模扩大后,我们面临更严格的市场监督。”他说。

市场上出现了更多严苛的评测,消费者对辅助驾驶安全的要求越来越高。“虽然目前我们的评测表现仍处于头部,但我认为辅助驾驶还可以做得更好,仍有优化空间。”周光说。这种焦虑感刺激元戎启行加速技术迭代,第一代端到端系统正逐渐触及性能瓶颈,VLA被视为打破瓶颈的关键。

此前,理想汽车自动驾驶研发高级副总裁郎咸朋预测,未来VLA能将事故里程(MPA)提升至人类驾驶的10倍,做到600万公里才出一次事故(当前理想辅助驾驶为350—400万公里/次事故,人类驾驶约60万公里/次事故)。

对于当前的主流技术路线,周光持批评态度。他以基于BEV架构的端到端系统为例,指出其存在先天局限。就像玩坦克大战,墙后的物体无法被看到,系统就会认为“不存在”。

在周光看来,真正的智能驾驶必须突破视觉遮蔽的限制,实现对空间关系的理解和推理。“这并不是说我们要‘穿墙透物’,而是必须提升对高级语义和空间关系的理解能力。”他说。

基于这一判断,元戎启行将“防御性驾驶”作为VLA训练的核心目标。周光表示:“在DeepRoute IO 2.0中,我们让AI学会了‘害怕’。害怕是生物进化出的保护机制,AI也应当具备对风险的敬畏之心。”基于这种判断,元戎启行的VLA系统在盲区等场景中会主动进行“预防性预判”,像人类一样采取谨慎策略。

对于特斯拉CEO埃隆·马斯克提出的“激光雷达会让自动驾驶越来越不安全”的观点,周光回应称,激光雷达目前对通用障碍物识别仍有重要作用。

不过,周光强调,随着大模型技术的发展,视觉会在感知中扮演越来越重要的角色。元戎启行的策略是兼顾两条路线——VLA平台同时支持激光雷达与纯视觉版本,以适应不同客户和场景的需求。

不只用于汽车

周光对VLA的期待远不止于智能驾驶领域。在元戎启行的规划中,VLA的能力可复用于『机器人』️、无人驾驶等多种移动场景。

周光表示,VLA模型本身是通用架构,不再为特定场景定制。这一理念与元戎启行2025年3月发布的道路通用人工智能平台"AI Spark"一脉相承,旨在让智能体在道路上自主行驶,并具备与物理世界深度交互的能力。

"正如我们年初发布的Road AGI策略所说,未来这一技术可泛化至多种移动场景——包括小区、电梯、办公室等室内外环境。"周光说。在他看来,现在的很多『机器人』️还依赖遥控或巡线技术,而VLA架构将支撑它们实现真正自主、通用的移动能力,完成从单点功能到通用智能体的系统演进。

目前,行业内逐渐兴起VLA研发热潮,小鹏汽车、理想汽车都在进行相关布局。

周光表示,元戎启行在防御性驾驶等方面布局较早,半年前就已强调这一方向。小鹏基于千问模型确实做出了实打实的成果,而元戎启行的优势在于对技术路线的早期判断和快速工程化能力。

如何向用户推广VLA这样具有技术门槛的产品?周光表示,VLA模型最直接的价值是让辅助驾驶更自然、更人性化,能应对更多复杂场景,而这需要通过与用户的持续互动来不断优化。元戎启行更倾向于通过实际体验让用户感受VLA的价值,而非进行技术概念的灌输。

在发布会尾声,周光为当前的技术阶段给出了评价——满分10分中仅打"6分",刚刚及格。他解释称,VLA模型仍处于早期,相当于幼年期,目前的VLA仍无法实现全无人驾驶,缺乏完全的推理能力,仅靠高精地图无法根本解决泛化问题。

不过,"幼年期"也意味着巨大的成长空间。周光认为,VLA的上限远高于端到端方案,"其下限已经超过端到端方案的上限"。在他看来,新一代架构需要新一代『芯片』支持,这不是CNN时代可比的。随着下一代『芯片』达到更高算力,VLA模型的潜力将得到进一步释放。

特别声明:[元戎启行CEO周光:幼年期的VLA智驾,强于巅峰期的端到端(元戎启行 ipo)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

钻石巨头戴比尔斯再度降价,钻石市场会跌到何处去?(钻石骗局 戴比尔斯)

“钻石恒久远,一颗永流传”这句钻石的广告语,相信每个人都不会陌生,作为曾经爱情的象征,钻石始终都被赋予高价值,然而就在最近钻石巨头戴比尔斯再度降价的消息传来,让人不禁想问持续降价下,钻石市场到底会跌到何处去?…

钻石巨头戴比尔斯再度降价,钻石市场会跌到何处去?(钻石骗局 戴比尔斯)

通力科技取得相机📷️自动调试装置专利,实现相机📷️白平衡调试单元的信号传输(通力科技取得相应的成果)

国家知识产权局信息显示,通力科技股份有限公司取得一项名为“相机📷️的自动调试装置及设备”的专利,授权公告号CN223829389U,申请日期为2025年1月。企业注册资本36719.0182万人民币。通过天眼查大…

通力科技取得相机📷️自动调试装置专利,实现相机📷️白平衡调试单元的信号传输(通力科技取得相应的成果)

被显示和白人搂抱、和富二代在一起,看完直播 才明白『宋祖儿』为啥被评论(和白人谈恋爱什么感觉)

更让网友心生不满的是,『宋祖儿』曾因为税务问题遭遇曝光,曾被揭发偷税漏税,最终补交了五百多万的税款和罚款。她靠着朴实接地气的乡土人设吸引了大量观众,但直播中她却坐在三亚的海景豪宅里哭穷,还抱怨儿子在北京挣几十万过…

被显示和白人搂抱、和富二代在一起,看完直播 才明白『宋祖儿』为啥被评论(和白人谈恋爱什么感觉)

贾冰王迅《风过留痕》空降,没想到真敢拍,事实证明:它的尺度真不小(贾冰经典)

风过留痕》是一部脚踏实地讲故事的悬疑剧,尽管它的剧情设定并不算多么新颖,依旧是通过一个个案件吸引观众,但正因为导演抓住了这一精髓,剧情节奏、情节安排和演员选择上都做得十分用心,所以整部剧看上去格外有质…

贾冰王迅《<strong>风过留痕</strong>》空降,没想到真敢拍,事实证明:它的尺度真不小(贾冰经典)

老人40万现金被烧毁 银行帮忙兑换 挽回大部分损失(老人索赔40万)

65岁的贺先生专门制作了一面锦旗,送到中国工商银行自贡贡井支行相关负责人手里,对银行工作人员认真且耐心地为其清点并兑换“火烧币”的工作表示感谢。去年12月底,贺先生的父母家中突发火灾,存放在家里的近40万元现金被不同程度烧毁

老人40万现金被烧毁 银行帮忙兑换 挽回大部分损失(老人索赔40万)