具身智能奇点时刻来临?业内专家:技术尚未收敛,后端场景有先发优势(奇点人工智能)

具身智能奇点时刻来临?业内专家:技术尚未收敛,后端场景有先发优势(奇点人工智能)

以“创业投资开启AI技术与应用共振周期”为主题的启明创投·创业与投资论坛近日在沪举行。在“具身智能的奇点时刻”专题对话环节,多名业内专家一致认为,具身智能已站在奇点到来的早期窗口。当前,具身智能技术虽未完全收敛,但已处于快速发展阶段。

启明创投主管合伙人周志峰表示,具身智能『机器人』️将率先在拣选、搬运、组装等场景实现规模化部署,积累大量『机器人』️第一视角数据与带触觉的操作数据,构建“模型—本体—场景数据”的闭环飞轮。这一飞轮将驱动模型能力迭代,最终推动通用『机器人』️迈向大规模落地。

站在具身智能奇点的“前夜”,原力灵机联合创始人兼首席执行官、旷视科技联合创始人唐文斌表示,投身具身智能行业最大的信心,来自于看到大模型领域链式推理(CoT)与智能体(Agent)能力的巨大潜力。唐文斌认为,『机器人』️从专用走向通用有两个必要条件,一个是对物理世界的精确感知能力,一个是对复杂任务的规划和推理能力。

具身智能来到发展的关键阶段

从进厂拧螺丝,到便利店递可乐,具身智能作为人工智能与『机器人』️技术融合的前沿领域,目前已来到技术突破与产业培育的关键阶段。

“具身智能技术过去两年的发展速度,已超越此前多年积累,进入‘越跑越快’阶段。”它石智航创始人兼首席执行官陈亦伦表示,一方面,业内对端到端技术的信息倍增,操作领域实验室样机能力显著提升;另一方面,多模态大模型发展潜力十足,视觉、语言等模态的进步尚未触顶,数据驱动能力持续增强。从硬件成熟度上来看,高自由度终端(如灵巧手)和接近量产的形态加速落地。

唐文斌表示,具身智能的发展动力主要来自大模型在链式推理(CoT)与智能体(Agent)上的能力达到一定的临界值。

“通用『机器人』️的出现,需同时满足两项必要条件:其一,对物理世界的高精度多模态感知。这也是我们过去创业十多年以来一直在做的事情,如今无论是小模型还是大模型,我们的多模感知能力已经做到了行业领先水平,并且还在不断提升。”唐文斌说,“其二,复杂的规划与推理能力,我们希望『机器人』️能够像人一样实现敏捷的决策、结合多模态的感知实现对复杂问题的推理。两者结合方可推动『机器人』️迈向通用化,而当前Agent与CoT的进展,正使这一技术朝着可行的方向发展”。

技术尚未收敛 增长空间可观

尽管发展速度极快、宏观方向趋同,但具身智能技术尚未收敛。业内普遍认为,下一阶段需通过量产落地验证技术路线,加速标准制定与生态协作,推动分化领域逐步收敛。这一发展现状也为创新企业提供了定义技术范式的战略窗口期。

唐文斌认为,当前具身智能的技术路线尚未收敛,算法框架、数据来源、硬件形态与稳定性以及场景落地的先后顺序仍处于开放探索阶段。

“虽然业内正逐步形成‘端到端、纯数据驱动、采用类VLA(视觉—语言—动作)框架’的共识,并普遍认同多模态信息(视觉、触觉、力觉、深度等)需统一纳入大模型,但终极模型架构尚无定论。”唐文斌提到,现有VLA多为单帧模型,缺乏原生记忆机制,难以完成需要状态累积的任务(如连续添加调料)。此外,“大小脑模型”将高频执行与低频决策人为拆分,虽为当下工程实践,但并非终极形态;未来仍需探索单一模型如何以动态、柔性的频率进行实时思考与决策。

“整体上看,技术框架仍面临大量未解问题,而开放的不确定性正是推动行业持续创新的关键动力。”唐文斌说。

据陈亦伦介绍,在具身智能领域,业界已在宏观层面形成高度共识,例如,数据被视为核心驱动力,模型最终部署形态大概率采用端到端架构等。不过,在具体实践中,各个团队的路径差异明显。“宏观共识、微观多元”成为行业现状。

例如,数据获取方面,有人主张大规模部署真机采集,有人倾向高比例仿真生成;算法层面,即便认同VLA的任务定义,网络架构仍存分歧——是否采用单一大网络、是否加入隐变量层、强化学习的选择及世界模型必要性等问题仍在探索。硬件层面同样多元,通用『机器人』️形态分为双足与轮式两大类,双足方案又存在直驱关节与复杂传动机构等不同设计。

后端场景有先发优势

在实验室场景下,『机器人』️已具备“十八般武艺”,复刻了人类诸多技术和劳动。然而,在商业化应用中,『机器人』️实际落地或遵循严谨的先后顺序。

唐文斌认为,『机器人』️的规模化应用大概率将从工业、物流等领域的后端场景起步。这类场景因规模大、劳动力密集,能产生更大价值。之后,具身智能逐步向商用场景拓展,最终走向民用。

“『机器人』️能否落地的关键在于两点:一是真正解决问题(能用、好用),二是经济模型成立。”唐文斌说。

从技术与市场的结合角度,唐文斌还提出了三个关键标准:其一,坚持技术发展的正向梯度,即不过早将技术形态固化于特定垂直场景,避免牺牲泛化性,而是沿着技术演进的正确路径推进,保持模型在通用能力上的迭代空间。其二,注重技术可达性,选择容错率较高、对操作时间容忍度更强的场景,逐步从90%向95%、100%优化。其三,场景需具备规模与强需求。

陈亦伦则遵循高价值、有规模、有难度的“黄金三角”逻辑筛选『机器人』️应用场景。他表示,公司会选择用户非常在意的真实需求、存在较大市场空间且上一代『机器人』️技术难以解决的问题,最终实现通用『机器人』️的AGI终极目标。

7月下旬,上海发放了新一批智能网联汽车示范运营牌照。8月以来,全无人驾驶的出租车在上海市区开展日常运营。在技术底座上,无人驾驶和『机器人』️共享“感知—决策—执行”技术栈与产业链资源,有望形成“车—机共生”生态。未来,两大领域将从协同研发走向规模化发展。

陈亦伦表示,具身智能和自动驾驶在任务场景和底层技术上同宗同源,模型技术可以复用,工程能力可以迁移,自动驾驶行业的经验与认知也能帮助具身智能领域的探索与落地。

责编:岳亚楠

校对:陶谦

特别声明:[具身智能奇点时刻来临?业内专家:技术尚未收敛,后端场景有先发优势(奇点人工智能)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

网警侦破假借高薪招聘实施侵公案 非法获取出售公民信息(假网警什么罪)

近日,山西太原迎泽网安部门破获一起利用某网络招聘平台非法获取、出售公民个人信息的案件,犯罪嫌疑人吴某被依法刑拘。吴某自2024年8月起,利用其经营的某网络账号与信息买家勾结,长期发布虚假招聘信息

网警侦破假借高薪招聘实施侵公案 非法获取出售公民信息(假网警什么罪)

金价巨震 投资者该咋办 理性决策避风险(金价巨震 投资多少钱)

自2025年以来,国际金价在每盎司2300-2500美元💵区间内剧烈波动,单周最大波动幅度曾超过80美元💵。不少投资者面临追涨怕套、观望怕踏空的困境。判断是否参与黄金投资时,需穿透波动表象,结合自身需求理性决策

金价巨震 投资者该咋办 理性决策避风险(金价巨震 投资多少钱)

白内障飞蚊症怎么治(白内障引起飞蚊症怎么恢复)

白内障和飞蚊症可以通过药物治疗、激光治疗、手术治疗等方式改善。白内障通常与年龄增长、代谢异常等因素有关,表现为视力模糊、眩光敏感;飞蚊症多由玻璃体混浊引起,常见症状为眼前黑影飘动

白内障飞蚊症怎么治(白内障引起飞蚊症怎么恢复)

特朗普为何威胁对尼日利亚动武 保护基督徒为名(特朗普为何威胁将对伊朗实施轰炸)

『美国总统特朗普』于11月1日在其自创『社交平台』Truth Social上威胁对尼日利亚采取军事行动,称该国政府“允许伊斯兰恐怖分子杀害基督徒”

特朗普为何威胁对尼日利亚动武 保护基督徒为名(特朗普为何威胁将对伊朗实施轰炸)

荣耀Magic8Pro,国补后5129元,入手那是物超所值的!(荣耀magic8pro拍照怎么样)

荣耀Magic8Pro后置5000万像素主摄(11.3英寸大底)+5000万像素超广角+2亿像素潜望长焦三摄系统,支持3.7倍光学变焦与100倍数码变焦。 荣耀Magic8Pro采用6.71英寸2K四等深…

荣耀Magic8Pro,国补后5129元,入手那是物超所值的!(荣耀magic8pro拍照怎么样)