文丨丁灵波
当各类投资机构豪掷百亿美金砸向具身智能赛道,当马斯克喊出人形『机器人』️会成为“世界上最大的品类,需求将达到数百亿台”,当『明星』️企业FigureAI『机器人』️还没商业化估值就达到惊人的390亿美元💵。
著名『机器人』️专家罗德尼・布鲁克斯(Rodney Brooks)向那些给人形『机器人』️初创公司投入数十亿美元💵的投资者们发出警示:你们是在浪费钱。
布鲁克斯曾联合创立iRobot、Rethink Robotics等知名『机器人』️公司,并在麻省理工学院(MIT)任职数十年,从1992年就开始构建人形『机器人』️。他对当前特斯拉『机器人』️Optimus以及备受关注的人形『机器人』️公司Figure这类企业尤为怀疑——这些公司试图通过向『机器人』️展示人类执行任务的视频,来教会『机器人』️具备灵巧度。
在最新发表的一篇论述长文中,他将这种方法称为“纯粹的空想”。
通用人形『机器人』️的“乌托邦”翻看今年投融资榜单,各类具身智能项目的热度简直“烫手”。
相关的创投报告统计显示,2024年具身智能全年融资182笔,总额达140.5亿元,其中人形『机器人』️赛道逆势爆发,融资规模从2025年的15.8亿飙升至72.3亿,4年翻了4.6倍。在2025年上半年,中国具身智能产业链融资事件超144次,融资金额195亿元,平均单笔融资规模1.35亿元,融资频次与规模均超越2024年全年水平。
最典型的是美国『明星』️项目Figure——C轮融资后估值冲到390亿美元💵,按其规划的10万台量产目标算,单台2万美元💵售价对应市销率高达20倍,比当下最火的AI『芯片』公司还要“虚高”。
撑起这场狂欢的,是“通用人形『机器人』️”的乌托邦。马斯克直言Optimus量产提前至2026年,五年内要造百万台,未来能创造30万亿美元💵的收入;Figure CEO宣称要创造具有通用界面的人形『机器人』️覆盖数百万种任务,功能齐全的机电人形『机器人』️会执行各种人类的操作,最终融入劳动力大军。
但布鲁克斯给火热的赛道热潮泼了一盆冷水:“资本为‘人形’概念疯魔时,早忘了『机器人』️的初心是解决问题,不是当人类的‘模仿秀演员’。”
这两家业内代表公司以及其他类似公司的总体规划是,人形『机器人』️将与人类“插件兼容”,能够以更低的价格完成人类需要的体力劳动,而且效果同样出色。许多乐观的人预测它最快会在两年内实现,而保守点的预测者认为它将在五年内产生重大的经济影响。
在布鲁克斯看来,相信这种情况会在十年内随时发生纯属幻想。
这场“通用幻觉”在现实中进展并不顺利。特斯拉虽宣称Optimus第三代搭载22自由度灵巧手,但今年5月实际产量仅千台,离5000台目标差了一大截——关节电机过热、灵巧手拎不动2公斤重物,直接让生产线停摆。
布鲁克斯犀利点评道:“人类用几百万年进化出的灵巧肢体,哪是堆几个自由度就能复刻的?被吹成‘能大规模替代工人’,这不是逻辑谬误,是商业忽悠。”
正确的"数据"和"学习"仍欠缺现在,我们可能会经常看到类似人类的『机器人』️手执行某项特定任务的精美视频,但它们根本无法概括超出该任务的范围。
直到今天,让『机器人』️用手臂和手来操纵各种物体,对于每一位『机器人』️研究人员和『工程师』来说都是一个难题。
布鲁克斯表示,过去的几十年里,人们制作了许许多多仿照人类手掌、带有关节、传感器的假手,但实现灵活性的方法大多局限于数学和几何层面,根本无法达到人类手掌的灵活性。
人形『机器人』️公司和学术研究人员选择的方法主要是通过学习系统观看人类执行操作任务的视频,并尝试学习『机器人』️执行相同任务的动作,但人类做灵巧动作时,视觉、触觉、力觉甚至肌肉记忆是“组合拳”。
在少数情况下,人类可以远程操作『机器人』️,他们可以看到『机器人』️以及被操作的物体,人类可能会获得少量的力量和触觉反馈——这些反馈主要来自『机器人』️的手部,而不是手腕、肘部、肩膀或臀部,但任何此类触觉数据都非常粗糙。
在过去的二十年里,语音到文本、图像标记以及由大型语言模型(LLM)生成的流畅语言都通过使用线性阈值神经模型的端到端学习以惊人的方式发生了转变,但我们目前并没有触觉数据处理传统,人类动作藏着无数即兴调整——拧瓶盖时打滑了会悄悄加力,而AI只会机械复制视频里的动作,环境一变就“死机”。
如果任何人或任何团体想要成功,他们必须收集正确的数据并学习正确的事物,布鲁克斯表示大多数人形『机器人』️灵巧性项目都没有做这两件事。
他预测,即使具备最低限度的灵巧性,我们距离首次盈利部署人形『机器人』️也还有十多年的时间。
而且人类的灵巧依赖于丰富的触觉,执行灵巧任务不仅仅涉及双手,它通常还涉及肘部、身体前部、腿部和双脚协同。
相关研究显示,人类手掌光滑的皮肤(此处不长毛发)下约有17000个低阈值“感受器”,其中约1000个位于每个手指的指尖,每个关节的神经末梢能感知5克以下的压力,相当于一根羽毛的重量,任何机器手都无法与之匹敌。
而触觉是一组非常复杂的传感器和处理装置,与简单的局部压力相比,它能提供更丰富的时间相关和运动相关信息来评估物体,要搞清楚这一切,业界还有大量的研究要做,之后还需要数年时间才能完成可靠的实验室演示,之后还需要数年时间才能打造出能够为客户带来价值的可部署系统。
全尺寸人形的“高风险”如果有人要大规模部署人形『机器人』️,重要的另一点是它们对于人类来说是真正安全的,可以与它们共享生活空间,因此人类距离它们可能只有几厘米或者零距离,可以依靠人形『机器人』️获得支撑,可以被人形『机器人』️触摸和操纵(例如老年人可以被『机器人』️触摸和搀扶,辅助他们站立、洗漱、排便、上下床等)。
问题在于,目前人类大小的两足行走类人『机器人』️对人类来说并不安全,尤其是那些全尺寸仿人的。
当下的人形『机器人』️使用强大的电动机,通过在系统不稳定时向其注入大量能量来保持平衡,主要遵循ZMP(零矩点)算法,如果『机器人』️不小心摔倒,肢体会拥有大量的自由动能,通常会在自由空间中快速加速,这就是为啥很多『机器人』️一摔倒就跟“抽疯”了一样,甚至会伤到周围的人。
将人形『机器人』️放大两倍必须有相应比例的更粗的腿,也就是更大的质量,驱动它们的能量可能会增加八倍以上,出现升级的潜在伤害,情况可能更糟。
布鲁克斯表示,除了专业测试人员,建议大家不要随便靠近一个全尺寸的人形『机器人』️3米以内,除非有人发明出更好的双足行走『机器人』️,使接近甚至接触都更加安全,否则我们不会看到人形『机器人』️获得认证,可以部署在有人的日常区域。
人形『机器人』️未必要像人布鲁克斯预测,未来15年,成功的“人形”『机器人』️未必是仿人类的外形。
出于安全考量,它们或将拥有轮子、多个手臂和专门的传感器,有些机械臂会有五指灵巧手,但很多机械臂会配备两指平行的钳口,有些机械臂可能配有吸盘,它们仍将被称为人形『机器人』️。
之后还会有配备大量非被动式摄像头传感器的版本,它们的眼睛会利用主动光或非人类频率范围进行探测,它们的眼睛可能长在手上,甚至可能从胯部附近向下观察地面,以便更好地在不平坦的路面上行走。
未来将会有许许多多形态各异的人形『机器人』️,可以完成人类能够完成的各种专业工作。麦肯锡数据也显示,专注细分场景的服务『机器人』️增速最快,年复合增长率达22%,远超通用『机器人』️。
他预测,大量的资金将会消失,尤其是用于试图从当今的人形『机器人』️中榨取更多性能的尝试,很多人类现在设想的通用人形『机器人』️形态将会消失,人形『机器人』️最多在工厂干些固定装配活。
对投资者来说,现在最该警惕“估值泡沫与技术现实脱节”。
布鲁克斯给出的建议是:“别追‘通用人形’的概念,去看能真正解决具体问题的公司——比如精准做手术的医疗『机器人』️、摘水果的农业『机器人』️,这些领域的商业化落地,比通用『机器人』️靠谱十倍。”
站在具身智能的风口,布鲁克斯认为:“『机器人』️的终极目标不是变成人,而是成为比人更擅长解决特定问题的工具。”
人形『机器人』️灵巧性困局的破局点,从不是资本狂欢的顶点,而是当『机器人』️能在某个细分领域,比人类干得更快、更稳、更省钱的那一刻,在那之前,所有的热度和估值,都只是产业进化的“前戏”而已。
-END-