『机器人』️能爬楼梯就是巨大突破?Skild Brain 端到端模型让机器进化成人(『机器人』️爬楼梯maya动画教程)

为什么说人形『机器人』️能爬楼梯就是巨大的突破?

目前许多人形『机器人』️还没办法流畅爬楼梯,这个事实跟人们的普遍认知显然不太符合,因为现在很多人形『机器人』️已经可以跳舞或是表演杂技了,这些对于人类来说反倒是不容易学会的,怎么『机器人』️能爬楼梯就成了巨大突破?

其实这就是莫拉维克悖论的典型例子:对人类而言轻而易举的事情,对『机器人』️来说却十分困难,反之亦是如此。

那么爬楼梯对于人形『机器人』️的难点是什么?

其中最重要的是,『机器人』️需要视觉感知 和运动控制之间的精密协调,动态适应台阶高度和几何形状的变化。

而跳舞表演一般都是在空旷的环境中进行,而且通常不需要视觉输入就能执行,仅依靠本体感觉和内部运动感知即可。

Skild Brain:基于视觉的端到端运动模型

长期以来,关于人形『机器人』️的行走,一般有两种路径。

一种是做地图,先把地面建模成一个高低起伏的地图,然后在图上选好每一步踩哪里,最后控制腿照着走。

另一种就是比较常见的 locomotion 策略,本质上是盲走(不靠视觉):『机器人』️只靠本体感知走路,比如关节角度、腿的速度、是否碰到地面等。但这条路径容易出现的问题是:一旦遇到障碍物,就容易摔倒。所以我们才会看到很多『机器人』️在爬楼梯的时候磕磕绊绊。

不过最近,Skild AI 推出的 Skild Brain(基于视觉的端到端运动模型),给出了一种新的路径。它更类似于人的走路方式,边走边看边适应,依靠『机器人』️的视觉进行反馈。

这是一种具备超强适应能力的,通过视觉感知作为输入,最终到『机器人』️动作执行,由一个神经网络端到端训练得到的 locomotion 策略。

Skild AI 在关于 Skild Brain 最新的发布细节中,主要展现了 Skild Brain 的低层控制能力,这一能力可实现完全由在线视觉和本体感觉驱动的端到端运动控制。

借助摄像头图像,Skild Brain 可以对『机器人』️周围的环境做出动态反应,每一步动作都是即时决策的,这样的话模型能基于最新的观测信息,本能地适应新地形。这点就和人类相似,人类会在面对不同地形环境出现的变化时,会及时调整移动的策略。

不过严格意义上说,Skild AI 在 locomotion 上也并不是纯视觉,它会在一些视觉被遮挡的时候会使用本体感知。其实就类似于我们走路,不会时时刻刻都盯着路,但也不至于因为一小会儿看不到就摔倒。

为了检验 Skild Brain 适应环境的能力,Skild AI 做了一个测试,考验『机器人』️如何自主规划穿越障碍物。

工作人员搭建了一个障碍赛道,包括站上去会晃动的小推车、摆放不齐的木板、高低不一的台阶等障碍物,这些障碍『机器人』️事先并没有进行识别,而且动作也没有提前设计。所以很考验 Skild Brain 的及时决策能力。

而实验结果是『机器人』️完美穿越了障碍物,在应对不同障碍时,会调整通过策略,包括足部落点和迈出步伐的时机等判断,整个视觉端到端系统实现了像人一样的动作本能。

之后,Skild Brain 又展现了其在上下楼梯时的能力,而这并不需要提前设置什么楼梯模式,Skild Brain 可以根据地形的变化来调整步态,不需要在特定环境下设置对应的通过模式,这点就和人类一样,没有复杂的各种切换。

上下楼梯时,楼梯每阶只比『机器人』️的脚宽 3 cm,但 Skild Brain 还是可以做出正确的及时反应,确保『机器人』️的脚落在了正确的位置上,在这个过程中,『机器人』️并不会出现抬脚前的犹豫,整体通过速度也没有降低,这就是 Skild Brain 的精妙之处。

并且在负重的情况下,『机器人』️上下楼梯也一样展现出了稳定的通过能力。

在实际部署的可靠性上,经过测试,Skild Brain 在往返上下长程楼梯时,能够连续正确运行而不会让『机器人』️绊倒。

此外,Skild AI 还对 Skild Brain 遭遇外力时的调整能力进行了测试,『机器人』️在楼梯上受到外部推拉力时,它也能够迅速调整立足点且保持平衡。

Skild AI :传统生成式 AI 训练方法行不通

Skild AI 的技术路径是试图构建一个不断改进的、适用不同场景的通用『机器人』️大脑,可以控制任何硬件执行任何任务。

对此,Skild Brain 采用了分层架构:用低频率的高层动作策略为高频率的低层动作策略提供输入,而且适用于各种四足『机器人』️、人形『机器人』️、桌面机械臂、移动机械手等。

7月 Skild Brain 推出的时候,Skild AI 就号称可驱动从流水线机械臂到人形『机器人』️的几乎所有类型的『机器人』️。

在技术路径上,Skild AI 指出了目前行业内一个普遍但有些被忽视的关键问题。他们认为,现在很多所谓的『机器人』️基础模型缺乏可落地的物理常识,在真实世界中,往往应对不了其中的复杂性。

许多研究团队,从已有的视觉-语言模型(VLM)出发,仅引入不到 1% 的真实『机器人』️数据,就声称构建了所谓的『机器人』️基础模型。

语言大模型虽然语义信息丰富,但它们只是表面光鲜,缺乏真正可操作的底层理解。所以,现在很多被称为『机器人』️基础模型的系统,无法应对真实环境中的复杂操作,尽管他们有一定的语义泛化能力。

而 Skild AI 在训练和数据上则是先在仿真环境与人类操作视频中完成预训练,再借助每台联网『机器人』️的真实运行数据进行微调,这可以为客户提供可直接落地的解决方案。

目前的 Skild AI 已累计进行了三轮融资。今年 6 月,Skild AI 刚刚完成第三轮融资,其中包括软银的 1 亿美元💵,『英伟达』的 2,500 万美元💵,三星的 1,000 万美元💵,总计 2.3 亿美元💵,这也使公司估值进一步提升至约 45 亿美元💵。

Skild AI 的核心团队由卡内基梅隆大学前教授 Deepak Pathak 和 Abhinav Gupta 联合创立,两人在『机器人』️与人工智能领域深耕超 25 年。

核心团队的竞争力和技术路径,正是他们被软银、『英伟达』、三星等巨头集体投资的重要原因,这家成立于 2023 年、距今才两年的团队,俨然已经是具身智能行业的领头羊。

而在技术细节上,Skild AI 在未来几周内还会持续发布,这也将为行业的技术发展提供新的参考。打造『机器人』️的通用大脑,让『机器人』️能真正走入现实生活中,去应对复杂多变的物理环境,显然我们还需要做的还有很多。

特别声明:[『机器人』️能爬楼梯就是巨大突破?Skild Brain 端到端模型让机器进化成人(『机器人』️爬楼梯maya动画教程)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

委内瑞拉总检察长向议会递交辞呈 提名委员会将加快组建(委内瑞拉总统列表)

2月25日,委内瑞拉全国代表大会主席豪尔赫·罗德里格斯在议会发言时宣布,委内瑞拉总检察长萨阿卜及护民官阿尔弗雷多·鲁伊斯已向议会递交辞呈。罗德里格斯表示,将加快组建提名委员会,以遴选新的总检察长人选

委内瑞拉总检察长向议会递交辞呈 提名委员会将加快组建(委内瑞拉总统列表)

错误翻译退退退!APEC中国年公示语翻译大扫除(错误翻译图片)

今年是APEC“中国年”,为进一步提升全市外文公示语指引服务水平,深圳市外事保障中心工作人员与志愿者走进华强北步行街,开展现场纠错行动!记者原创采访外事保障中心工作人员表示,会将这些错误总结上报整改,规范外语标识,展现城市文明形象,以更好的

错误翻译退退退!APEC中国年公示语翻译大扫除(错误翻译图片)

她一生“风流成性、老少通吃”,撩汉无数,现如今57岁却依旧单身

『许晴』的个性一直在公众中引起争议:一方面有人批评她年过半百依旧保持“娇矜气质”,甚至讥讽她57岁仍未婚,认为她是“无人问津的落寞”;另一方面,却有无数人为她的精神独立与优雅所倾倒,欣赏她不为社会压力所屈服的姿态…

她一生“风流成性、老少通吃”,撩汉无数,现如今57岁却依旧单身

乘风2026》最终阵容:确认30位姐姐,大咖前辈全无(乘风 omv)

黄雅莉曾以超级女声身份出道,并且凭借《蝴蝶泉边》一曲名噪一时,虽然她随后稍显低调,但近几年也参加了音综节目,人气再次回升,可以说是今年十分有潜力的姐姐之一。首先是泰国实力派演员Chutimon;接着是泰国的演…

《<strong>乘风2026</strong>》最终阵容:确认30位姐姐,大咖前辈全无(乘风 omv)

购买LV ONTHEGO中号女款『托特包』的核心好处(在国内买lv有什么好处)

入手『芯片』款LVONTHEGO经典老花『托特包』,既是实用通勤利器,也是兼具质感与保值性的明智之选,搭配齐全小票,每一处优势都彰显购买价值,适配女性♀️日常多场景需求,无需为搭配与实用性妥协。 整体而言,这款包包将品…

购买LV ONTHEGO中号女款『托特包』的核心好处(在国内买lv有什么好处)