Figure 『机器人』️学会分拣快递,这回一镜到底让你看一小时

今日霍州(www.jrhz.info)©️

人形『机器人』️进厂打工早就不是新鲜事了,但有勇气一镜到底公开展示的目前也就 Figure 一家。

就在今天,Figure 发布了一部长达 1 小时的视频,邀请全网监工『机器人』️ Figure 02 分拣快递。在视频当中,Figure 02 要完成这样四项工作:

拿起左手边的快递;找到并扫描快递包装上的快递单;将快递单朝下放置到右手边的传送带上;甚至可以轻轻拍一下包裹,保证平整。

今日霍州(www.jrhz.info)©️

但是,这项工作的难点至少有三个:

快递包装的种类繁多(纸盒,包裹袋,文件袋等),且五颜六色,不同的包装分别应该怎么抓?如何准确找到快递单的位置?如何保证更高的准确率,工作中少出错?

这三个难点,Figure 的就是用此前发布的 Helix 神经网络解决的。今早,Figure 在官网上线了一篇文章,总结了此前 10 - 60 小时训练期间的数据变化,对一个小时的视频做了详细解读。Figure 02 之所以能这么强,秘诀就在于视觉记忆、状态历史以及力反馈这三个关键词。并且,最后还有个彩蛋,如果『机器人』️工作的时候,有人伸手了,『机器人』️会怎么办?

平均 4 秒处理一个包裹

从能力上看,Figure 02 在处理快递包裹的时候,已经表现出了不错的成熟度,具体就表现在工作流的四个环节当中。

Figure 02 可以处理不同形状的快递包裹,最简单的是纸箱,但更难的是塑料袋包裹、文件袋以及其他容易产生形变的包裹。由于这些包裹容易折叠、起皱或者弯曲,就让抓取和快递单的定位更困难。基于 Helix 神经网络,Figure 02 就能动态调整抓取策略,最终处理一件包裹的平均时间为 4.05 秒,快递单条码的定位成功率提升到接近 95%。

今日霍州(www.jrhz.info)©️

另一方面,在将包裹翻转之后,Figure 02 手上还有个微动作——轻轻拍一下包裹,将其抚平。实际上,在学习过程中,这一动作并非强制,而是『机器人』️在端到端学习之中总结出来的方法。

神经网络的三大改进

Figure 02 为什么能做到这么高的效率?答案在于 Helix 神经网络对系统 1 视觉运动策略的改进。在过去两个月时间里,Figure 引入了视觉记忆、状态历史以及力反馈三个模块,能够让 Helix 神经网络更好地感知外部世界随时间的变化,并且感受自身行为。这到底是什么意思呢?我们还是要回到 Figure 的工作现场。

今日霍州(www.jrhz.info)©️

在抓取快递包裹之后,如果快递标签不在正上方,Figure 可能要检查包裹的另一面,这时候就需要视觉记忆模块起作用了。

Helix 能够短时间记忆周围环境,从近期的视频帧中合成特征,从而获得场景的时间扩展视图。这样一来, 『机器人』️可以记住它检查过包裹的哪几个侧面,同一个面不会检查两次。

从本质上来说,视觉记忆赋予了 Helix 一种时间上下文感知能力,以视觉记忆为指导,而不是碰运气。这样,Figure 02 实现了更高的工作效率——快递单条码定位成功率接近 95%。

另一个提升工作效率的方式就是让动作连续起来,左右手都不能闲着,Figure 引入了状态历史这一模块。最初,Figure 给『机器人』️的策略是固定时长的动作块(比如在 0.5 秒内伸手);之后,通过将『机器人』️的状态历史纳入策略输入,系统就能让动作块之间连续起来。更重要的是,状态历史保留了前后的视觉记忆,即便重新规划,也不会破坏整个流程的效率。

最终, Figure 02 能够更快地响应意外和干扰,如果包裹抓取失败,Helix 会用最低的延迟纠正其中的运动,这同样提升了包裹的处理效率。

在抓取快递包裹时,还有一大难点在于究竟要用多大的力量抓取包裹?Figure 给出的方案是加入力反馈模块。目前,Figure 02 对环境、物体施加的力已经成为输入神经网络状态的一部分。比如,在『机器人』️伸手拿包裹时,它可以记录下时间,当包裹已经平整放在台面上,手上施加力量也压不动的时候,『机器人』️就会停止向下压包裹。

通过力反馈模块的加入,Figure 02 的成功率与运动一致性再次提高。

如何证明模型有效?

为了量化 Helix 改进对 Figure 02 能力的提升,研究人员针对不同的方案进行了训练,最后结果就看两个数据,一个是包裹的处理速度,另一个是快递单扫描的成功率。

第一个控制控制变量实验是研究训练时间与模型熟练程度的关系。研究人员分别在 10、20、40、60 小时时记录模型的能力。结果发现,在训练 10 小时后,包裹处理的速度为 6.34 秒,而在训练 60 小时后,包裹的处理速度为 4.31 秒,速度快了 58%。同时,快递单扫描成功率也从 88.2% 提升到了 94.4%。

今日霍州(www.jrhz.info)©️

这也就说明,未来随着数据规模扩大,模型性能会持续提升。

第二个实验针对视觉记忆、力反馈模块的增加,探究能否提升『机器人』️的工作效率。研究人员有有多组参考,分别是单目视觉、立体视觉、加入视觉记忆、加入状态历史和力反馈、在此前基础上增加 50% 参数量共 5 个对照。

今日霍州(www.jrhz.info)©️

结果表明,在加入视觉记忆后,单个快递的处理时间减少了 0.5 秒;在加入状态历史和力反馈后,识别快递单的准确率从 85.1% 提升至 94.4%。最终,单个快递处理时间为 4.05 秒,准确率 92.5%。

也就是说,这两项实验能够直接证明 Figure 新加入的模块对于提升效率和准确度有很大的帮助。

在最后,Figure 还展示了一个彩蛋,当 Figure 02 认真工作的时候,有个人走到面前伸出手,『机器人』️会认为这是要将包裹交给他的意思。这时候『机器人』️不会将包裹放在传送带上,而是交给对面的人。

今日霍州(www.jrhz.info)©️

这种类人的条件反射非常惊艳,因为还没有第二个『机器人』️能这样与人互动。不过,『机器人』️刚刚进入社会,毕竟还是 Too Young,人伸出手竟然就把东西递出去了,看来他还是不太懂复杂的人类。

特别声明:[Figure 『机器人』️学会分拣快递,这回一镜到底让你看一小时] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

苏品苏货•欢购无锡 | 锡有好礼,快快“马”住!

给孩子的满分礼物🎁来啦~源自西班牙的“儿童色彩专家”Bonfil宝菲凡品牌儿童绘画材料净味丙烯、宝菲凡儿童速干水粉颜料套装、小布丁手指画颜料等,是江苏宝菲凡儿童用品有限公司的『明星』️产品,颜值与内涵双在线,安全且…

苏品苏货•欢购无锡 | 锡有好礼,快快“马”住!

食贫道UnclePie困鹿月光白茶,2.5g小袋装,如何选才不踩雷?(食贫道百科)

食贫道UnclePie的困鹿月光白茶以2.5g独立小袋包装闻名。本文教你挑选优质云南普洱月光白茶的关键指标,避开坑点。适合送礼还是自饮?价格多少算合理?一起了解。

食贫道UnclePie困鹿月光白茶,2.5g小袋装,如何选才不踩雷?(食贫道百科)

全球抛售美国 美元💵跌势难止(全球抛售美债的结果)

美国财政部长斯科特·贝森特确认了“强势美元💵政策”,但未能阻止美元💵的跌势。1月29日,美元💵指数一度下跌至96.03,跌幅约为0.3%。彭博新闻社报道指出,美元💵再次下跌的原因是投资者担心美元💵购买力将长期下降,转而寻求其他替代资产

全球抛售美国 美元💵跌势难止(全球抛售美债的结果)

美国Artemis II任务宇航员获准携带iPhone等记录绕月之旅(美国 art center)

2 月 6 日消息,美国宇航局(NASA)局长贾里德 · 艾萨克曼(Jared Isaacman)昨日(2 月 5 日)在 X 平台发布推文,宣布解除长期存在的禁令,在未来航天任务中允许宇航员携带…

美国Artemis II任务宇航员获准携带iPhone等记录绕月之旅(美国 art center)

千元价位,顶配体验!这枚德国军工级别智能腕表,让其他都沉默了(2020低价高配的千元机)

我们想要的,不过是“千元价位、军工品质、商务运动全能戴”的终极答案。 就在所有人以为“千元智能表到此为止”时,智能穿戴领域真正的“全能选手”悄然登场——它不仅继承了上述军工级品质与新潮设计美学,更在细节处彰显…

千元价位,顶配体验!这枚德国军工级别智能腕表,让其他都沉默了(2020低价高配的千元机)