我们去看了智元『机器人』️的「数采厂」，等等！这不是《<strong>星球大战</strong>》片场吗？ #科技 #技能 #数据 #『机器人』️ #商超 #智元

文 | 田哲

编辑 | 苏建勋

2025年初，我们了解到一件事，国内具身智能独角兽“智元『机器人』️”（就是B站知名UP主“稚晖君”当CTO的那家公司），在上海，建了一座“数据采集工厂”（简称“数采厂”）。

这是啥？为啥建？怎么采？一系列疑惑涌上我们心头，我们决定去看一看。

当然了，在去之前，我们对一家“数采厂”的工作流程，有一些非常刻板的想象——在堆满『服务器』黑盒子的昏暗房间，挂着黑眼圈、发量堪忧的程序员，机械地敲着键盘输入代码……

错错错！当《智能涌现》抵达智元『机器人』️位于上海浦东的数采厂，发现现实和我们的想象，截然不同！

毫不夸张地说，这完全是美国电影《星球大战》的片场！

今日霍州(www.jrhz.info)©️

《星球大战》电影海报；图源网络

在这座3000平方米的数采厂中，不同主题的房间占据了工厂的绝大部分面积，每个房间都精心还原了现实生活的物件布局，『机器人』️就在不同的场景中执行不同任务。

在卧室中，『机器人』️乖巧地学习叠衣服。

今日霍州(www.jrhz.info)©️

『机器人』️学习叠衣服；图源：智元『机器人』️

在餐桌前，『机器人』️把餐具挨个摆放整齐。

今日霍州(www.jrhz.info)©️

『机器人』️摆放餐盘；图源：《智能涌现》拍摄

『机器人』️还要学会打餐各式菜肴，并且不会手抖。

今日霍州(www.jrhz.info)©️

『机器人』️正在用勺子舀鸡蛋；图源：《智能涌现》拍摄

而在商超收银台前，『机器人』️一只手拿扫码器，另一只手拿着商品扫码。

今日霍州(www.jrhz.info)©️

智元『机器人』️正在学习商品扫码；图源：《智能涌现》拍摄

参观结束后，《智能涌现》见到了数采厂负责人姚卯青，他也是智元『机器人』️具身产品线总裁、研究院执行院长，负责数据驱动具身智能产品研发。

此前，姚卯青曾在Waymo、蔚来汽车等公司负责研发感知算法、端到端大模型。

姚卯青告诉《智能涌现》，『机器人』️每完成一个动作，就相当于一条数据，数据将通过『机器人』️的主机上传至云端，智元『机器人』️团队将利用这些数据训练『机器人』️的大模型，从而让『机器人』️真正掌握一项技能，比如冲咖啡、熨衣服等。

为了让『机器人』️快速学习技能，智元为它们安排了一对一教学老师——数据采集员，他们都是年轻有活力的小哥哥小姐姐，为了更好地教『机器人』️完成动作，采集员也需要肢体协调，动作标准。

数据采集员们手持设备，手把手地控制『机器人』️完成抓、握、放等动作。有时他们也会头戴『VR设备』，更精准地让『机器人』️模仿学习人类动作。

据了解，现在智元数据采集工厂投放了近百台『机器人』️，日均采集3-5w条数据。

而为了让『机器人』️更快在不同环境中掌握尽可能多的技能，智元数据采集工厂模拟了家庭、零售、服务业、餐饮、工厂五个场景。

在这里，你能发现商超内不仅有各类零食，还有葡萄酒、香烟，甚至连蔬果的价钱也标好了。

今日霍州(www.jrhz.info)©️

智元『机器人』️模拟的商超；图源：《智能涌现》拍摄

也有一批『机器人』️分散在各自“工位”，在桌前学习简单地叠衣服等技能。

今日霍州(www.jrhz.info)©️

『机器人』️们在工位学习不同技能；图源：《智能涌现》拍摄

据了解，数采厂面积还将增加1000平方米，可增加更多场景的同时，也能根据客户需要定制化模拟场景。

不过，目前行业内少见打造如此多样场景的『机器人』️公司，一个问题随之而来：智元『机器人』️下决心打造数据采集工厂，这一过程是如何展开的？

为具身智能『机器人』️，打造数据养料场

对于大多数初创公司而言，将高额资金建设一座工厂用于数据采集，风险无疑是巨大的，而智元『机器人』️似乎没有犹豫，仅仅用了一个多月就完成搭建数据采集工厂。

促使智元『机器人』️不惜高成本打造数采厂，这背后，行业现存数据量在供给侧上的巨大空白。

2024年6月，智元『机器人』️决定研发『机器人』️具身智能大模型，这需要海量数据以训练大模型。

姚卯青告诉《智能涌现》，『机器人』️通过数百条数据学会一个技能，这些动作往往都是长程任务，比如冲泡咖啡，熨衣服等。

他们曾试图寻找行业内的开源数据库，但发现高质量、统一格式的数据几乎不存在。即使行业内开源了百万条由真实『机器人』️收集的训练数据集，但是这些数据实际上由不同公司、不同型号规格的『机器人』️采集，数据质量较低，达不到智元的要求。

姚卯青表示，不同传感器和形态的数据差异过大，将削弱整体训练效果，比如一个六轴机械臂的数据在七轴灵巧手『机器人』️上几乎无法复用，因此需要统一标准的数据。

而让智元下决心建设数采厂，这个过程也很简单。

姚卯青表示，智元『机器人』️采集了几千条数据用于训练算法，虽然能让『机器人』️顺利完成某个动作，但是无法泛化——如果改变物体种类、颜色甚至光线，都将影响『机器人』️再次完成同样的动作。因此智元『机器人』️决定建设工厂大规模采集数据。

不同房间的『机器人』️正在采集数据；图源：《智能涌现》拍摄

数采厂未来将源源不断为『机器人』️学习提供数据养料。据了解，智元数据采集工厂投入使用两个多月，就采集了超百万量级真机数据集，采集任务超一千种，每个任务都包含几百条数据，一些特别难的长程任务可达几千条。

“不久后我们将拥有超千万条数据。”姚卯青笑着说。

探寻『机器人』️的Scaling Law

在采集数万条『机器人』️重复动作后，智元『机器人』️收获了一些意外之喜：『机器人』️能够在未经训练的情况下，根据要求控制倒水量；只教了『机器人』️几十次，就能学会叠裤子。

这正是智元『机器人』️想要打造的『机器人』️——能够自主理解人类指令和外部环境，并能适应复杂的环境。

智元希望『机器人』️能够更换不同品牌、型号的咖啡机配件；图源：《智能涌现》拍摄

过去数十年，『机器人』️的控制往往依赖人们的预设规则，向『机器人』️输入情况描述以及应对方式的规则，『机器人』️在相应情况下完成操作。然而『机器人』️遇到的情况千变万化，难以依靠提前输入规则就能让『机器人』️应对所有情况。

在大模型应用爆发后，让『机器人』️从冰冷的躯体有了智力，能够理解世界和人类。而智元『机器人』️正在研发的，是具备端到端大模型的『机器人』️，通用能力更强且反应速度更快。

『机器人』️从接受指令到完成动作通常有三个步骤：感知外部环境，做出决策、控制肢体执行任务，信息在这一链条传递中可能出现失真，从而影响『机器人』️完成动作。

但端到端大模型，不需要分模块，更不依赖精准测量，就像人类超车前，不会下车测量两车之间的距离，再进行超车。

智元『机器人』️对端到端大模型『机器人』️的设想是，『机器人』️能够接受人类的复杂指令，比如让『机器人』️从远处取来手机，或者从冰箱里拿一包薯片。这些指令不仅考验着『机器人』️对任务的理解能力，还要求『机器人』️能够识别物体，并完成移动到相应地点、取物，返回，提交物品。

但是达到这一状态并不容易。姚卯青表示，需要不断向大模型投喂数据，数据量越大，大模型在某一场景表现会更接近人类，他预估的数据量为几千万条到1亿条，『机器人』️的Scaling Law远未到来。

《智能涌现》了解到，『机器人』️需要软硬件结合，仅有其中之一都难以让『机器人』️技术迅速发展。美国的硬件成本较高，因此美国『机器人』️初创公司大多只研发算法。中国已有供应链优势，结合数据和自研的硬件，会让算法、硬件、软件快速迭代。

姚卯青相信，中国『机器人』️技术的整体进度已与美国不相上下，因为美国的人工成本比国内高出十倍，还得从中国采购各种零部件。

智元『机器人』️用更低的成本和高效的迭代速度，拓展了场景模拟和数据采集规模，那些在美国『机器人』️公司看来“遥不可及”的技术，正在中国的数据采集工厂不断流淌的数据中，一点点接近成为现实。

我们去看了智元『机器人』️的「数采厂」，等等！这不是《星球大战》片场吗？

猜你喜欢

今日辟谣(今日辟谣图片)

唱《你是我的眼》的歌手终于结婚，原来他是真盲，评论区出奇一致(你是我的歌曲歌词)

恭喜！TVB前花旦宣布复合，曾含泪控诉未婚夫太冷血，手术无人陪

胡慧中带女儿逛冰城，母女同框差距太大，25岁女儿被吐槽颜值翻车(胡慧中女儿体重多少)

苹果今年四款笔记本📓蓄势待发：首款低价版MacBook打头阵 4999元内起售(苹果笔性价比)

我们去看了智元『机器人』️的「数采厂」，等等！这不是《星球大战》片场吗？

猜你喜欢

今日辟谣(今日辟谣图片)

唱《你是我的眼》的歌手终于结婚，原来他是真盲，评论区出奇一致(你是我的歌曲歌词)

恭喜！TVB前花旦宣布复合，曾含泪控诉未婚夫太冷血，手术无人陪

胡慧中带女儿逛冰城，母女同框差距太大，25岁女儿被吐槽颜值翻车(胡慧中女儿体重多少)

苹果今年四款笔记本📓蓄势待发：首款低价版MacBook打头阵 4999元内起售(苹果笔性价比)

分享

添加书签