人形机器人也要“进校学习”?数据采集成必答题

人形机器人也要“进校学习”?数据采集成必答题

21世纪经济报道记者 孙燕 邓浩

7月9日,德马科技与智元机器人合作建立全球首家具身智能人形机器人物流训练工厂,部署数十台人形机器人开展真实物流场景(搬运、拆箱、分拣等)的数据采集与训练。

此前在6月,合肥市具身智能机器人数据采集预训练场启用,帕西尼具身智能超级数据工厂也投入运营。

数据被认为是具身智能的“卡脖子”问题。

东吴证券指出,不同于大语言模型可以使用互联网海量信息作为训练数据,机器人所用的具身智能模型没有现成数据可以使用,需要投入大量时间和资源进行机器人操作实践或仿真模拟,以收集视觉、触觉、力觉、运动轨迹以及机器人本体状态等多源异构数据。

为助力数据采集,训练场应运而生。

企业、政府争相落地

去年下半年以来,具身智能数据采集厂密集落地。

企业率先搭建数据采集中心,如智元机器人数据采集中心于去年9月启用,帕西尼主导建设的具身智能超级数据工厂于今年6月投入运营。

之所以要采集数据,是因为人形机器人在落地场景之前,需逐步学习并优化技能。

通常而言,单个场景的训练就可能需要百万量级的数据,但是行业早期缺少高质量且格式统一的数据库,从而制约了机器人泛化能力的提升。

为了突破数据困境,行业内出现了两种思路。民生证券研究指出,其一,以英伟达、银河通用为代表的企业试图通过仿真数据的方式,生成数据用于机器人训练;其二,以智元机器人为代表的企业建立大规模数据采集厂以收集高质量的真实场景数据,再寻求合适的比例将真实数据与仿真数据混合,以实现较优的训练效果。

一位产业人士告诉21世纪经济报道记者,该企业先在数采中心搭建工厂实景,依靠人工遥操,让机器人采集真机数据,从而训练出单个工种的小模型(或算法),以达到客户的交付要求。“一个项目POC(概念验证)要两个月左右时间,要达到较高准确性可能要半年以上。但由于工厂作业环境以及其他安全考虑,人形机器人无法一直在现场采集数据,所以我们根据制造现场搭建了实景给机器人训练。”

除了厂商自采集,地方政府也在建设数据采集中心:国家地方共建人形机器人创新中心建设的全国首个异构人形机器人训练场于今年1月启用,合肥市具身智能机器人数据采集预训练场于今年6月启用。

前述产业人士告诉记者,在G端,主要是工业、人工智能产业发达的地方政府采购人形机器人去建数采中心。由政府主导建设的数据采集中心一般是公共服务平台,所采集的数据归政府平台所有,待积累了足够多的数据后,可以提供给辖区内的机器人企业训练。

青瞳视觉相关业务人士对记者表示,该公司从2023年左右开启了人形机器人数据采集业务。“主要是to G和to B,目前在政府端、学校端、企业端都有落地。”

一套数据采集解决方案通常包括机器人、硬件、软件、云数据处理服务、软硬件售后维护、模型训练平台等。据青瞳视觉相关业务人士透露,一套数采中心解决方案售价在40万-50万元。

效率有待提高

前述产业人士指出,目前人形机器人行业都在做数据采集。“只要是专注下游应用的企业,哪怕不建大规模数采中心,也因为要做POC、交付,会搭建小规模数采中心。”

其预计,这两年行业内人形机器人出货量最多的可能在数据采集场景。“工业场景里几十台订单,量已经很大了。但建设一个数采中心,起码要到百台级别,否则经济效益不够。 ”

但当前,人形机器人数据采集仍然面临挑战。

一方面,硬件方案未收敛,数据孤岛问题提高了数据采集成本。华源证券研究指出,目前广义的人形机器人硬件结构尚存在不确定性,例如本体存在轮式方案与双足方案,手部结构如夹爪、灵巧手、三爪等机械结构尚未确定;传感器方案中视触觉、磁变传感器的方案选择与具体排布位置也未有定论。

前述产业人士也指出,人形机器人仍在快速迭代阶段:每个星期都会有模组修改,一两个月就会有零部件、局部改造,可能几个月到半年就会更新一代。

另一方面,当前人形机器人数据采集方法多数集中在关节层数据,如各自由度的角度、速度、力矩等,硬件不统一导致不同机器人关节结构差异较大,采集的数据具有极强的平台依赖性,可复用性低,数据孤岛问题极大提高了数据采集成本,使得产业端难以通过规模化降低数据成本。

而本体高自由度的累计传递误差带来的本体精度问题以及机器人本体-人体自由度不匹配导致映射算法构建困难,进而导致真实数据采集精度不够,有效数据比例较低。

前述产业人士指出,不同结构的机器人所采集的数据,若映射到新的本体上作业,数据的准确性、模型的有效性会大打折扣。

但在行业发展初期,采集数据依然是第一步。

猜你喜欢

千元机诞生“新黑马”,6400mAh+1.5K旗舰屏,冲上性价比榜第一名

在它之后发布的Redmi turbo4、realmeNeo7和一加Ace5竞速版,目前性价比都不如它,而且从性价比得分来看,它们的性价比差距也还挺大,就阿维看来这种得分还是比较客观的,因为这款iQOO Z…

千元机诞生“新黑马”,6400mAh+1.5K旗舰屏,冲上性价比榜第一名

冯小刚徐帆养女看展,短裤露脐秀蛮腰,大长腿越发漂亮

冯小刚和徐帆这对夫妻,在2007年决定收养了一名可爱的女婴,并为她取名徐朵。 在有关徐朵的事情上,徐帆从来都是亲历亲为,对她的宠爱显而易见。徐帆还为女儿拍摄了多张个人照与同学合影,镜头下的徐朵既美丽又温柔,徐…

冯小刚徐帆养女看展,短裤露脐秀蛮腰,大长腿越发漂亮

国产恐怖片也就网大能看,妥妥的“阴间狠货”,人心远比鬼怪可怕

这一次马先生不需要用法力抓鬼了,因为《白云斋怪话》的民俗恐怖的背后,是“东郭先生与狼”的黑暗人性高汤。 《白云斋怪话》虽是网大,制作也不精良,但不得不说:在深度与文戏的拉扯上,这部戏的水平,比25年上映的作…

国产恐怖片也就网大能看,妥妥的“阴间狠货”,人心远比鬼怪可怕

破音无人care!鹿晗颜值逆袭,只要发色够绝,哥哥放屁都是香的

6月2日,鹿晗青岛演唱会以一头荧光绿挑染短发冲上热搜,被粉丝狂赞&34梦回EXO时期&34。就在半个月前,上海站的他因背头造型暴露面部凹陷,被嘲&34憔悴大叔&34。团队连夜调

破音无人care!鹿晗颜值逆袭,只要发色够绝,哥哥放屁都是香的

江苏亿能电气取得10kv封闭型高压接触器柜结构专利,手车式接触器能够方便的根据高压柜实际的运作情况和运作区域对接触器进行替换,便于用户扩容

金融界2025年7月17日消息,国家知识产权局信息显示,江苏亿能电气有限公司取得一项名为“一种10kv封闭型高压接触器柜结构”的专利,授权公告号CN223109464U,申请日期为2024年06月。 专利摘要…

江苏亿能电气取得10kv封闭型高压接触器柜结构专利,手车式接触器能够方便的根据高压柜实际的运作情况和运作区域对接触器进行替换,便于用户扩容