近日,群核科技发布的开源数据集InteriorGS,登上全球最大AI开源社区HuggingFace趋势榜榜首,英伟达推出的Nemotron-Post数据集紧随其后,同时上榜的还有群核开源的另一个3D数据集InteriorAgent。
HuggingFace数据集趋势榜,榜首为InteriorGS
当前,随着具身智能技术加速向实际应用渗透,行业正面临一个关键瓶颈:高质量训练数据的严重短缺。AI 的进化离不开数据,但机器人需要的 “空间数据”。而目前整体现状是:不仅三维数量级远远不够,而且存在真实感不足和缺乏精细语义标注的短板。
据了解,登上榜首的3D高斯语义数据集InteriorGS首次将3D高斯技术引入AI 空间训练领域,并结合其自研的空间大模型能力,使该数据集兼备真实感与语义性,成为全球首个适用于智能体自由运动的大规模3D数据集。InteriorGS数据集由1000个高斯场景组成,涉及80多种环境类型,并涵盖超过 55.4 万个物品标签,分属 755 个类别,每个物体都配有3D边界框和语义标注。
而在榜单中的另一个群核开源3D数据集InteriorAgent,则专项用于IROS 2025“桃源”与真实世界机器人学习挑战赛(机器人学习挑战赛)。该大赛由上海人工智能实验室主办,群核科技与阿德莱德大学协办,旨在打通仿真与现实壁垒,推动具身智能技术从“看起来能做”到“现实中能做”的关键跨越。目前该大赛已启动报名,并将于10月20日在IROS大会上进行现场颁奖。
据悉,群核科技聚焦于室内场景下的空间智能服务,早在2018年就发布了当时全球最大的室内空间深度学习数据集InteriorNet,该数据集共包含1.3亿空间数据。该数据集一经发布就引发全球关注,持续被用于AIGC、具身智能、XR等相关领域的智能训练和研究中。
近期中国AI进展不断霸榜全球引发关注,可以看到,不论是AI模型,还是数据集,中国企业纷纷站上全球创新前沿,这背后是中国数字经济迅猛发展的缩影,这过程中像阿里巴巴、快手、群核科技等中国企业承载了最复杂的场景、最多元的需求,进而沉淀了最丰富的数据。而这些都将是中国企业在AI进程中成为全球领先技术代表的基础。