当ChatGPT用语言模型重构人机交互时,谁将成为物理世界的规则改写者?2023年5月成立的Skild AI,用15亿美元估值和3亿美元A轮融资给出答案——他们正在编写的,可能是机器人界的Linux内核。
资本狂潮:解码机器人界的"天价赌注"
Menlo Ventures、红杉资本、亚马逊及贝索斯个人基金的联合押注,让Skild AI的A轮融资成为机器人赛道年度标志性事件。这与OpenAI早期融资路径惊人相似:红杉资本合伙人将其称为"物理世界的Transformer时刻",而亚马逊的参投直接锁定了物流机器人场景的优先落地权。
资本逻辑清晰可见:在数据稀缺的机器人领域,构建通用基础模型的价值链顶端地位。正如贝索斯基金投资经理所言,这并非单点技术投资,而是对下一代人机交互入口的抢占。
技术核爆:1000倍数据训练的"机器人大脑"
SkildBrain的颠覆性体现在三个维度:
- 数据规模:其训练数据集达到竞品的1000倍,整合远程操控数据、随机任务视频及公开素材,形成跨平台、跨场景的泛化能力基础。
- 零样本学习:在陌生环境操作未知物体的测试中,模型展现出类人的适应能力,预告片展示的越障场景即为例证。
- 参数效率:对比Physical Intelligence的3B参数π0模型,SkildBrain在模型规模与硬件适配间找到平衡点,为低成本机器人普及创造条件。
生态博弈:英伟达三星的"物理AI"卡位战
巨头布局揭示产业变革方向:
- 英伟达通过投资构建"芯片-算法-机器人"闭环,补充其GR00T模型生态;
- 三星的1000万美元投资着眼于传感器模组协同,为硬件平台寻找新场景;
- 亚马逊的物流场景成为首批试验田,验证模型在真实环境中的商业价值。
这种纵向整合正在加速"算法-硬件-场景"的闭环形成,正如Skild AI联合创始人Deepak Pathak强调:"我们正在证明,单一共享模型可以服务任何机器人、任何任务。"
行业拐点:通用机器人还差几个GPT-3时刻?
三个关键问题决定商业化进程:
- 场景渗透:相比ChatGPT的快速落地,工业/家庭场景需突破安全认证、成本控制等现实壁垒;
- 算力阈值:CMU团队研究表明,机器人"涌现能力"需要更高算力支撑;
- 伦理边界:自主决策权限设定成为争议焦点,越障场景已引发责任归属讨论。
当Physical Intelligence、Covariant等初创公司同步崛起时,行业正迎来"具身智能的GPT-3时刻"。正如Pathak的宣言:"这不是某个机器人的升级,而是整个物种的进化。"这场革命或许比预期来得更快——下个月的功能展示,将验证通用机器人大脑是幻想还是未来。