1. 智元『机器人』️通用具身基座大模型 GO-1 正式开源
9 月 23 日,智元『机器人』️宣布其通用具身基座大模型 GO-1(Genie Operator-1)正式在 GitHub 开源。
GO-1 的核心是 Vision-Language-Latent-Action(ViLLA)架构,即通过引入隐式动作标记,弥合图像-文本输入与『机器人』️执行动作之间的语义鸿沟。
通俗解释就是:它先把「看见什么(视觉)、想干什么(语言指令)」抽象成一串低维的、具有语义的暗号(Latent Action),再通过一个专门的动作解码器把这个「暗号」翻译成『机器人』️具体的关节运动指令(比如关节怎么转、手指怎么动等)。其核心优势源于三层协同设计的精妙逻辑:
- VLM 多模态理解层 :基于 InternVL-2B 构建,可以处理多视角视觉图片、力觉信号、自然语言指令等多模态信息,为系统提供场景感知与指令解读能力,是『机器人』️「看懂世界、听懂需求」的基础。
- Latent Planner 隐式规划器 :作为「决策大脑」,通过预测隐式动作标记实现复杂任务的高层次规划和理解,例如接到「悬挂衣服」指令时,能先规划出「抓取衣领 - 定位挂钩 - 调整姿态」的动作逻辑。
- Action Expert 动作专家 :依托扩散模型生成高频率、高精度的连续动作序列,确保『机器人』️完成拧瓶盖、叠衣物等精细操控任务,改善了传统模型动作僵硬、精度不足的痛点。
根据测试,GO-1 在 GenieSim 仿真评测、Libero 仿真评测和真机实验中都取得了不错的成绩,相比于其他 SOTA 模型保持领先。
2. 小米 17 正式发布,首发第五代『骁龙』 8 至尊版
9 月 25 日晚,小米秋季新品发布会召开,正式发布了小米 17 系列,处理器方面,小米 17 全系首发搭载第五代『骁龙』 8 至尊版,即『骁龙』 8 Elite Gen 5:由第三代 3 nm 工艺加持,架构全大核,主频达到了 4.6 GHz。
值得一提的是,第五代『骁龙』 8 至尊版是高通在 9 月 25 日早上刚刚发布的旗舰,所以小米 17 系列就成为了全球首款搭载第五代『骁龙』 8 至尊版的新机。
本次小米 17 系列包括标准版、Pro 和 Pro Max 三款机型。
在屏幕尺寸方面,小米 17 和 17 Pro 的尺寸为 6.3 英寸,Pro Max 则是 6.9 英寸。电池容量上,17 标准版为 7,000 mAh,Pro 为 6,300 mAh,Pro Max 为 7,500 mAh。
本次小米 17 系列最重要的改变就是小米 17 Pro 和 Pro Max 新增的妙享背屏,补充了手机交互的盲区。并且支持 120 Hz 刷新率,可以显示时间,也可以用来自拍🤳、控制汽车等。
在 9 月 27 日正式开售后,据小米手机官方微博消息,小米 17 全系开售 5 分钟,刷新 2025 年国产手机全价位段新机系列,首销全天销量、销额纪录。
3. 宇树 G1 学会了「反重力」模式
9 月 22 日,宇树科技晒出了一段 G1 『机器人』️解锁新技能的视频,G1 接受了工作人员的暴力测试,即便是被踢倒,G1 也很快就完成了起身。
这得益于 G1 新学会的「反重力」模式,即『机器人』️在任意动作序列下,稳定性都有大幅度提升,哪怕是摔倒了,也能快速起身。
这对于『机器人』️在应用时的稳定性提升非常明显,在实际应用场景中,地面状况复杂多变,碰撞等意外情况时有发生。在这些场景下,『机器人』️如果不能快速恢复,不仅会严重影响工作效率,还可能导致设备损坏这类问题,所以『机器人』️的稳定性非常重要。
而且在学会「反重力」模式后,G1 也有了解锁更多技能的可能性,未来可以继续期待『机器人』️在运动端的表现。
4. 谷歌给『机器人』️安上了新 大脑
当地时间 9 月 25 日,谷歌核心 AI 研发部门 DeepMind 发布了为『机器人』️打造的 Gemini Robotics 1.5 系列模型,该系列包括两种模型,分别是:
- Gemini Robotics 1.5:是一款 VLA 模型,可以将视觉信息和指令转化为『机器人』️执行任务的运动指令,跟传统 VLA 模型简单执行指令不同,它在执行动作前会先思考并展示过程,以此来评估并且完成复杂任务。而且其具备良好的跨形态学习能力,不需要根据不同本体形态来调整模型。
- Gemini Robotics-ER 1.5:是一款 VLM 模型,可以对物理世界进行推理,可以调用数字工具并创建详细的多步骤计划来完成任务,目前该模型已经在学术和内部基准测试中实现了最先进的性能。
这两款模型都建立在核心 Gemini 系列模型之上,各自有不同的定位,但它们结合在一起协同运转的时候,也给『机器人』️执行具体任务的时候解锁了智能体的体验。并且 Gemini Robotics 1.5 还有着不错的跨形态学习能力,不需要模型根据不同的本体进行额外的专门调整,可以很好地通过技能迁移学习来完成任务。
对于本次模型的发布,DeepMind 表示将通过 Google AI Studio 中的 Gemini API 向开发者提供 Gemini Robotics-ER 1.5,而 Gemini Robotics 1.5 目前只供部分合作伙伴使用。
5. 知行科技『机器人』️控制器 iRC100 发布
近日,知行科技正式发布全球首款国产芯『机器人』️通用控制器——iRC100。iRC100 基于地瓜『机器人』️ S100P打造,多核异构 SoC 整合了 CPU、BPU、MCU。
在关键参数上:
- CPU 采用 6 核心 ARM Cortex-A78AE,算力 137K DMIPS;
- BPU 采用 Nash 架构,算力 128 TOPS(INT8);
- MCU 采用 4 核心 ARM Cortex-R52+,算力 6.5K DMIPS;
- GPU 采用单核心 ARM Mali-G78AE,算力 100G FLOPS。
- 并且 iRC100 控制器很多方便『机器人』️厂商开发的接口:
- 6 个 USB 3.2 Gen 1,还有 2 个 USB 2.0;
- 4 路 EtherCat,2 个 2.5G RJ45 网口;
- 5 个 CANFD。
此外,在散热方案上, iRC100 控制器采用风冷,内置单个风扇。目前为止,知行科技『机器人』️团队与地瓜『机器人』️紧密合作,已将 VLA 模型 ACT Policy 算法,成功部署在地瓜『机器人』️ S100P(128 TOPS)具身智能计算平台上,使其在 Hugging Face SO-101 机械臂上流畅运行,并以高成功率完成抓取、放置物体任务。
6. 乐享科技完成 2 亿元天使 ++ 轮融资
9 月 28 日,苏州乐享智能科技有限公司(下称「乐享科技」)正式宣布完成 2 亿元天使 ++ 轮融资。本轮融资由钟鼎资本领投,老股东 IDG 资本持续加注。这是乐享科技 9 个月内完成的第三轮融资,天使轮融资总金额接近 5 亿元。
资金将主要投入核心零部件自研、『机器人』️本体与运动控制技术、意识仿生模型迭代等,目标加速消费级具身智能产品规模化落地。
乐享科技成立于 2024 年 12 月,是一家消费级具身智能企业,创始人郭人杰为 97 后,曾任追觅中国区执行总裁。
在产品方面,乐享科技已推出履带式『机器人』️ W-bot,场景覆盖户外与公共空间,拓展零售、安防、娱乐等多元应用。
并且乐享科技介绍,团队正在同步开发 Z-Bot,这是一款高 60 厘米的小型家庭『机器人』️,聚焦家庭场景,探索陪伴、教育、交互等场景,W-bot 和 Z-Bot 两者一起将构成乐享科技覆盖室内外的产品矩阵。