腾讯研究院AI速递 20250928(腾讯研究院在哪儿) #科技 #Agent #速递 #『机器人』️ #电影节 #苹果

生成式AI

一、 ChatGPT新功能Pulse览版，GPT-5主动给你推消息

1. OpenAI推出ChatGPT新功能"Pulse"预览版，首先向Pro用户开放，每晚根据用户聊天记录和反馈提供个性化内容推送；

2. 该功能是基于智能体（Agent）开发的，能主动进行异步搜索，支持链接Gmail和Google日历以提供更相关建议；

3. Pulse通过主题卡片形式呈现内容，用户可以点赞或踩赞提供反馈，奥特曼称这是"将ChatGPT从完全被动转变为主动，提供高度个性化服务"的第一步。

二、『明星』️创业公司Thinking Machines，第二篇研究论文出炉

1. 估值840亿元的Thinking Machines发布第二篇研究论文"Modular Manifolds"，通过让网络的不同层在统一框架下进行约束和优化，提升训练稳定性和效率；

2. 研究者Jeremy Bernstein提出模块化流形方法，解决神经网络训练中权重数值过大或过小导致的不稳定问题，并提供详细的理论分析与实验验证；

3. 公司创始人Mira Murati与翁荔等纷纷转发支持，此前该公司已发布了首篇研究《Defeating Nondeterminism in LLM Inference》，专注解决大模型推理中的不确定性问题。

三、谷歌发布Gemini Robotics 1.5，让『机器人』️学会「思考」

1. 谷歌DeepMind发布针对『机器人』️和具身智能的Gemini Robotics 1.5系列家族模型，包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5两款模型；

2. Gemini Robotics 1.5是最先进的视觉-语言-行动模型，能将视觉信息和指令转化为『机器人』️动作；Gemini Robotics-ER 1.5是最强大的视觉-语言模型，能推理物理世界并创建多步骤计划；

3. 两款模型协同工作，可让『机器人』️执行垃圾分类、行李打包等复杂任务，支持"思考后行动"，实现跨不同『机器人』️形态的技能迁移与泛化学习。

四、实测Kimi全新Agent模型「OK Computer」，很OK

1. Kimi推出全新Agent模型"OK Computer"，依托Kimi K2，能完成网站搭建、PPT制作和百万行数据处理等复杂任务；

2. 模型操作时会列出Todo List进度表，自主完成网页搜索、素材生成、代码编写与检查，最终输出可交互、可复用的结果；

3. 设计类任务能自主规划并实现各模块功能，分析类任务能自动搜集数据并提供可视化图表，生成类任务支持多种内容输出与编辑。

五、业界首个高质量原生3D组件生成模型，来自腾讯混元

1. 腾讯混元3D团队推出业界首个原生3D组件生成模型Hunyuan3D-Part，包含P3-SAM（3D分割）和X-Part（组件生成）两大模块；

2. 该模型能生成高质量、可投入生产和结构合理的组件式3D内容，解决游戏制作与3D打印行业对可分解3D形状的需求；

3. 模型从语义特征和边界框检测到部件生成全流程优化，在PartObj-Tiny等多个基准上大幅超越现有工作，已开源且提供线上体验入口。

六、五部短片亮相釜山电影节，AI真的能「拍」好电影吗？

1. 香港动画公司ManyMany Creations制作的15分钟全AI短片《九宵》成功入选釜山国际电影节"未来影像"AI电影国际峰会；

2. 该峰会还展映了《权利游戏》《法体》等四部AI短片，这些作品不再只是技术展示，而是真正利用AI作为叙事手段，探讨女性♀️主义、"平庸之恶"等社会主题；

3. 博纳影业已成立国内首个AI制作中心，利用AI将电影制作周期从数年压缩至1.5-2年，并大幅降低成本。

七、 iOS 26.1 隐藏彩蛋，给 ChatGPT 们造了个新「C 口」

1. iOS 26.1、iPadOS 26.1和macOS Tahoe 26.1开发者测试版代码显示，苹果正在为App Intents引入MCP支持，将允许ChatGPT、Claude等AI模型直接与苹果设备应用交互；

2. MCP（模型上下文协议）由Anthropic提出，作为AI领域的"通用插口"，能让模型与外部服务安全对话，已被Notion、Google、Figma、OpenAI等采用；

3. 苹果不让每个应用单独支持MCP，而是构建系统级支持，既能利用行业生态，又能强制执行隐私安全标准，体现苹果从"全栈自研"向平台化的战略转变。

前沿科技

八、 Project Imaging-X，1000+开放医学影像数据集综述

1. 上海人工智能实验室等机构联合发起Project Imaging-X，系统梳理2000-2025年间1000+医学影像数据集，揭示医学数据"小而散、偏科严重"的格局；

2. 研究显示医学影像数据与通用视觉存在数量级差距，病理数据超过其他类型，而分类与分割任务占主导，CT和MRI为主要3D数据类型；

3. 项目提出元数据驱动融合范式(MDFP)，通过元数据统一、语义对齐、融合蓝图和索引共享四阶段流程，实现数据集整合，已开发交互式数据发现门户助力医学基础模型发展。

报告观点

九、红杉：AI的生产力悖论，仅5%公司正在从AI中获益

1. 红杉最新研究揭示"GenAI鸿沟"：仅5%公司从AI获得显著价值，95%因静态工具与流程脱节而未能受益，核心问题是AI系统"学不会、推不开、用不深"；

2. 研究指出企业AI失败的三大原因：AI工具缺乏从用户反馈中学习的能力；95%的定制AI方案未能从试点扩展至规模化部署；员工转而使用个人AI服务形成"影子AI经济"；

3. 22-25岁初级岗位已出现大规模替代，AI首先替代"书本知识"，专家经验成为新护城河；创业者应打造能学习的AI代理，深度融入企业后台流程，按结果收费，帮助客户跨越生产力J曲线。

👇加入AGI数据库，AI智能问答

腾讯研究院AI速递 20250928(腾讯研究院在哪儿)

猜你喜欢

金饰价格继续下调多家品牌降价促销(金饰价格继续下调)

我国5G工厂超8000家(中国5g工业)

如何选择2025高端户外移动厨房？智能化庭院露营全自动设备全解析

炽烈晶红恣意盛放全新纳西索·罗德里格斯女士馥郁淡香精耀目登场(炽炽烈烈怎么读)

CES 2026：AMD双线并进，以软硬件协同优化奠定Zen 5家族胜局(amd双通道性能提升多少)