生成式AI
一、 ChatGPT新功能Pulse览版,GPT-5主动给你推消息
1. OpenAI推出ChatGPT新功能"Pulse"预览版,首先向Pro用户开放,每晚根据用户聊天记录和反馈提供个性化内容推送;
2. 该功能是基于智能体(Agent)开发的,能主动进行异步搜索,支持链接Gmail和Google日历以提供更相关建议;
3. Pulse通过主题卡片形式呈现内容,用户可以点赞或踩赞提供反馈,奥特曼称这是"将ChatGPT从完全被动转变为主动,提供高度个性化服务"的第一步。
二、 『明星』️创业公司Thinking Machines,第二篇研究论文出炉
1. 估值840亿元的Thinking Machines发布第二篇研究论文"Modular Manifolds",通过让网络的不同层在统一框架下进行约束和优化,提升训练稳定性和效率;
2. 研究者Jeremy Bernstein提出模块化流形方法,解决神经网络训练中权重数值过大或过小导致的不稳定问题,并提供详细的理论分析与实验验证;
3. 公司创始人Mira Murati与翁荔等纷纷转发支持,此前该公司已发布了首篇研究《Defeating Nondeterminism in LLM Inference》,专注解决大模型推理中的不确定性问题。
三、 谷歌发布Gemini Robotics 1.5,让『机器人』️学会「思考」
1. 谷歌DeepMind发布针对『机器人』️和具身智能的Gemini Robotics 1.5系列家族模型,包括Gemini Robotics 1.5和Gemini Robotics-ER 1.5两款模型;
2. Gemini Robotics 1.5是最先进的视觉-语言-行动模型,能将视觉信息和指令转化为『机器人』️动作;Gemini Robotics-ER 1.5是最强大的视觉-语言模型,能推理物理世界并创建多步骤计划;
3. 两款模型协同工作,可让『机器人』️执行垃圾分类、行李打包等复杂任务,支持"思考后行动",实现跨不同『机器人』️形态的技能迁移与泛化学习。
四、 实测Kimi全新Agent模型「OK Computer」,很OK
1. Kimi推出全新Agent模型"OK Computer",依托Kimi K2,能完成网站搭建、PPT制作和百万行数据处理等复杂任务;
2. 模型操作时会列出Todo List进度表,自主完成网页搜索、素材生成、代码编写与检查,最终输出可交互、可复用的结果;
3. 设计类任务能自主规划并实现各模块功能,分析类任务能自动搜集数据并提供可视化图表,生成类任务支持多种内容输出与编辑。
五、 业界首个高质量原生3D组件生成模型,来自腾讯混元
1. 腾讯混元3D团队推出业界首个原生3D组件生成模型Hunyuan3D-Part,包含P3-SAM(3D分割)和X-Part(组件生成)两大模块;
2. 该模型能生成高质量、可投入生产和结构合理的组件式3D内容,解决游戏制作与3D打印行业对可分解3D形状的需求;
3. 模型从语义特征和边界框检测到部件生成全流程优化,在PartObj-Tiny等多个基准上大幅超越现有工作,已开源且提供线上体验入口。
六、 五部短片亮相釜山电影节,AI真的能「拍」好电影吗?
1. 香港动画公司ManyMany Creations制作的15分钟全AI短片《九宵》成功入选釜山国际电影节"未来影像"AI电影国际峰会;
2. 该峰会还展映了《权利游戏》《法体》等四部AI短片,这些作品不再只是技术展示,而是真正利用AI作为叙事手段,探讨女性♀️主义、"平庸之恶"等社会主题;
3. 博纳影业已成立国内首个AI制作中心,利用AI将电影制作周期从数年压缩至1.5-2年,并大幅降低成本。
七、 iOS 26.1 隐藏彩蛋,给 ChatGPT 们造了个新「C 口」
1. iOS 26.1、iPadOS 26.1和macOS Tahoe 26.1开发者测试版代码显示,苹果正在为App Intents引入MCP支持,将允许ChatGPT、Claude等AI模型直接与苹果设备应用交互;
2. MCP(模型上下文协议)由Anthropic提出,作为AI领域的"通用插口",能让模型与外部服务安全对话,已被Notion、Google、Figma、OpenAI等采用;
3. 苹果不让每个应用单独支持MCP,而是构建系统级支持,既能利用行业生态,又能强制执行隐私安全标准,体现苹果从"全栈自研"向平台化的战略转变。
前沿科技
八、 Project Imaging-X,1000+开放医学影像数据集综述
1. 上海人工智能实验室等机构联合发起Project Imaging-X,系统梳理2000-2025年间1000+医学影像数据集,揭示医学数据"小而散、偏科严重"的格局;
2. 研究显示医学影像数据与通用视觉存在数量级差距,病理数据超过其他类型,而分类与分割任务占主导,CT和MRI为主要3D数据类型;
3. 项目提出元数据驱动融合范式(MDFP),通过元数据统一、语义对齐、融合蓝图和索引共享四阶段流程,实现数据集整合,已开发交互式数据发现门户助力医学基础模型发展。
报告观点
九、 红杉:AI的生产力悖论,仅5%公司正在从AI中获益
1. 红杉最新研究揭示"GenAI鸿沟":仅5%公司从AI获得显著价值,95%因静态工具与流程脱节而未能受益,核心问题是AI系统"学不会、推不开、用不深";
2. 研究指出企业AI失败的三大原因:AI工具缺乏从用户反馈中学习的能力;95%的定制AI方案未能从试点扩展至规模化部署;员工转而使用个人AI服务形成"影子AI经济";
3. 22-25岁初级岗位已出现大规模替代,AI首先替代"书本知识",专家经验成为新护城河;创业者应打造能学习的AI代理,深度融入企业后台流程,按结果收费,帮助客户跨越生产力J曲线。
👇加入AGI数据库,AI智能问答