生成式AI
一、 『英伟达』官宣向OpenAI投资1000亿美元💵!打造AI巨兽
1. 『英伟达』宣布与OpenAI建立战略合作关系,OpenAI将部署高达10吉瓦的『英伟达』系统,相当于400-500万块GPU算力;
2. 『英伟达』计划在系统部署期间向OpenAI累计投资高达1000亿美元💵,首阶段系统将于2026年下半年基于『英伟达』Vera Rubin平台投入运营;
3. 双方将共同优化模型及基础设施软件、硬件的技术路线图,以推动OpenAI实现通用人工智能使命,消息公布后『英伟达』股价上涨近4%。
二、 无问芯穹推出基础设施智能体蜂群,开启Agentic Infra
1. 无问芯穹发布基础设施智能体蜂群,通过多智能体协同架构覆盖模型筛选、资源运营、排障和集群运维等多个模块,实现基础设施全生命周期智能管理;
2. 该解决方案彻底改变传统IaaS→PaaS→MaaS→Agent应用间层层堆叠的生产模式,以智能体为自治核心构建高度协同系统,显著提升资源利用率和运维效率;
3. 通过与捏TA和Soul等客户合作,成功将迭代速度提升5倍,实现了运维能力百倍拓展,推动"AI基础设施范式"向"Agentic Infra"的转变。
三、 阿里开源原生多模态模型Qwen3-Omni,对标闭源强模型
1. 阿里通义开源原生全模态大模型Qwen3-Omni,能无缝处理文本、图像、音频和视频输入,支持实时流式响应并同时生成文本与语音输出;
2. 该模型在36项音频及音视频基准测试中获得32项开源SOTA与22项总体SOTA,超越Gemini-2.5-Pro等闭源强模型,支持119种文本语言、19种语音理解语言和10种语音生成语言;
3. 阿里同步开源Qwen3-TTS-Flash语音合成模型和Qwen-Image-Edit-2509图像编辑模型,前者支持17种音色、10种语言和多种方言,后者新增多图编辑和单图一致性增强功能。
四、 Kimi上线Agent会员服务,以前的打赏金额可全额返还
2. 会员服务采用音乐节拍命名:免费版为Adagio(慢板),付费版有49元的Andante(行板)和99元的Moderato(中速),海外还有199美元💵的Vivace;
五、 8B硬刚72B!多模态MiniCPM-V 4.5技术报告发布
1. 清华大学自然语言处理实验室和面壁智能发布MiniCPM-V 4.5技术报告,该模型以8B参数规模超越GPT-4o-latest和Qwen2.5-VL-72B等大型模型;
2. 模型采用三大创新技术:统一3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR知识学习范式、可控混合快速/深度思考的多模态强化学习;
3. MiniCPM-V 4.5在OpenCompass综合评测中取得77.0的平均分,推理效率极高,在VideoMME上时间开销仅为同级模型的1/10,已在HuggingFace和ModelScope两大平台累计下载超22万次。
六、 ima新版本,上线鸿蒙电脑版、AI播客生成速递更快了
1. ima推出最新版本,正式上线鸿蒙电脑版,至此实现鸿蒙系统手机、平板和电脑三端全覆盖,用户可在多设备间实现协同工作;
2. AI播客生成功能全面升级,采用分段生成技术支持"边生成边播放",大幅减少等待时间,提升用户体验;
3. 新版本的界面设计与之前版本略有不同,优化了整体使用流程,保留了核心功能特性。
前沿科技
七、 智元『机器人』️GO-1通用具身基座大模型全面开源!ViLLA架构
1. 智元『机器人』️开源通用具身基座大模型GO-1,采用全球首个Vision-Language-Latent-Action (ViLLA)架构,该架构通过引入隐式动作标记成功弥合图像-文本输入与『机器人』️执行动作间的语义鸿沟;
2. 模型采用三层协同设计:基于InternVL-2B构建的多模态理解层、隐式规划器和基于扩散模型的动作专家,虽仅基于AgiBot G1数据预训练,但已在松灵『机器人』️、方舟『机器人』️等不同本体和多种仿真环境中完成验证;
3. 智元『机器人』️同时推出Genie Studio一站式开发平台,为开发者提供全栈解决方案,包括数据采集、管理、模型训练、微调、评测与部署,同时支持LeRobot通用数据格式以适配其他『机器人』️平台。
报告观点
八、 从Transformer到GPT-5,OpenAI科学家的第一性思考
1. Transformer八人小组成员Lukasz Kaiser在OpenAI从事GPT-5和"o1"、"o3"推理模型研发,是唯一一位未创业继续坚守技术前线的"Transformer八子";
2. Kaiser早在2017年提出了"One Model To Learn Them All"概念,预见到大模型跨领域学习的潜力,并预言AI的下一阶段关键在于教会模型"思考";
3. 据Kaiser预测,未来AI计算力将从大规模预训练转向在少量高质量特定数据上进行海量推理计算,更接近人类智慧模式,预示着又一次范式转移。
九、 《心理学增强AI智能体》,Prompt的尽头居然是MBTI?
1. 一篇名为《心理学增强AI智能体》的论文提出"MBTI-in-Thoughts"技术,只需在提示词开头加上"请用INTJ的视角回答"等简单指令,就能显著提升模型表现;
2. 研究发现不同MBTI人格的AI在处理同一任务时表现差异明显:F型(情感型)更擅长写故事、煽情,E型(外向型)在幽默感和可读性上更强,T型(思考型)在策略游戏中更理性冷静;
3. 这种方法本质是对人格概念的"终极压缩",让AI瞬间解压人类思维模式、行为逻辑、语言风格的统计总和,可用于组建互补性格的"AI团队"以应对不同任务需求。
👇加入AGI数据库,AI智能问答