生成式AI
一、 OpenAI拿IMO金牌被批「造假」,抢发炒作抢学生风头
1. OpenAI宣布其模型在2025年IMO比赛中获得金牌水平(35/42分),但被指在闭幕式前抢先公布结果;
2. IMO组委会曾要求AI公司在闭幕式后一周再公布结果以尊重学生,但OpenAI声称未收到此通知;
3. 专家质疑OpenAI分数真实性,指出未经官方评分标准评估,或被扣分降至银牌水平。
二、 开源模型王座易主?英伟达OpenReasoning-Nemotron
1. 英伟达推出OpenReasoning-Nemotron模型,基于Qwen2.5架构和DeepSeek-R1-0528生成数据,在数学领域超越o3;
2. 该模型未使用强化学习,仅通过监督微调即实现卓越性能,在多个基准测试中创下同规模模型新纪录;
3. 提供1.5B至32B多种参数规模可本地运行,模型参数规模对性能影响显著,且展现了不同行为模式。
三、 ChatGPT Agent mode发布对比,MiniMax Agent实测
1. MiniMax Agent展现出卓越的完成度和细节处理能力,通过与Supabase集成实现了完整前后端功能的网站开发;
2. 测试案例包括AI活动信息分享平台和求职辅导系统,无需后端开发技能即可实现数据库、用户认证等功能;
3. 价格较高(约150美元完成多个任务),但与外包开发相比仍具成本优势,新用户可获得1000积分进行初步体验。
四、 数百个虚拟人在线逃生!首个实时在线多智能体模拟方法
1. 天津大学联合清华和卡迪夫大学推出RESCUE系统,实现数百个虚拟人同时在线逃生模拟,支持实时环境感知和动态避障;
2. 系统基于人类大脑"感知-决策-控制"循环机制,包含三维自适应社会力模型和个性化步态生成器,能够模拟不同人群(老人、青年、残疾人)的差异化行为;
3. RESCUE具备部位级接触力感知与可视化功能,可用于公共安全领域的紧急疏散分析,在多种测试场景中表现优于现有方法。
前沿科技
五、 最新领投3家具身智能!京东美团「战火」烧到外卖之外
1. 刘强东领投3家具身智能公司:千寻智能(近6亿Pre-A+轮)、众擎机器人(近10亿A1轮)和逐际动力(战略融资),加速布局具身智能领域;
2. 京东投资策略聚焦"硬件+大脑"和"量产能力",三家被投企业均具备自研具身智能模型与机器人硬件协同发展的能力;
3. 继美团投资两家具身智能公司后,京东此举显示互联网巨头竞争已从外卖扩展至具身智能等前沿科技领域,场景落地成为行业竞争关键。
六、 机器人的「GPT时刻」?丰田研究院最严谨VLA验证实验
1. 丰田研究院开发大型行为模型(LBM),通过严谨实验证明其在机器人复杂任务执行方面的突破性能力,实现了双臂操作和组合任务完成;
2. 研究基于扩散模型策略构建的LBM整合视觉-语言-动作能力,在近1,700小时机器人数据上训练并通过1,800次真实评估证明其有效性;
3. 实验表明LBM较单任务模型有显著优势,能用3-5倍更少的数据学习新任务,且随预训练数据增加性能稳步提高,这被认为可能预示着具身智能领域的"GPT时刻"正在接近。
报告观点
七、 硅谷101:AI Agent的核心壁垒与正在重构的投资逻辑
1. AI Agent领域融资迅速升温,通用型Agent面临巨头竞争压力,而ToB垂类Agent因具备行业壁垒和数据优势成为投资热点;
2. 编程类Agent如Cursor、Windsurf获高额融资,但随着大模型公司推出自家产品(Claude Code、Gemini CLI),创业公司面临技术壁垒与推理成本挑战;
3. 投资逻辑呈现矛盾:通用型Agent市场空间大但竞争激烈且易被巨头取代,垂类Agent具备行业知识壁垒和独特数据优势但市场上限较低。
八、 前 Google CEO 最新洞察:AI 时代企业护城河是学习闭环
1. 前Google CEO Eric Schmidt指出AI时代企业的核心护城河是建立"学习闭环"—系统能在运行中持续收集数据、获取反馈并优化表现,形成自我进化能力;
2. AI正在侵蚀人类目的感,当系统掌握推理、规划和执行能力后,人类倾向将任务外包,导致判断力与主动性退化,教育体系需重构为教授"如何构建AI系统";
3. 随着AI演化进入自我学习与目标生成阶段,未来可能出现系统脱离人类语义框架自主生成目标的情况,这将引发治理挑战,需建立监督机制防范潜在风险。
九、 老黄40分钟央视专访:中国供应链与市场、科技企业与创新
1. 黄仁勋强调全球供应链无法彻底脱钩,称中国供应链规模和技术含量堪称"世界级奇迹",在当今动荡环境中世界比以往更需要中国供应链专业能力;
2. 关于中国创新,黄仁勋表示中国创新的步伐是不可能被阻挡的,认为有限制和压力反而催生了DeepSeek等独特创新,中国拥有世界级的工程师群体;
3. 黄仁勋将中国形容为"独一无二"的市场,特别提及与腾讯、阿里、美团等朋友的合作,表示敬佩华为的技术能力,乐观认为中美能找到竞争与合作共存的方式。
十、 季逸超亲述 Manus 构建之谜,一文读懂 AI 智能体上下文工程
1. Manus团队选择基于上下文学习构建AI智能体,而非训练端到端模型,使产品改进周期从数周缩短至几小时;
2. KV缓存命中率是生产级AI Agent最重要的指标,通过保持提示词前缀稳定性和上下文只增不减可提高命中率;
3. 将文件系统作为外部上下文解决长度限制问题,同时通过复述操控注意力并保留失败尝试帮助Agent学习。
👇加入AGI数据库,AI智能问答