生成式AI
一、 几千人盲投Kimi K2超越DeepSeek拿下全球开源第一
1. Kimi K2在最新排名中超越DeepSeek成为全球开源模型第一,总榜排名第五,紧追顶尖闭源模型;
2. K2继承了DeepSeek V3架构并进行参数调整,包括增加专家数量、减半注意力头数、保留第一层Dense及专家无分组;
3. 全球TOP 10开源模型中唯二入选的均来自中国,“开源=性能弱”的印象正被打破。
二、 世界首个「实时、无限」扩散视频模型,Karpathy投资
1. Decart发布MirageLSD,首个实时(40毫秒延迟)、无时长限制的扩散视频模型,可处理任意视频流;
2. Karpathy成为天使投资人,预见其在实时电影制作、游戏开发和AR领域的广泛应用;
3. 技术突破在于实时流扩散(LSD)架构,通过逐帧生成和历史增强方法解决误差累积问题,但精细控制和几何稳定性仍需改进。
三、 Suno V4.5+核心升级,你的AI音乐终于能“私人定制”
1. Suno V4.5+版本提供人声与器乐分层生成与融合功能,用户可上传个人人声或伴奏进行AI辅助创作;
2. 新增“Inspire”模式允许用户上传3秒至8分钟的个人干声,AI学习演唱特点后创作符合个人声音气质的音乐;
3. 谱乐AI平台已同步上线Suno V4.5+核心生成能力,优化创作门槛并提升AI协作效率。
四、 腾讯元宝接入 QQ 音乐,新姿势让你秒变 “音乐指挥官”
1. 腾讯元宝App 2.30版本正式接入QQ音乐服务,实现“一句话搜歌、划线即播”功能,无需退出对话界面;
3. 用户体验包括无缝账号体系连接、多模态交互和创作辅助功能,体现AI助手从工具到伙伴的进化趋势。
五、 ChatGPT Agent 遭暴击,国产 AI 轮番「公开处刑」
1. OpenAI推出ChatGPT agent,面向Pro用户,但遭到Manus、Genspark等竞品公司的直接对比和批评;
2. ChatGPT agent整合了Deep Research、Operator和ChatGPT功能,能自动完成退休计划、购物清单等任务,但输出内容较为简陋;
3. 实测各有特色,Manus输出更美观,Minimax提供多种格式报告,Kimi内容详细且询问用户具体需求等。
六、 真实物理加持,UIUC华人让角色活起来不再像塑料人
1. PhysRig是UIUC与Stability AI提出的角色动画可微物理绑定框架,将刚性骨架嵌入弹性软体;
2. 通过MPM可微分物理模拟替代传统LBS,解决了体积丢失与变形伪影问题;
3. 在17类角色和120组动画测试中全面优于传统方法,支持跨物种动作迁移。
前沿科技
七、 OpenAI神秘新模型获IMO2025金牌!攻克奥数巅峰
1. OpenAI的神秘通用推理模型在IMO 2025中解出5道题目,获得35分,达到金牌水平;
2. 该模型具备持续数小时的深度创造性思维能力,远超以往AI的秒级或分钟级推理;
3. 这是通用强化学习突破而非特定任务训练的成果,模型不会被发布。
报告观点
八、 Claude Code 作者:最好的 AI 工具是把控制权还给你
1. 模型正飞速进化,最佳AI编程工具应是简单、通用的“乐高积木”,而非功能堆砌的复杂系统;
2. Claude Code创造者Boris Cherny主张将控制权还给用户,工具不应替你决定工作流,而是提供底层能力;
3. 有效工作流包括:先探索规划再由用户确认后编码、使用测试驱动开发、对照目标迭代改进。
九、 复盘 K2:为什么聚焦 Agent、开源和选择 DSV3 架构?
1. 聚焦Agent:预训练模型已含工具知识,只需激发能力,智能上限由模型决定,非靠Claude搭建的Agent产品;
2. 开源:提升知名度、获取社区贡献,防止用技术捷径粉饰效果,倒逼模型真正进步;
3. 选择DSV3架构:实验证明自研结构无法胜过DSV3,资源有限下避免引入无效变量,仅调整参数降低成本。
十、 OpenAI 多智能体负责人:当下许多AI产品将被所取代
1. 为什么构建的产品未遵循Scaling Law:许多人构建的辅助工具与路由系统最终会被扩展模型取代,真正遵循扩展法则的方向是直接提高模型能力;
2. 模型数据效率低于人类:当前AI模型学习数据效率远低于人类,算法改进比简单扩大数据规模更重要,将来会先遇到数据瓶颈而非计算瓶颈;
3. 多智能体研究新方向:不仅研究多智能体互动,还研究如何让模型从15分钟推理扩展到数小时甚至数天,建立AI”文明”而非单纯扩大单个模型。
👇加入AGI数据库,AI智能问答