生成式AI
一、 特朗普签署「AI行动计划」,万亿美金押注全球AI霸权
1. 特朗普签署《AI行动计划》,以三大支柱(AI创新、基础设施、国际外交)为框架,推出90多项行政令;
2. 政府计划放松AI监管,大力推广开源模型,加速数据中心建设,重振美国半导体制造业;
3. 美国将输出全栈AI技术给盟友,同时加强对算力出口的管控,旨在确立全球AI霸主地位。
二、 Lovable 正式推出下一代AI编程产品「Lovable Agent」
1. Lovable仅用35人团队8个月实现1亿美元年收入,增长速度超越OpenAI等软件公司;
2. 新发布的"Lovable Agent"将错误率降低91%,能像真实开发者一样分解问题、迭代修复;
3. Lovable定位不是面向程序员,而是帮助"不会写代码的人"通过自然语言描述构建完整应用程序。
三、 字节发布端到端同声传译模型 Seed LiveInterpret 2.0
1.字节发布Seed LiveInterpret 2.0,准确率接近人类水平的端到端中英同声传译;
2.模型实现"边听边说"能力,翻译延迟仅2-3秒,较传统系统降低超60%,准确率在复杂场景中超70%;
3.支持零样本声音复刻,能实时提取说话人音色特质,智能平衡翻译质量、延迟和语音输出节奏。
四、 Higgs Audio V2!1000万小时数据炼成能听会说神器
1. 李沐团队开源Higgs Audio V2语音大模型,基于1000万小时音频数据训练,支持文本理解和语音生成;
2. 模型具备多说话人对话生成、自动韵律调整、零样本语音克隆、歌声合成和实时语音交互能力;
3. 核心技术创新包括自动化标注系统、统一音频分词器和DualFFN架构,在EmergentTTS-Eval等评测中表现领先。
五、 全球首个罕见病推理型智能体诊断系统DeepRare发布
1. DeepRare是全球首个罕见病推理型智能体诊断系统,通过多智能体架构模拟医生诊断思维路径;
2. 系统实现平均Recall@1达57.18%,比最优方法提升23.79%,在某些数据集准确率高达70%;
3. DeepRare支持多模态输入,具备主动提问、自我反思能力,所有诊断建议附带可溯源证据链条。
六、 谷歌Aeneas 穿越千年,填补人类缺失的历史,Nature重磅
1. Google DeepMind团队开发的多模态AI模型Aeneas能协助解读公元前7世纪至公元8世纪的拉丁铭文;
2. Aeneas不仅能预测未知长度的缺失文本,还能进行铭文断代、地理定位,平均误差仅13年;
3. 90%的历史学者认为Aeneas检索的平行文本有研究价值,该技术有望扩展到其他语言和时期的历史文献。
前沿科技
七、 自有品牌+第三方孵化?影石创新宣布进军无人机市场
1. DeepRare是全球首个罕见病推理型智能体诊断系统,通过多智能体架构模拟医生诊断思维路径;
2. 系统实现平均Recall@1达57.18%,比最优方法提升23.79%,在某些数据集准确率高达70%;
3. DeepRare支持多模态输入,具备主动提问、自我反思能力,所有诊断建议附带可溯源证据链条。
八、 vivo自研蓝河操作系统内核开源,适用嵌入式和移动设备
1. vivo开源自研蓝河操作系统内核,首个适用于嵌入式和移动设备的全栈Rust内核;
2. 蓝河内核以Rust语言编写,从源头解决了内存安全问题,具备轻量化(最小内核堆内存仅13KB)和通用性(支持ARM、RISC-V架构);
3. 旨在推动国产Rust生态发展,满足AI时代对底层系统的更高要求,开发者提供创新平台。
报告观点
九、 微软 CEO:AI 最终应推动GDP,而非看起来有多聪明
1.微软CEO Nadella认为AI的最终归宿是推动社会、行业和国家GDP增长,而非仅是技术展示;
2.Nadella将医疗、教育和生产力视为AI释放价值的三大主战场,强调AI必须创造社会盈余才能证明其能源消耗的正当性;
3.他指出AI成功的关键在于构建记忆系统、工具调用和权限系统,并认为系统软件正进入黄金时代,产品集成能力将决定应用突破。
十、 奥特曼谈GPT-5首次体验,那一刻就像看到原子弹爆炸
1.奥特曼首次体验GPT-5后震撼至瘫坐,称自己感到"毫无用处",如同见证了划时代技术革命;
2.他提出乌托邦设想:未来可能为每人提供免费全天候GPT-5,并将全球8万亿AI token平均分给80亿人;
3.奥特曼认为AI正引发第三次界面革命,将从根本改变计算方式,并预言自己的孩子不会上大学,因教育方式将完全不同。
👇加入AGI数据库,AI智能问答