生成式AI
一、 『英伟达』下一代GPU登场,Rubin CPX一次推理数百万Token
1. 『英伟达』推出专为长上下文推理设计的Rubin CPX GPU,能一次性在数百万token范围内推理,支持软件开发、视频生成等长上下文任务;
2. 该GPU将与NVIDIA Vera CPU和Rubin GPU搭配组成Vera Rubin NVL144 CPX平台,单机架提供8 exaflops AI算力,是GB300 NVL72系统的7.5倍;
3. 系统配备100TB高速内存和1.7 PB/s内存带宽,预计2026年底上市,将为长上下文任务带来前所未有的性能与效率提升。
二、 Claude 发布更新,可以直接生成EXCEL、PPT和PDF等文件
1. Claude推出重磅更新,可直接创建和编辑Excel表格、Word文档、PPT幻灯片和PDF文件,并输出真正可用的文件格式;
2. 系统为Claude配备私有计算环境,能写代码运行程序生成各类文档,支持高级数据分析、图像视频处理、各类文件操作和跨格式转换;
3. 该功能已向Max、Team和Enterprise用户开放,Pro用户需等待几周,功能开启后可上传文件或描述需求,Claude在后台完成操作并支持导出或保存到Google Drive。
三、 腾讯版「Claude Code」来了!AI编程的L4时代is coming
1. 腾讯发布AI CLI工具CodeBuddy Code并开放CodeBuddy IDE公测,国内版支持无限制使用『DeepSeek』模型,开创全面支持插件、IDE和CLI三种形态的AI编程工具矩阵;
2. 系统定位专业『工程师』用CLI Agent,通过自然语言驱动整个开发运维生命周期,支持多智能体协作、长期记忆与上下文压缩,与Git/CI/CD深度集成;
3. AI编程正向L4级AI软件『工程师』演进,CLI成为下一代AI编程底层基础设施,内部使用显示编码时间缩短40%以上,AI代码评审贡献从12%增至35%。
四、 快手AI超级员工上线!一句话短视频,从文案到发布一条龙
1. 快手推出AIGC超级员工Kwali,能通过一句话生成完整短视频,自动完成脚本、拍摄、剪辑到发布全流程,目前正在内测;
2. 系统由多Agent框架驱动,包括意图解析、脚本生成、镜头匹配和剪辑合成四大Agent,并接入千寻素材库与数字人模特库,支持私有素材拖入;
3. Kwali将所有元素拆成可独立操控节点挂在时间轴上,支持实时预览和单独操作,使原本需要多团队分工完成的视频制作变为几分钟内可完成的简易任务。
五、 Fellou实现交互/任务/记忆三连通,重新定义AI时代生产力
1. Fellou CE创建了"无割裂的连续体体验",实现交互连续(人类与AI与浏览器间自然交互)、任务连续(自动分解大目标为子任务)和记忆连续(统一记忆层关联交互历史);
2. 系统支持跨应用自主执行、多模态转换和动态工作流编排,成功应用于旅行规划、内容创作和投资报告等场景,在Halluminate's Web Bench benchmark测试中取得72%成功率;
3. Fellou CE推出"深度搜索"与"可视化报告生成"核心功能免费开放,同时引入任务可定时、任务可干预和知识可编辑特性,全面提升用户掌控感和生产力体验。
六、 腾讯混元生图模型升级2.1版本开源,支持写字、2k分辨率
1. 腾讯发布开源文生图模型"混元图像2.1",支持原生2K生图,在复杂语义理解、跨领域泛化和文字生成方面达到业界领先水平;
2. 模型支持最长1000个tokens的提示词,能精准生成场景细节、人物表情和动作,实现多物体分别描述与文字精细控制,支持真人、漫画与搪胶手办等丰富风格;
3. 混元图像2.1采用32倍超高压缩倍率VAE,配备MLLM模块和ByT5模型双文本编码器,解决平均流模型训练稳定性问题,将推理步数由100步蒸馏至8步。
前沿科技
七、 谷歌一个帮助科研人员编写「专家级」科研软件的 AI 系统
1. 谷歌发布可帮助科研人员编写"专家级"科研软件的AI系统,结合『大语言模型』和树搜索算法,能自动编写和优化科研任务所需软件程序;
2. 系统不是简单代码生成,而是作为搜索过程中的"变异"引擎,整合并重组科学文献中的研究思路,形成全新解决方案;
3. 在基因组学、地理空间分析、神经科学等多个领域表现出色,其发现的方法经常超越学术界最新发表的研究成果,标志着科研软件从"一次性代码生成"走向"可量化科学目标导向"的软件进化。
报告观点
八、 a16z圆桌:平台迁移,改变的是人与计算交互的抽象层次
1. a16z合作伙伴与Box CEO、前微软高管认为,Agent不是万能体,而是多Agent组成的系统,每个在特定任务成为专家,未来Agent趋向微服务化与领域专精;
2. 专家正成为AI最大受益者,可获得10倍的生产力提升,不是提升产出而是改变工作性质,解放开发者处理平台琐事,但非专家使用价值有限;
3. 每次平台转型都改变人与计算交互的抽象层,AI带来工作流本身革命性变化,可能出现数千个垂直场景创业机会,应用企业仍具领域数据和执行力优势。
九、 马斯克最新访谈:星链手机2年后上市,25年内火星移民
1. 马斯克透露Optimus 3人形『机器人』️将拥有接近人类的手部灵巧性,成本约2万美元💵,难点主要在硬件设计,尤其是手和前臂;
2. 特斯拉AI5『芯片』将较AI4实现40倍性能飞跃,年底软件升级可使特斯拉汽车展现"意识";星链手机有望2年后上市,不排除收购Verizon可能;
3. 第三代星舰运载能力将超100吨,明年有望实现完全可重复使用;预计最快25年内人类能在火星实现自给自足移民,无需依赖地球补给。
👇加入AGI数据库,AI智能问答