腾讯研究院AI速递 20250516

生成式AI

一、 5090将被定位?美或强制植入「地理追踪」锁定高端GPU

1. 美参议员提出法案要求『英伟达』、AMD等厂商在高端GPU和AI『芯片』中植入地理追踪功能,6个月后生效;

2. 管制范围包括AI处理器、高性能『服务器』及RTX 5090等高端显卡,目的是防止战略硬件流入未授权国家;

3. 『芯片』厂商需承担产品追踪责任,法案还要求进行为期三年的年度评估,或将实施更多限制措施。

二、 GPT-4.1正式在ChatGPT中上线,但暂时没有1M上下文

1. OpenAI在ChatGPT中正式上线GPT-4.1模型,Plus、Pro和Team用户可直接使用,企业版和教育版用户将在未来几周获得访问权限;

2. GPT-4.1在编码任务和指令遵循方面表现优异,生成速度显著提升,是o3和o4-mini的理想替代品;

3. ChatGPT版本的GPT-4.1上下文窗口仅为128k token,未能实现API版本中承诺的100万token长度,引发用户失望。

三、 Anthropic新版Claude Sonnet和Opus也在路上,可极限推理

1. Anthropic将在未来几周推出新版Claude Sonnet和Opus,最大亮点是"极限推理"功能,能在推理和工具使用间建立动态循环;

2. 新模型能够自主暂停、重新评估问题并调整策略,在代码生成任务中可自动测试和修正错误;

3. 消息称确实有个正在测试、代号为Neptune的新模型,最大支持128k tokens上下文长度。

四、 超越OpenAI、ElevenLabs?MiniMax新一代人格化语音模型

1. MiniMax新一代语音模型Speech-02在Artificial Analysis榜单上超越OpenAI和ElevenLabs,在字错率和说话人相似度等指标上达到SOTA水平;

2. Speech-02实现了真正的零样本语音克隆,并采用创新的Flow-VAE架构,只需几秒音频即可高度还原说话人音色、语调和节奏;

3. 该模型支持32种语言,可实现任意音色灵活控制和情感调节,成本仅为ElevenLabs竞品的1/4,标志着AI语音进入人格化时代。

五、 腾讯元宝插件上线『Chrome』:支持划词提问 外文网页翻译

1. 腾讯元宝浏览器插件在『Chrome』应用商店上线,支持网页划词提问、内容总结、外文网页翻译和一键收藏等功能;

2. 插件在页面右侧设有悬浮球和侧边栏,方便用户进行截图提问、上传文件和搜索内容,更高效的浏览网页时处理信息;

3. 该插件基于腾讯混元与『DeepSeek』大模型,目前仅在『Chrome』可用,更多版本将推出。

六、 Stability AI加入音频赛道,联手Arm推出最快手机端免云模型

1. Stability AI与Arm合作推出Stable Audio Open Small音频生成模型,可在手机端离线运行,8秒内生成11秒音频,是目前最快的音频生成模型;

2. 该模型拥有3.41亿参数,专为生成短音频和音效设计,训练数据来自免版权©️的Free Music Archive和Freesound,但仅支持英文提示;

3. 模型对年收入低于100万美元💵的用户免费开放,但有一定局限性,如无法生成逼真人声和高质量歌曲,且在不同音乐类型表现不均衡。

七、 阿里Wan2.1-VACE开源视频生成模型,消费级显卡可玩

1. 阿里开源Wan2.1-VACE视频生成与编辑统一模型,支持文生视频、图像参考生成、重绘、局部编辑等6大任务,可实现多任务组合;

2. 模型分为1.3B(支持480P、可用消费级显卡)和14B版本(支持720P),采用创新的视频条件单元VCU统一四大输入形态;

3. 该模型可一次性完成画幅扩展、时长延展和图像参考等多项任务,如将静态图扩展为动态视频,GitHub获得1.1万star。

八、 腾讯混元在《碧优蒂的世界》打造智能NPC,图像2.0将上线

1. 腾讯混元大模型为《碧优蒂的世界》(BUD)打造智能NPC系统,支持自主行动、个性化交互、情感表达和记忆推理等功能;

2. BUD利用腾讯混元角色扮演专属模型和Turbo S快思考模型,实现NPC与玩家的立体互动,3个月内AI对话数超两千万次;

3. 游戏通过Dify无代码开发和腾讯云向量数据库支持,大幅缩短开发周期; 同时官方宣布混元图像2.0将于5月16日发布,持续强化AI产品矩阵。

前沿科技

九、 DeepMind的AlphaEvolve突破数学极限,陶哲轩合作参

1. DeepMind发布基于Gemini驱动的AlphaEvolve智能体,能够演化整个代码库,实现算法发现和优化,陶哲轩参与合作探索其数学应用;

2. AlphaEvolve通过"生成-评估-进化"循环机制工作,结合LLM创造力与自动评估系统,显著减少了AI幻觉问题;

3. 该系统已应用于优化今日霍州『数据中心』效率(提升0.7%),改进TPU『芯片』设计;并在矩阵乘法等数学难题上取得突破,在75%的开放性数学问题上重现最优解。

报告观点

十、 红杉美国详解“万亿美元💵AI机遇”:如何赢得应用层战争?

1. 红杉资本认为AI正同时颠覆软件和服务两大盈利池,应用层是最大价值所在,95%的AI创业与传统创业无异,关键是解决真实问题和组建优秀团队;

2. 智能体经济正在形成,AI系统不仅传递信息,还能进行交易、追踪关系、建立信任,最终将形成人机深度协同的嵌套经济网络;

3. 行业面临三大技术挑战:智能体的持久身份认证、无缝通信协议构建和安全性保障,未来将进入"高杠杆、低确定性"的新时代。

????加入ima知识库,AI智能问答

特别声明:[腾讯研究院AI速递 20250516] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

被传隐婚生子1个月后,37岁『朱一龙』近况曝光,『刘诗诗』那番话没说错(隐婚生子 小花)

2018年,《镇魂》中,『朱一龙』一人分饰三角,成功演绎出性格迥异、状态各异的多个角色,这也让他从默默无闻的演员,一跃成为观众瞩目的焦点。『刘诗诗』以不被角色定义而著称,而『朱一龙』也用自己的实际行动,做到了这一点。演员…

被传隐婚生子1个月后,37岁『朱一龙』近况曝光,『刘诗诗』那番话没说错(隐婚生子 小花)

阑尾在左侧还是右侧(阑尾在左侧还是右侧哪个位置?)

阑尾通常位于人体右侧下腹部,是盲肠末端的一段细长管状结构。多数人的阑尾根部连接于盲肠后内侧壁,体表投影点约在右侧髂前上棘与脐连线的中外三分之一处。 从解剖学角度看,阑尾位置存在典型变异

阑尾在左侧还是右侧(阑尾在左侧还是右侧哪个位置?)

“抽动秽语症”知晓度低下,《妥瑞氏与我》原型患者因冒犯言语发文致歉

过去在戛纳金棕榈获奖影片《方形》和韩剧《没关系,是爱情啊》里也有对妥瑞氏患者的刻画,但以妥瑞氏患者为主人公的影片,这还是第一部。典礼的主持人艾伦·卡明(Alan Cumming)也在舞台上为嘉宾和看直播的观众…

“抽动秽语症”知晓度低下,《<strong>妥瑞氏与我</strong>》原型患者因冒犯言语发文致歉

手机应用权限设置指南(上):守住隐私的“三道防线”(手机应用权限管理)

在移动『互联网』时代,APP权限就像是你家的钥匙。问自己三个问题:一个手电筒APP需要通讯录权限吗?大多数现代APP在权限被拒后,依然能保留核心功能,只是无法使用特定增值服务。选择“仅使用期间”,当你关闭APP,…

手机应用权限设置指南(上):守住隐私的“三道防线”(手机应用权限管理)

解惑哪里有提供实物三维建模服务的机构,费用怎么收费(哪里有需要帮助)

品牌与口碑 在众多的实物三维建模服务企业中,品牌和口碑是重要的参考因素。 资质与认证:选择具有相关资质和认证的企业,如质量管理体系认证、环境管理体系认证等,这些认证能够保证企业的服务质量和管理水平。其在…

解惑哪里有提供实物三维建模服务的机构,费用怎么收费(哪里有需要帮助)