豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门” | 投研报告

豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门” | 投研报告

华鑫证券近日发布计算机行业周报:豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门”。

以下为研究报告摘要:

算力:恒源云13核+128G算力紧张

本周恒源云13核+128G算力紧张。具体来看,显卡配置为A100-40G中,腾讯云16核+96G价格为28.64元/时,阿里云12核+94GiB价格为31.58元/时;显卡配置为A100-80G中,恒源云13核+128G算力紧张;阿里云16核+125GiB价格为34.74元/时;显卡配置为A800-80G中,恒源云16+256G价格为9.00元/时。

AI应用:豆包团队发布最新实时语音大模型和大模型1.5Pro版本

1月20日,字节跳动旗下的豆包团队正式发布了豆包实时语音大模型,这是一款语音理解和生成一体化的模型,实现了端到端的语音对话。与传统的级联模式相比,该模型在语音表现力、控制力、情绪承接方面表现出色,具备低时延、对话中可随时打断等特性。这些特性使得模型在实际应用中更加灵活和高效,能够更好地满足用户在不同场景下的需求。在架构方面,豆包团队研发了端到端的框架,深度融合语音与文本模态,面向语音生成和理解进行统一联合建模,实现多模态输入和输出效果。模型支持多种模式,包括语音到语音(S2S)、语音到文本(S2T)、文本到语音(T2S)、文本到文本(T2T)等。在声音控制方面,模型不仅能依照基础指令输出,还可遵循复杂的指令,展现出较强的声音控制能力。在声音扮演方面,模型能够模仿多种方言和口音。

此外,豆包实时语音大模型还支持实时联网功能,能够根据问题动态获取最新信息,确保问题回答的时效性。从测评结果来看,豆包实时语音大模型在情绪理解和情感表达方面具有显著优势。在整体满意度方面,豆包实时语音大模型的评分为4.36,而GPT-4o的评分为3.18。目前,豆包App全新实时语音通话功能已全量上线。

2025年1月22日豆包大模型1.5Pro版本正式发布。模型使用MoE架构,并通过训练-推理一体化设计,追求模型性能和推理性能的平衡。Doubao-1.5-pro仅用较小激活参数,即可超过一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。具体亮点如下:

1)综合能力领先:豆包大模型1.5Pro在知识(MMLU_PRO、GPQA)、代码(McEval、FullStackBench)、推理(DROP)、中文(CMMLU、C-Eval)等多项公开测评基准上成绩全球领先。

2)高效模型结构和超低成本:豆包大模型1.5Pro使用较小的激活参数进行预训练,训练成本极低的同时保持性能优越,采用大规模稀疏MoE架构,等效7倍激活参数的Dense模型性能,远超业内MoE架构约3倍杠杆的常规效率;凭借自研服务器集群方案,灵活支持低成本芯片,硬件成本比行业方案大幅度降低;自研网卡和网络协议,显著优化小包通讯效率,算子层计算与通信的高效交叠,保证了多机分布式推理的稳定和高效;通过精细量化和PD分离等方案,灵活使用算力和多任务混合调度,实现更高效算力利用。

3)多模态能力全面提升:视觉方面,相比于上一版本,Doubao-1.5-pro在多模态数据合成、动态分辨率、多模态对齐、混合训练上进行了全面的技术提升,进一步增强了模型在视觉推理、文字文档识别、细粒度信息理解、指令遵循等方面的能力,并让模型的回复模式变得更加精简、友好;在语音多模态上,提出新的Speech2Speech的端到端框架,不仅通过原生方法将语音和文本模态进行深度融合,同时实现了语音对话中真正意义上的语音理解生成端到端,相比传统的ASR+LLM+TTS的级联方式,在对话效果上有质的飞跃。4)更强的深度思考能力:基于豆包1.5基座模型,通过RL算法的突破和工程优化,在未使用其他模型数据的情况下,研发豆包深度思考模型。阶段性进展Doubao-1.5-Pro-AS1-Preview在AIME上已取得了业内领先的成绩。

jrhz.info

值得关注的是,豆包在所有模型训练过程中未使用任何其他模型生成的数据。豆包大模型构建自主的数据生产体系,以标注团队与模型self play技术相结合,高效优化数据质量,提升数据标注多样性和难度,确保数据来源的独立性和可靠性。

AI融资动向:美国政府与OpenAI、软银、甲骨文联合启动“星际之门”项目,四年内计划投资额达5000亿美元

美国政府与OpenAI、软银、甲骨文联合启动“星际之门”项目,四年内计划投资额达5000亿美元。北京时间1月22日,美国新任总统特朗普宣布,将与OpenAI、甲骨文和软银合作,共同投资5000亿美元用于支持美国的人工智能基础设施建设,该项目名为“星际之门”(Stargate)。按照计划,“星际之门”项目参与各方将成立合资公司,初期投资为1000亿美元,未来四年内总投资额可能高达5000亿美元。甲骨文联合创始人拉里·埃里森表示,首个合作项目将安排在美国得克萨斯州建设数据中心,相关工作已经启动。OpenAI表示,该项目不仅将支持美国的再工业化,还将为保护美国及其盟友的国家安全提供战略支持。根据OpenAI的声明,孙正义将担任合资公司的董事会主席,软银和OpenAI是该项目的主要合作伙伴,软银负责资金支持,OpenAI负责运营管理。而半导体公司Arm、微软、英伟达、甲骨文以及OpenAI将成为关键技术合作伙伴。

投资建议

1月27日,苹果App Store中国区免费榜显示,DeepSeek成为中国区第一,成为国产大模型弯道超车的里程碑事件。DeepSeek R1没有使用业内普遍使用的监督微调(SFT)训练范式,而是直接通过强化学习让模型自主进化出复杂的推理能力,包括反思和长链思考等能力。与OpenAI的o1相比,DeepSeek模型的百万token输入成本从15美元锐减到0.55美元,输出成本则从60美元降低到2美元。开源叠加高性价比的双重属性,DeepSeek将推动AI发展加速从训练进入推理时代,进一步促进AI软硬件发展。

我们坚定持续看好AI软硬件机会,建议关注以AI为核心的龙头厂商科大讯飞(002230.SZ)、芯片技术有望创新突破的寒武纪(688256.SH)、高速通信连接器业务或显著受益于GB200放量的鼎通科技(688668.SH)、已与Rokid等多家知名AI眼镜厂商建立紧密合作的亿道信息(001314.SZ)等。

风险提示

1)AI底层技术迭代速度不及预期。2)政策监管及版权风险。3)AI应用落地效果不及预期。4)推荐公司业绩不及预期风险。(华鑫证券 宝幼琛 )

免责声明:本文内容与数据仅供参考,不构成投资建议,使用前请核实。据此操作,风险自担。

特别声明:[豆包实时语音大模型和大模型1.5线,美政府联手科技巨头启动“星际之门” | 投研报告] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

景甜裙装造型杀疯!她优雅性感双buff叠满,这姐美到开挂(景甜裙装造型视频)

这具身体是流动的雕塑,每一寸起伏都经过精密计算,却在不经意处撕开理性的裂缝:露背设计里的留白,恰似中国水墨中"计白当黑"的智慧,用缺失的部分勾勒出更完整的想象。但最精妙的设计藏在背面:当她提起裙摆致意,背

景甜裙装造型杀疯!她优雅性感双buff叠满,这姐美到开挂(景甜裙装造型视频)

港姐产后身材逆袭引热议,前任现女友隔空交锋,谁在暗中布局(港姐的身高要求)

面对裕美的指责,麦明诗一开始选择沉默,直到最近出席活动才回应说,可能是自己和王莉妮沟通不够清楚,才导致了这样的结果,但她不想再多做回应,因为“不想再有圈套,是我中人圈套”。 但她的爆料,却也难免令人觉得她是…

港姐产后身材逆袭引热议,前任现女友隔空交锋,谁在暗中布局(港姐的身高要求)

智慧路灯项目:点亮城市未来之光(微风发电智慧路灯项目)

在城市道路照明管理中,其市电路灯和led路灯头可根据环境亮度自动调节亮度,实现节能的同时,也能保障道路照明质量;对于商业地产开发商打造的景观区域,景观灯和庭院灯可以营造出独特的氛围。 满足不同受众需求智慧路灯…

智慧路灯项目:点亮城市未来之光(微风发电智慧路灯项目)

十三载深耕细胞修复 梦美泉用专业体系破解问题肌反复难题

近日,在第四届海峡两岸生技医美大健康产业合作论坛暨两岸一家亲颁奖盛典上,梦美泉凭借其突破性的细胞养护技术与卓越的产品效能,再度斩获“海峡两岸卓越科研制造奖”。2024年,品牌历经近十年临床验证与技术迭代,推出…

十三载深耕细胞修复 梦美泉用专业体系破解问题肌反复难题

岳云鹏演唱会闪亮登场,张鹤擎不断帮衬,老郭抬爱,小郭日后必火(岳云鹏演唱会直播在线观看)

郭绮瑶,这位能凭借出众的外貌赢得观众喜爱的山西姑娘,不仅颜值在线,还精通琵琶和大提琴,她早已积累了不少忠实的德云粉丝。 因岳云鹏的演唱会上重现了他在央视元宵晚会与苏州评弹陆锦花的经典节目《花好月圆》,这次演…

岳云鹏演唱会闪亮登场,张鹤擎不断帮衬,老郭抬爱,小郭日后必火(岳云鹏演唱会直播在线观看)