杜比申请从文本描述合成音频波形专利,可从指示期望声音的文本描述合成音频波形(杜比格式)

国家知识产权局信息显示,杜比实验室特许公司、杜比国际公司申请一项名为“从文本描述合成音频波形的方法”的专利,公开号CN121014077A,申请日期为2024年4月。专利摘要显示,本公开的一方面涉及一种用于从指示期望的声音的文本描述合成音频波形的方法,所述方法包括:根据文本描述确定文本嵌入;根据文本嵌入确定图像嵌入;通过将图像嵌入输入到被训练为在给定输入图像嵌入的情况下合成频谱图的生成式模型来合成频谱图;以及将合成的频谱图转换成音频波形。

声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。

特别声明:[杜比申请从文本描述合成音频波形专利,可从指示期望声音的文本描述合成音频波形(杜比格式)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

洪秀柱马英九接连痛批高市早苗 反对日本干涉台海事务

针对日本首相高市早苗在台湾问题上的错误言行,中国国民党前主席洪秀柱和马英九于15日接连发声批评。据台媒报道,马英九在其个人『社交媒体』账号上发文指出,高市早苗的涉台言论错误引用了日本的“集体自卫权”,无端加剧地区紧张

洪秀柱马英九接连痛批高市早苗 反对日本干涉台海事务

iPhone17:加量不加价,入手256GB版仅需5999元!(苹果手机加量不加价什么意思)

iPhone17采用6.3英寸超视网膜XDR显示屏,分辨率高达2622×1206,支持120HzProMotion自适应刷新率, 3000尼特峰值亮度配合超瓷晶面板2代,阳光下清晰度提升3倍;无论是观看高清…

iPhone17:加量不加价,入手256GB版仅需5999元!(苹果手机加量不加价什么意思)

罗里达等:Research on Med-Arb Model in Financial Disputes(佛罗里达罗里岛)

Since 2025, leading arbitral institutions such as the BeijingArbitration Commission (BAC) and the Shen…

罗里达等:Research on Med-Arb Model in Financial Disputes(佛罗里达罗里岛)

机智云携AIoT软硬件一体化解决方案闪耀2025年深圳国际电子展(机智云nbiot)

在AI创新硬件领域,机智云与火山引擎、『豆包』大模型、扣子智能体开发平台进行了深度合作,推出了一系列具有创新性的产品和解决方案,具备高度拟真的对话体验和强大的情绪模拟能力,还支持角色设定自定义、多模态交互等功能…

机智云携AIoT软硬件一体化解决方案闪耀2025年深圳国际电子展(机智云nbiot)

把握产后30天减肥效更强(产后30天怎么算)

产后30天是身体恢复的关键期,适度控制体重有助于提升减重效果,但应避免剧烈运动或极端节食。减重效果受个体代谢水平、哺乳需求和伤口愈合情况等因素影响,科学饮食结合低强度活动是安全的方式

把握产后30天减肥效更强(产后30天怎么算)