OpenAI发布新一代语音模型,让AI智能体语音表达更自然

OpenAI发布新一代语音模型,让AI智能体语音表达更自然

3月21日消息,OpenAI昨日(3月20日)发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。

在语音转文本模型上,OpenAI主要推出了gpt-4o-transcribe和gpt-4o-mini-transcribe两个模型,官方表示在单词错误率(WER)、语言识别和准确性上超越现有Whisper系列。

这两个模型支持超100种语言,主要通过强化学习和多样化高质量音频数据集训练,能捕捉细微语音特征,减少误识别,尤其在嘈杂环境、口音及不同语速下表现更稳定。

在文本转语音上,OpenAI最新推出了gpt-4o-mini-tts模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容(为有声书或游戏角色设计个性化声音)方面。

援引博文介绍,附上三款模型费用如下:

gpt-4o-transcribe:音频输入每100 万tokens费用6美元💵、文本输入每100万tokens费用2.5美元💵,输出每100万tokens费用10美元💵,每分钟成本0.6美分。

gpt-4o-mini-transcribe:音频输入每100万tokens费用3美元💵、文本输入每100万tokens费用1.25美元💵,输出每100万tokens费用5美元💵,每分钟成本0.3美分。

gpt-4o-mini-tts:每100万tokens输入费用为0.60美元💵,每100万tokens输出费用为12美元💵,每分钟成本1.5美分。

特别声明:[OpenAI发布新一代语音模型,让AI智能体语音表达更自然] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

提醒!国庆中秋假期火车票即将起售 购票攻略揭晓(国庆中秋双节提醒)

中国铁路宣布,国庆中秋假期的火车票即将开始销售。具体来说,9月14日可以购买9月28日的火车票,9月15日可以购买9月29日的火车票,9月16日可以购买9月30日的火车票,而9月17日则可以购买10月1日的火车票

提醒!国庆中秋假期火车票即将起售 购票攻略揭晓(国庆中秋双节提醒)

女歌手时尚进阶有秘诀,这游戏教你蜕变(女歌手时尚进阶曲目)

时尚博主评价她:"没有盲目追潮流,而是找到了'清新感+先锋性'的个人符号,这种进阶最难得。刚进游戏的新人不用慌,创建角色就能领全服预约奖励,徐盛这样的强力橙将直接入队;七日狂欢活动里,第二天

女歌手时尚进阶有秘诀,这游戏教你蜕变(女歌手时尚进阶曲目)

遮羞布盖不住了!『刘德华』赖文慧关系曝光,除了结婚证啥都给了(遮羞布是啥意思)

这个外号不仅寓意她是『刘德华』的知心人,更体现了歌迷们对她的喜爱和敬重。有指出,『刘德华』对妻子朱丽倩是责任爱,而对赖文慧则是真挚的爱情。『刘德华』和赖文慧之间的关系,就像一出现代版的"梁祝"故事,让我们对"有情人终成眷…

遮羞布盖不住了!『刘德华』赖文慧关系曝光,除了结婚证啥都给了(遮羞布是啥意思)

瞒了我们这么久,原来他们居然是亲生母子!这些人不靠资源靠自己(瞒了我们这么多年歌词)

邬君梅用自己的努力和才华,证明了她不仅仅是“星二代”,更是一位值得尊敬的优秀演员。王骁用自己的实力和努力,证明了自己不仅是“星二代”,更是一位优秀的演员。 胡小玲,作为一位全能的表演和导演人才,在话剧舞台上有…

瞒了我们这么久,原来他们居然是亲生母子!这些人不靠资源靠自己(瞒了我们这么多年歌词)

教育部宣布:这13项比赛,拟取消!(教育部再出手)

艺术体育类共有13项竞赛活动,其中新增全国中小学生海洋文化创意设计大赛、全国青少年国防素养大赛、“戏剧中国”全国青少年戏剧文化艺术大赛、全国青少年人工智能辅助生成数字艺术创作者大赛、学校美育助力行动——青少…

教育部宣布:这13项比赛,拟取消!(教育部再出手)