OpenAI发布新一代语音模型,让AI智能体语音表达更自然

OpenAI发布新一代语音模型,让AI智能体语音表达更自然

3月21日消息,OpenAI昨日(3月20日)发布博文,宣布推出语音转文本(speech-to-text)和文本转语音(text-to-speech)模型,提升语音处理能力,支持开发者构建更精准、可定制的语音交互系统,进一步推动人工智能语音技术的商业化应用。

在语音转文本模型上,OpenAI主要推出了gpt-4o-transcribe和gpt-4o-mini-transcribe两个模型,官方表示在单词错误率(WER)、语言识别和准确性上超越现有Whisper系列。

这两个模型支持超100种语言,主要通过强化学习和多样化高质量音频数据集训练,能捕捉细微语音特征,减少误识别,尤其在嘈杂环境、口音及不同语速下表现更稳定。

在文本转语音上,OpenAI最新推出了gpt-4o-mini-tts模型,开发者通过“模拟耐心客服”或“生动故事叙述”等指令,控制语音风格,可以应用于客服(合成更具同理心的语音,提升用户体验)和创意内容(为有声书或游戏角色设计个性化声音)方面。

今日霍州(www.jrhz.info)©️

援引博文介绍,附上三款模型费用如下:

gpt-4o-transcribe:音频输入每100 万tokens费用6美元💵、文本输入每100万tokens费用2.5美元💵,输出每100万tokens费用10美元💵,每分钟成本0.6美分。

gpt-4o-mini-transcribe:音频输入每100万tokens费用3美元💵、文本输入每100万tokens费用1.25美元💵,输出每100万tokens费用5美元💵,每分钟成本0.3美分。

gpt-4o-mini-tts:每100万tokens输入费用为0.60美元💵,每100万tokens输出费用为12美元💵,每分钟成本1.5美分。

特别声明:[OpenAI发布新一代语音模型,让AI智能体语音表达更自然] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

港产电影上映半月终破百万并成功入金马,前TVB男星发文多谢『古天乐』(2021最新上传上映港产电影)

身兼演员与动作指导的罗浩铭迫不及待在『社交平台』报喜: 多谢每一位为《触电》撑场的观众」 更令人振奋的是,继早前杀入《奇幻国际电影节2025》后,《触电》再传捷报,强势入围第62届金马奖「最佳动作设计」最终角逐…

港产电影上映半月终破百万并成功入金马,前TVB男星发文多谢『古天乐』(2021最新上传上映港产电影)

闪灵》演员脱发,《驱魔人》致残,杰作下的残酷真相(闪灵主演叫什么名字)

尤其任贤齐那段,听着就来气——他在电影里演卧底,有一场“吊颈处决”的戏,导演麦浚龙竟然坚持要任贤齐亲自上阵、真被吊脖子,还声称“咨询过医生,吊十秒不会有事”。问题是这“艺术”代价太大了:剧组事故频发,好几名当…

《<strong>闪灵</strong>》演员脱发,《<strong>驱魔人</strong>》致残,杰作下的残酷真相(闪灵主演叫什么名字)

大嫂还是那么的霸气侧漏!『高叶』身着拉夫劳伦礼服亮相宜昌电影节!(大嫂好不好下一句)

每一个角色都是她对人性理解的延伸,也是她自身经历的反映。这样的讨论不仅提升了公众对女性♀️成就的关注度,更促进了更多女性♀️在社会中追求自我价值的勇气和信心。 『高叶』的成功无疑是这种变革的缩影,她的每一次亮相都在向…

大嫂还是那么的霸气侧漏!『高叶』身着拉夫劳伦礼服亮相宜昌电影节!(大嫂好不好下一句)

文娱新论|年度气人综艺《再见爱人》,这回被嘉宾耍了?(《文娱新贵》)

文娱新论|年度气人综艺《<strong>再见爱人</strong>》,这回被嘉宾耍了?(《<strong>文娱新贵</strong>》)

哈里梅根会否获圣诞邀请?温莎王朝的年度盛会悬念重重!(npr news 哈里梅根)

据王室线人透露,今年白金汉宫的圣诞邀请函正在变成最具悬念的“金色门票”——远在加州的哈里梅根究竟能否重返皇室派对? 桑德林汉姆庄园的圣诞派对向来是王室流量担当,但今年剧透来得格外早——皇家收藏信托突然提前两个…

哈里梅根会否获圣诞邀请?温莎王朝的年度盛会悬念重重!(npr news 哈里梅根)