MiniMax发布新一代语音大模型

MiniMax发布新一代语音大模型

近日,AI独角兽MiniMax稀宇极智发布新一代语音大模型Speech-02,宣布该模型在国际最权威的两项语音评测榜单Artificial Analysis(全球知名AI基准测试机构)和Hugging Face TTS Arena (抱抱脸文本转语音竞技场)上,超越OpenAI、ElevenLabs等国际巨头,登上双榜榜首。

国际权威语音评测榜单Artificial Analysis 来源:以下图片均由Minimax方提供

据介绍,Speech-02在语音模型核心技术指标:字错率WER和相似度SIM等客观指标上取得了SOTA结果,用户盲听主观评价反馈也显示其更自然、真实。

与Seed-TTS、CosyVoice 2和真实音频相比,Speech-02在中英文的零样本语音克隆中均实现了更低的字错率(Word Error Rate, WER),表明其发音错误率更低且更清晰稳定。在SIM方面,Speech-02在所有24种测试语言中均显著优于ElevenLabs的multilingual_v2模型,前者生成的语音更逼近真人输出。

Hugging Face TTS Arena 评测榜单

值得关注的是,Speech-02性能登顶的同时,其商用定价仅为全球头部语音模型ElevenLabs的四分之一,具有高性能和性价比双重优势。目前,MiniMax已在文旅导览、金融服务、语音助手、AI教育等领域应用其大模型服务。

特别声明:[MiniMax发布新一代语音大模型] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

演员王琳又酷又飒的背面如此卑微,打醒了多少“母爱脑”!(王琳演员简历)

在最新一档综艺节目《姐姐当家》中,王琳,别称“雪姨”,展现出了她与儿子王诺之间的微妙关系。王琳不仅仅是一个单身妈妈,她在节目中透露,每周只有周四才能与远在美国的儿子通一次电话。 然而,王诺对这些感受似乎并不敏…

演员王琳又酷又飒的背面如此卑微,打醒了多少“母爱脑”!(王琳演员简历)

国产AB3M040065C替代SCT040HU65G3AG在车载OBC应用中的核心优势对比(国产t+a)

损耗类型国产方案优化效率增益导通损耗R<sub>DS(on)<sub>低至40mΩ(进口50mΩ)+0.8%开关损耗175°C时E<sub>on&

国产AB3M040065C替代SCT040HU65G3AG在车载OBC应用中的核心优势对比(国产t+a)

福建计划到2027年实现5G个人用户普及率超80%(2025年福建地方专项计划)

《行动计划》提出,到 2027 年,推动福建省“双千兆”网络普及,农村和偏远地区网络覆盖更加完善,通信网络终端连接规模持续扩大,实现 5G个人用户普及率突破 80%。 围绕总体目标,《行动计划》部署五大方…

福建计划到2027年实现5G个人用户普及率超80%(2025年福建地方专项计划)

不要被黑洞骗了,肖三的原型比剧中厉害多了刘华强见了都要绕着走(不会被黑洞吞噬的物质)

刘洪明自幼以勇武著称,打架斗殴几乎成了家常便饭,因此他也是个常年待在劳改所的人。李连生正是看中了刘洪明的这一特质,将他招揽入麾下,并赋予他一队队长的位置,成为菜刀队的核心成员之一。 菜刀队的二队队长张强,是李…

不要被黑洞骗了,肖三的原型比剧中厉害多了刘华强见了都要绕着走(不会被黑洞吞噬的物质)

2025年全球AI Agent行业洞察报告-MoonFox月狐数据(2025年全球人口总数)

报告指出,目前“大语言模型仍是AI Agent最为核心的‘工具’”,但“如何提升记忆力、以及工具的使用,是扩展AI能力边界的关键”。当前行业“仍缺乏真正专业级的通用型智能体”,但“部分产品如Manus、Kim…

2025年全球AI Agent行业洞察报告-MoonFox月狐数据(2025年全球人口总数)