你还在为语音合成效果不够真实自然而烦恼吗?如今,科大讯飞在语音合成领域取得了重大进展,实现了两大核心能力突破!
科大讯飞的一句话复刻,做到了更像、更准确、体验更随心。评估声音复刻效果,相似度和准确度是关键指标,科大讯飞在这两方面均处于行业领先,MOS分(满分5分)表现优异。这得益于星火语音大模型底座,以及构建的三阶段层次化语音建模框架,还有音色编码增强和强化学习等技术,让仅用一句话录音就能捕捉发音特征,实现难以区分的复刻效果。
科大讯飞的超拟人合成也进行了升级,在自然度、情感表达等方面表现更好,多轮交互效果显著提升,对话像和真人聊天一样自然。像蔚来智能助手NOMI,就因科大讯飞技术实现了情感自适应表达。目前,科大讯飞超拟人合成已在多个汽车厂商车型上应用,为智能座舱带来全新交互体验,还在家电、教育等领域落地。
未来,科大讯飞将持续提升语音合成技术,拓展边界,携手伙伴探索更多场景应用,如角色扮演、发音人快速定制等,为我们带来更多元、有趣、实用的产品体验,一起拭目以待!