标签:"Whisper"相关文章

语音识别遇上扩散大脑:剑桥-清华-伊利诺伊团队让机器听得更准确(如何解决语音识别的问题)

研究团队在著名的LibriSpeech数据集上进行测试,发现新系统在错误率方面比传统方法降低了12.3%,这意味着每100个词中能够减少约12个识别错误,这在语音识别领域是一个相当显著的进步。 这项研究的价值…

语音识别遇上扩散大脑:剑桥-清华-伊利诺伊团队让机器听得更准确(如何解决语音识别的问题)

视频背景音自动转为文字:FFmpeg 8.0 引入 Whisper 音频过滤器(视频时音乐自动关闭)

8 月 16 日消息,多媒体框架 FFmpeg 开发团队发文,预热 FFmpeg 8.0 版本新增一项名为 Whisper的音频过滤器,该功能整合了 OpenAI 的 Whisper 语音识别模型…

视频背景音自动转为文字:FFmpeg 8.0 引入 Whisper 音频过滤器(视频时音乐自动关闭)

七夕高端品牌局:品牌借在地文化,共谱浪漫消费曲(大牌七夕新款征集)

LV以个性化定制服务融合经典工艺,传递梦幻浪漫;Prada则借上海七桥之景,重构神话与现代都市的对话;巴黎世家取景沪上地标,展现都市爱情;APM以“乞巧”为灵感,推出摩斯密码系列。 Prada七夕广告大片呈现…

七夕高端品牌局:品牌借在地文化,共谱浪漫消费曲(大牌七夕新款征集)

Mistral Voxtral 是 OpenAI Whisper 和其他 ASR 工具的开放权重竞争对手

传统 ASR 系统可以提供成本效益高的转录,但缺乏语义理解,而基于 LLM 的模型既提供转录又提供语言理解。其 API还提供了一个针对转录做过优化的 Voxtral Mini 定制版本,能帮助降低推理成本和…

Mistral Voxtral 是 OpenAI Whisper 和其他 ASR 工具的开放权重竞争对手

Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini

在多语言基准测试FLEURS的评估中,Voxtral Small模型在所有任务上都超越了Whisperlarge-V3,并在法语和德语中占据榜单首位。 在文本方面,Voxtral保留了其基座语言模型的文本…

Mistral首个开源语音模型来了!全面碾压Whisper,多项测试超越GPT-4o mini

8秒转录30分钟播客:MacWhisper应用接入『英伟达』Parakeet模型

曾于 2023 年 2 月报道,开发者 Jordi Bruin 推出 MacWhisper 应用,主要基于 OpenAI 的 Whisper转录模型,可以在本地完成音频文件转录为文本的工作。 该媒体随后用…

8秒转录30分钟播客:MacWhisper应用接入『英伟达』Parakeet模型

45 秒AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄

6 月 18 日消息,科技媒体 macstories 昨日(6 月 17 日)发布博文,通过一段长达 34 分钟,7GB的视频文件实测,发现苹果全新的 Speech API 仅用 45 秒完成,比…

45 秒AI 转录 34 分钟 4K 视频:苹果 Speech 技术力压群雄