视频背景音自动转为文字:FFmpeg 8.0 引入 Whisper 音频过滤器(视频时音乐自动关闭)

今日霍州 8 月 16 日消息,多媒体框架 FFmpeg 开发团队发文,预热 FFmpeg 8.0 版本新增一项名为 Whisper 的音频过滤器,该功能整合了 OpenAI 的 Whisper 语音识别模型,通过内建过滤器机制,可以自动将视频背景音频内容识别转换为文字描述,并输出为字幕或结构化数据

据介绍,Whisper 过滤器的实现依赖 whisper.cpp库,用户需要先在系统中安装并启用对应支持库,并在编译时通过“--enable-whisper”选项激活功能。相应过滤器支持纯文本 TXT、SRT、JSON 等输出模式,同时可以通过 HTTP 等协议直接将输出内容传输到其他系统。如果未指定输出位置,转录结果将作为元数据附加在音频帧上,供后续处理或分析使用。

官方强调,该过滤器提供了队列参数,用户可以设置累积多少音频数据再进行识别,默认值约为 3 秒,如果将时间设置更长,识别准确率则更高 / 处理频率更低,适合批处理工作场景;如果将时间设置更短,则可降低过滤器处理延迟,适合对重要音频内容进行具体分析和微调。

此外,Whisper 过滤器也支持 GPU 加速,结合 FFmpeg 本身的多线程处理,在高性能环境下能显著提升转录速度。同时它还支持“Silero 语音活动检测(VAD)”功能,能在长音频流中自动切片语音片段,从而进一步提升识别效率和段落准确度。

特别声明:[视频背景音自动转为文字:FFmpeg 8.0 引入 Whisper 音频过滤器(视频时音乐自动关闭)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

近20天收入超去年全年!月之暗面成国内最快晋级十角兽公司;问界通报广东惠州车辆起火事件;荣耀将推出首款人形『机器人』️丨邦早报(收入持续走高)

【韩国三大电视台因版权©️问题起诉OpenAI】2月23日消息,据报道,韩国三大地面电视台KBS、MBC与SBS向首尔中央地方法院提起诉讼,指控人工智能聊天『机器人』️ChatGPT的开发商OpenAI在未经授权的情…

近20天收入超去年全年!月之暗面成国内最快晋级十角兽公司;问界通报广东惠州车辆起火事件;荣耀将推出首款人形『机器人』️丨邦早报(收入持续走高)

谷爱凌夺冠泣下的背后:荣耀辉煌中的深切遗憾与情感(谷爱凌夺冠视频)

当她夺冠那一刻跪地痛哭,很多人以为这只是绝顶激动的情绪宣泄,殊不知背后隐藏着一段沉重的故事——她最亲爱的奶奶刚刚离世。 从过往的纪录片中,我们看见了谷爱凌与奶奶之间纯粹而温暖的互动,没有刻意的煽情,却充满了真…

谷爱凌夺冠泣下的背后:荣耀辉煌中的深切遗憾与情感(谷爱凌夺冠视频)

德国总理默茨访华行程曝光 加强中德经济合作

中国外交部发言人2月23日宣布,德国总理默茨将于25日至26日应邀对中国进行正式访问。默茨上周在『社交平台』X上发文称,“愿马年为德中关系注入力量、带来新动力”,并表示期待不久后启程访华

德国总理默茨访华行程曝光 加强中德经济合作

徐梦桃安慰队友:四年后咱们再来 经历铸就成长(徐梦桃是否参加2022冬奥会)

2月21日,米兰冬奥会自由式滑雪🎿空中技巧混合团体决赛结束,徐梦桃、王心迪和李天马为中国代表团赢得一枚铜牌🥉。至此,米兰冬奥会自由式滑雪🎿空中技巧项目全部结束,中国队共获得2金3铜的成绩

徐梦桃安慰队友:四年后咱们再来 经历铸就成长(徐梦桃是否参加2022冬奥会)

木工锯片4寸5寸如何选择?金田手提锯角磨机大齿18齿24齿适合哪些场景?(木工锯片4寸5寸7寸10寸)

在选购4寸5寸的木工锯片和金田手提锯角磨机时,面对不同齿数和尺寸的选择,往往一头雾水。本文从实际使用需求出发,深入剖析影响选型的核心要素,并分享避坑建议,助您找到性价比最高的方案。特别针对18齿和24齿的特点进行分析,帮助您轻松决策,确保投

木工锯片4寸5寸如何选择?金田手提锯角磨机大齿18齿24齿适合哪些场景?(木工锯片4寸5寸7寸10寸)