B站上线AI原声翻译功能,用户可体验原汁原味多语种视频(b站有翻译功能吗)

自今年5月哔哩哔哩(以下简称B站)宣布将下架原国际版APP,与国内版合并为一个统一APP后,B站的出海下一步便引来各方关注。

近日,在世界人工智能大会上,B站公布了其为服务海外用户而全新自研的「AI原声翻译功能」,以便海外用户更好体验游戏、科技、二次元等主推内容。在完成了APP合并、海外用户页面多语种适配、特别是视频原声翻译功能上线后,B站似乎已经做好准备蓄力开拓海外市场。

本次发布的「AI原声翻译」功能除了自动擦除中文字幕改为英文、弹幕翻译及各类按钮英文适配等基础的文本互译之外,还能完美还原UP主的声线、音色、气口,而非传统的机器音翻译,同时还能基于翻译语言进行口型模拟。这意味着在未来中文用户观看外语UP主视频或海外用户观看中文UP主视频时能无差别体验原汁原味的“本地化”翻译视频。后续,B站还将视需求把日语等语言加入「AI原声翻译」功能中,持续扩展在海外市场的适配能力。

据悉,目前B站「AI原声翻译功能」中,跨语言声音还原技术源自内部代号为「 IndexTTS2」的语音生成模型 ,其整体框架如下图所示。该模型引入了一种新颖、通用且兼容自回归架构的语音时长及情感控制方法。该方法支持指定token数量,从而实现对语音时长的精确调控,降低了翻译任务的难度。另外对情感表达与说话人身份进行了有效解耦,实现了高质量地复刻原片语音中蕴含的情感。

为攻克「AI原声翻译功能」中的核心挑战——尤其在游戏、二次元等专名梗点密集领域——实现原风格精准保留与语音时长完美对应,B站技术团队基于『大语言模型』(LLM)构建翻译引擎,独创性基于语音时长匹配、原声翻译标准与UP主独特风格构建多目标奖励模型,并采用对抗式强化学习(RL)训练驱动模型持续进化与精准适配。同时,引入Deep Research深度挖掘技术,专攻专有名词与流行梗点的翻译难点,确保最终译文准确、地道、传神。字幕擦除部分则结合了先进的多模态大模型OCR技术和基于STTN网络的视频重绘技术,实现字幕区域的精准检测与高还原度擦除。

文丨记者 杭莹

受访者供图

特别声明:[B站上线AI原声翻译功能,用户可体验原汁原味多语种视频(b站有翻译功能吗)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

秘鲁巨星萨米尔浴火重生:乐坛遭盗版扼杀,卖巧克力斩获全球金奖(萨米克鲁格)

在转型的初期,萨米尔曾考虑过投资皮马棉等纺织原材料,但最终他选择将目光锁定在亚马逊地区的可可产业。在2025年,品牌迎来了历史性的巅峰时刻:在被誉为巧克力界的奥斯卡——国际巧克力大奖赛上,采用胡宁省可可…

秘鲁巨星萨米尔浴火重生:乐坛遭盗版扼杀,卖巧克力斩获全球金奖(萨米克鲁格)

三星表示其HBM4显示出差异化竞争力(三星hg)

来源:环球市场播报 『三星电子』首席执行官Jun YoungHyun在向员工发表的新年致辞中表示,公司的第四代高带宽内存(HBM4)展现出差异化竞争优势,甚至赢得了客户 “三星王者归来” 的评价。他强调,需借助…

三星表示其HBM4显示出差异化竞争力(三星hg)

印度政府勒令马斯克的X平台整改AI聊天『机器人』️Grok(马勒河事件印度士兵的伤亡情况)

1 月 4 日消息,因用户及议员举报其人工智能聊天『机器人』️ Grok 生成“低俗色情”内容(包括该工具制作的女性♀️ AI篡改图像),印度已下令埃隆・马斯克旗下的 X 平台立即对 Grok 进行技术与操…

印度政府勒令马斯克的X平台整改AI聊天『机器人』️Grok(马勒河事件印度士兵的伤亡情况)

Monoethoxylsilane-PEG-Biotin 是一个专门用于在氧化物表面进行生物功能化修饰的关键试剂

分子量:0.4k,0.6k,1k,2k,3.4k,5k,10k等(支持定制) 模块化与通用性:一个“链霉亲和素化”的表面可以兼容无数种生物素化的探针,用途极其广泛。 三乙氧基硅烷-PEG-Biotin: …

Monoethoxylsilane-PEG-Biotin 是一个专门用于在氧化物表面进行生物功能化修饰的关键试剂

2026 智能手表,搭载先进 AI 语音助手,操作便捷超乎想象!(最新智能手表手机)

四、总结:引领智能手表新潮流览邦 Watch Ultra 2026 智能手表凭借其在外观工艺、AI 语音助手、硬件配置和功能等方面的卓越表现,为用户带来了前所未有的智能体验。同时,其强劲的硬件配置和丰富的功…

2026 智能手表,搭载先进 AI 语音助手,操作便捷超乎想象!(最新智能手表手机)