字节跳动展示OmniHuman多模态框架:肖像+音频=逼真动画

字节跳动展示OmniHuman多模态框架:肖像+音频=逼真动画

2 月 6 日消息,字节跳动的研究人员近日展示了一款 AI 模型,可以通过一张图片和一段音频生成半身、全身视频。

字节跳动表示,和一些只能生成面部或上半身动画的深度伪造技术不同,OmniHuman-1 能够生成逼真的全身动画,且能将手势和面部表情与语音或音乐精准同步

字节跳动在其 OmniHuman-lab 项目页面发布了多个测试视频,包括 AI 生成的 TED 演讲和一个会说话的阿尔伯特・爱因斯坦。

在周一发布的一篇论文中,字节跳动指出,OmniHuman-1 模型支持不同的体型和画面比例,从而使视频效果更自然。

据 了解,字节跳动表示,OmniHuman-1 模型基于约 19000 小时的人类运动数据训练而成,能够在内存限制内生成任意长度的视频,并适应不同的输入信号。

研究人员还表示,OmniHuman-1 在真实性和准确性方面,超越了其他同类动画工具。目前,该工具暂不提供下载或有关服务。

特别声明:[字节跳动展示OmniHuman多模态框架:肖像+音频=逼真动画] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

振华推出 ZILLON II 金牌全模组电源:750W650W,原生 12V-2×6(振华推出抽奖买翡翠是真的吗)

8 月 1 日消息,振华 SUPER FLOWER 今日宣布推出 ZILLON II“卓凌二代”金牌 ATX 电源。该系列产品可选750W650W 两种功率,采用标准 140mm 长度外形规…

振华推出 ZILLON II 金牌全模组电源:750W650W,原生 12V-2×6(振华推出抽奖买翡翠是真的吗)

奔驰让路事件男子称被要求删道歉 警方介入调查(奔驰路上视频)

8月1日,广西防城港一名男子发布视频称,7月22日下午,他在防城港市江山镇驾车时遇到一辆奔驰车。由于道路狭窄,他提前将车靠边避让,但对方要求他倒车让路

奔驰让路事件男子称被要求删道歉 警方介入调查(奔驰路上视频)

抢占智造风口!光明政群2025先进制造培训精英班重磅招生(抢占智造风口的案例)

二、2025年王牌课程体系——培养智能制造核心岗位紧缺人1. 数控编程精英班(3个月速成)零基础→高级编程师进阶之路text模块一:核心技能筑基机械制图与公差配合,G代码编程原理,CADCAM软件全栈(U…

抢占智造风口!光明政群2025先进制造培训精英班重磅招生(抢占智造风口的案例)

阳鑫机械取得凹槽内侧面加工机床专利,提高工作效率(鑫阳机械设备厂)

金融界2025年8月2日消息,国家知识产权局信息显示,莆田市阳鑫机械有限公司取得一项名为“一种凹槽内侧面加工机床”的专利,授权公告号CN223172643U,申请日期为2024年09月。 专利摘要显示,本实用…

阳鑫机械取得凹槽内侧面加工机床专利,提高工作效率(鑫阳机械设备厂)

黑胶唱片机推荐|新手小白必看这篇!(黑胶唱片机性价比)

高颜值的同时,又具备高音质,自带两个音响具有氛围灯带;有自己独特的设计风格,并荣获美国muse设计大奖;问加x3采用钢琴质感的烤漆材质,光滑有质感,并且易于清洁擦拭。它的核心优势是 “稳定耐用”:采用全自动…

黑胶唱片机推荐|新手小白必看这篇!(黑胶唱片机性价比)