腾讯混元发布并开源图生视频模型,上线音频与动作驱动等能力

腾讯混元发布并开源图生视频模型,上线音频与动作驱动等能力

新浪科技讯 3月6日下午消息,腾讯混元宣布图生视频模型目前已经上线,企业和开发者可在腾讯云申请使用API接口;用户通过混元AI视频官网即可体验。混元视频生成开源模型目前在Github、HuggingFace等主流开发者社区均可下载体验。

据悉,腾讯混元发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。基于图生视频的能力,用户只需上传一张图片,并简短描述希望画面如何运动、镜头如何调度等,混元即可按要求让图片动起来,变成5秒的短视频,还能自动配上背景音效。此外,上传一张人物图片,并输入希望“对口型”的文字或音频,图片中的人物即可“说话”或“唱歌”;使用“动作驱动”能力,还能一键生成同款跳舞视频。

此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持 130 亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。开源内容包含权重、推理代码和LoRA训练代码,支持开发者基于混元训练专属LoRA等衍生模型。目前在Github、HuggingFace等主流开发者社区均可下载体验。

混元开源技术报告披露,混元视频生成模型具备灵活的扩展性,图生视频和文生视频在相同的数据集上开展预训练工作。在保持超写实画质、流畅演绎大幅度动作、原生镜头切换等特性的基础上,让模型能够捕捉到丰富的视觉和语义信息,并结合图像、文本、音频和姿态等多种输入条件,实现对生成视频的多维度控制。

目前,混元开源系列模型已经完整覆盖文本、图像、视频和3D生成等多个模态,在Github 累计获得超 2.3 万开发者关注和star。(闫妍)

特别声明:[腾讯混元发布并开源图生视频模型,上线音频与动作驱动等能力] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

足迹:易弋和文朴闹别扭去西北,她委屈是真委屈,矫情也是真矫情(足迹易弋和文部长的结局)

电视剧《足迹》中,『童瑶』饰演的易弋与『刘奕君』饰演的文朴因情感冲突而分道扬镳。预告片中弥漫的伤感氛围,暗示着女主角🎭️对这段感情的失望——她认为文朴并未真正理解她的灵魂,两人的精神世界始终未能深度交融。她无法接受自己在…

足迹:易弋和文朴闹别扭去西北,她委屈是真委屈,矫情也是真矫情(足迹易弋和文部长的结局)

房车改装12V油烟机怎么选?带『触摸屏』+照明的抽油烟机推荐(房车油改气)

想在房车或拖挂车上打造舒适厨房?12V车载油烟机是关键!本文详解12V油烟机的工作原理、核心参数、选购要点与实用场景,帮你避开“做饭冒烟”尴尬。从触摸按键、LED照明到静音设计,一文讲清如何选对厨房“隐形卫士”。适合自驾游爱好者、旅居族及户

房车改装12V油烟机怎么选?带『触摸屏』+照明的抽油烟机推荐(房车油改气)

国乒回京可爱大哥机场挨个点名 球迷如数家珍(国乒队回国机场路透)

9月15日,WTT冠军赛澳门站圆满结束,国乒队员启程返回北京。球迷们热情地前来送行,其中一位大哥特别引人注目,他挨个点名队员们的名字,仿佛在数家珍。网友们看到这一幕纷纷表示,这位大哥的熟练程度显然是一位资深球迷

国乒回京可爱大哥机场挨个点名 球迷如数家珍(国乒队回国机场路透)

离开徐克后,从功夫巨星到无戏可拍,一身正气的他,终于熬出了头(徐克成就)

阿龙从小就对武术有着浓厚的兴趣,凭借着自己的天赋和努力,他在武术界崭露头角,很快便成为了一名功夫巨星。他开始阅读各种书籍、观看各种电影、学习各种技能,努力让自己变得更加全面和优秀。最终,这部电影取得了巨大的成…

离开徐克后,从功夫巨星到无戏可拍,一身正气的他,终于熬出了头(徐克成就)

手机拆屏必备!99度工业酒精怎么用才安全?一文说清(手机拆屏技巧)

手机拆屏后残留胶渍难清理?99度工业酒精是维修界的“黄金搭档”!本文深度解析其原理、正确用法与安全边界,教你避开常见误区。从除胶到电路板清洗,一液多用不伤设备。同时科普浓度选择、存储安全与替代方案,帮你科学选品,高效维修不翻车。实测推荐适用

手机拆屏必备!99度工业酒精怎么用才安全?一文说清(手机拆屏技巧)