百度蒸汽机(MuseSteamer),这一引领音视频一体化技术创新的先锋,于8月21日宣布了其模型的重大升级。此次升级涵盖了Turbo版、Lite版、Pro版及有声版,标志着行业内首次实现了多人有声音视频的一体化生成。这一突破性进展,让视频创作迈入了一个全新的时代。
百度蒸汽机凭借其五大核心技术突破,重新定义了视频生成的标准,终结了“无声时代”。作为全球首个支持中文音视频一体化生成的I2V模型,它不仅能够生成逼真的环境音效,更实现了多角色语音的一体化生成。这意味着,创作者只需提供一张图片和相应的提示词,就能轻松拥有包含完美视听语言的视频作品。
这五大技术突破包括:首次实现多人有声视频的一体化生成,且语音与唇形、表情、动作精准对齐,即使在复杂场景下也能保持稳定;创新的多模态潜在空间规划技术,能够自主协调多角色的身份、情感与互动逻辑,确保电影级的叙事连贯性;针对中文场景的深度适配,实现了超过98%的语音细节与情感表达还原度;端到端的电影级画质生成,通过精细的主体动态刻画,打造出真实细腻的人物表现力;以及大师级的运镜控制,内置多种专业镜头语言,精准响应文本指令,实现视觉细节与创意意图的完美融合。
除了技术上的革新,百度蒸汽机2.0还带来了成本结构的根本性变革。传统影视制作中的高昂费用,如演员🎭️、场地、设备租赁,以及后期配音、特效追加等,现在均可通过AI生成实现大幅降低。国际知名的视效指导姚骐分享了他使用百度蒸汽机制作的科幻短片《归途》,这部作品共有40多个镜头,每个镜头生成3次,共用AI生成了超过120个片段素材,但成本却低至百元,展现了AI技术在影视制作中的巨大潜力。
在伊利倍畅成人羊奶粉的AI整合营销案例中,百度蒸汽机的AIGC视频生成技术发挥了核心作用。该技术帮助伊利倍畅高效打造了首支AIGC品牌宣传片《漂“羊”过海来看你》,不仅大幅缩短了视频制作周期,还以较低的成本实现了高品质的创意呈现,显著降低了制作门槛与营销成本。
随着百度蒸汽机全系版本的开放,百度还公布了极具竞争力的价格体系。针对不同需求的用户,平台提供了梯度会员服务,价格低至行业同类产品的70%。新用户注册即可获得部分想象力值,每周四还有“狂欢星期四”抽奖活动,用户最高可获得18888点想象力值,实现视频生成的自由。同时,平台还定期发布特效赛事,参赛者有机会赢得数万元大奖。
百度蒸汽机的技术革新不仅推动了视频生成技术的发展,还重塑了创作者的工作流。这一由应用驱动模型研发的新范式,得益于百度各业务场景旺盛的应用需求,同时也反哺着应用生态的创新。在百度搜索生态、内容生态、商业生态以及云生态中,AIGC的涌现大大提高了多模态内容创作的自由度、质量和效率,降低了视频制作成本。目前,百度蒸汽机已在百度生态中得到广泛应用。
在百度搜索中,用户只需点击视频创作按钮,即可轻松实现从脚本到视频的免费生成,享受AI创作的乐趣。在内容创作领域,百度蒸汽机模型与创作工具的结合,打破了专业壁垒,释放了个体创作的自由。在商业生态中,百度蒸汽机为营销客户提供了高质量、低成本的营销创作新路径。例如,一汽-大众揽境借助百度蒸汽机制作的七夕热点营销视频,成功将创意转化为具象视频内容,引发了用户的共鸣。
百度智能云千帆大模型平台已全面接入百度蒸汽机模型服务,为企业提供高性能、低成本、安全可控的视频生成解决方案。通过灵活的计费模式和极致的资源利用,助力企业及开发者低成本用好视频生成模型,快速落地于商业营销、影视创作、创意特效等五大场景,实现企业级AI视频的即开即用。