昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题(升腾架构)

昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题(升腾架构)

随着以 Sora 为代表的视频生成模型技术的演进,长视频生成领域在维持长时序内容一致性以及平衡生成质量与计算资源效率方面面临挑战。浙江大学 鲲鹏昇腾科教创新卓越中心计算机学院研究员朱霖潮团队基于此课题持续深耕并取得重要进展。依托昇腾AI基础软硬件平台,该团队提出的技术方案有效提升了长视频内容一致性,同时显著优化了视频生成过程中的计算效率。

针对长序列视觉指令生成的核心技术难题,项目团队成功研发首个无需训练的长序列视觉指令生成框架LIGER,实现了历史提示和视觉记忆机制,以及基于DDIM反演的记忆校准技术。依托昇腾的编码加速能力,通过对每个步骤的图像特征进行采样和存储,捕捉前序步骤中的关键视觉信息,并将其注入到自注意力机制中,确保步骤间的视觉连贯性。同时,通过自反思机制纠正图像中的属性错误、逻辑错误、对象冗余和身份不一致等问题,使用多种图像编辑工具进行精确修正。该系统在长序列任务中展现出优异的逻辑连贯性和对象属性准确性,显著提升了视觉指令的理解性和实用性。

在计算效率方面,项目团队提出了基于昇腾平台优化的引导式渐进蒸馏方法,通过在线教师引导、渐进式蒸馏和高频细节保护三项关键技术,成功加速了视频扩散模型的生成过程。该方法让教师模型实时优化学生模型的中间预测以创建自适应训练目标,通过多阶段训练逐步增加步长将复杂轨迹学习分解为可管理的任务,并引入频域损失函数保持视频精细细节。在保持视频高质量输出基础上,该方法实现8倍加速。

该项目创新性地将大语言模型推理能力与视频生成技术相结合,为多模态交互研究开辟了新方向。目前,研究成果已成功入选人工智能顶级会议ICLR 2025,获得国际学术界的高度认可。项目构建的包含569个任务的评估数据集,为后续研究提供了重要基准。

未来,浙江大学 鲲鹏昇腾科教创新卓越中心将依托昇腾AI基础软硬件平台,持续深化产学研协同创新,着力突破多模态生成技术的核心瓶颈,构建自主创新、技术领先的多模态生成技术生态体系,并为国家人工智能战略与数字经济发展储备核心创新力量。

特别声明:[昇腾算力赋能视频生成革命 浙江大学团队攻克长时一致性难题(升腾架构)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

海豚吸污机维修服务中心(海豚吸尘器官网)

吸污机走过的地方仍有泥沙残留,多因吸力通道被堵或部件老化: 每次使用后及时清理过滤袋、驱动轮和吸污口,减少堵塞隐患;每周用清水冲洗机身,擦干后存放,避免水垢堆积;长期不用时,将电池充满电单独存放,机身保持干…

海豚吸污机维修服务中心(海豚吸尘器官网)

“机器人量产元年”:客户付费意愿等指标显著提升

他认为, 具身智能代表着机器人发展的未来方向,但其技术复杂度远超LLM(大语言模型)等,面临巨大挑战。在机器人生态圆桌讨论环节,首程控股执委、联席总裁叶芊表示, 2025年机器人产业关键词为“量产”与“生态…

“机器人量产元年”:客户付费意愿等指标显著提升

严屹宽老婆探班,7岁女儿在车上吃盒饭,杜若溪给剧组买200杯奶茶(严屹宽和)

她对冷饮的数量心存顾虑,不断向助理确认是否足够,甚至在剧组一趟豪气花费上千元,杜若溪的细心与大方无形中为严屹宽增添了许多面子。七岁的女儿走在最前面,还特意给爸爸带来了一小块蛋糕,暖心的举动令每个人都感到温暖…

严屹宽老婆探班,7岁女儿在车上吃盒饭,杜若溪给剧组买200杯奶茶(严屹宽和)

白百何回山东老家,171高个衣服皱皱巴巴,素颜眉毛好淡不像41(白百何山东人)

8月10日,一段视频在社交媒体上引起了热议,内容是演员白百何回到山东老家与亲友们的互动。最近,有网友偶遇白百何和她的小儿子,发现她在机场时独自一人带着孩子,身边没有阿姨的陪伴。小儿子坐在行李箱上,尽管正脸被打…

白百何回山东老家,171高个衣服皱皱巴巴,素颜眉毛好淡不像41(白百何山东人)

那英18岁女儿近照曝光,花重金送到英国深造,没想到却长成了这样(那英女儿叫什么)

坐在她身旁的,分别是宋佳和一个黄头发的少女,不少人凭借相貌已经猜出来了,那应该是那英的女儿小苹果了。 2022年她在《向往的生活》中与小苹果视频通话,意外曝光了女儿的正面照,温柔的模样让网友直呼“像极了妈妈…

那英18岁女儿近照曝光,花重金送到英国深造,没想到却长成了这样(那英女儿叫什么)