标签:EgoTwin - 今日霍州

4月前

EgoTwin 是一个基于扩散模型的框架，能够以视角一致且因果连贯的方式联合生成第一人称视角视频和人体动作。为解决上述挑战，EgoTwin基于扩散Transformer架构，构建了“文本-视频-动作”三模…

标签:"EgoTwin"相关文章