Character.AI 突破性技术:实时 AI 角色视频互动

Character.AI 突破性技术:实时 AI 角色视频互动

7 月 5 日消息,AI 聊天机器人平台 Character.AI发布研究论文和视频演示,展示了名为 TalkingMachines 的自回归扩散模型,让 AI 角色互动更加逼真。

该模型尚未部署在 Character.AI平台上,根据研究论文和视频演示,用户只需要输入一张图片和声音信号,该模型就能实现类似 FaceTime 的通话视觉互动。

该模型基于 Diffusion Transformer(DiT)技术,本质上是一种能够从随机噪声中创建详细图像的“艺术家”,并不断优化图像直至完美。Character.AI所做的就是让这一过程变得极其迅速,达到实时效果。

TalkingMachines 模型采用了流匹配扩散(Flow-Matched Diffusion)、音频驱动的交叉注意力(Audio-Driven Cross Attention)、稀疏因果注意力(Sparse Causal Attention)和不对称蒸馏(Asymmetric Distillation)等多种关键技术。

其中流匹配扩散技术通过训练大量动作,包括细微的面部表情和更夸张的手势,确保 AI 角色动作更加自然。音频驱动的交叉注意力技术则让 AI 不仅能听到单词,还能理解音频中的节奏、停顿和语调,并将其转化为精确的口型、点头和眨眼。

稀疏因果注意力技术让 Character.AI能够以更高效的方式处理视频帧,而不对称蒸馏技术则让视频能够实时生成,营造出类似 FaceTime 通话的效果。

Character.AI强调,这一研究突破不仅仅是关于面部动画的,它是朝向实时互动的音频视觉 AI 角色迈出的一步。该模型支真实感人类、动漫和 3D 虚拟形象等多种风格。

附上参考地址

猜你喜欢

上海配眼镜哪里最好,镜片、镜框、验光,一篇让你避开所有坑!

我亲自走访了上海的多家眼镜店,从高端商圈到街边小店,看过了各种镜片和镜框的价格、质量和效果,发现其实有很多商家根本不专业,只会推销高价镜片,却根本没能根据你的需求做出准确的验光!今天这篇文章,我将告诉你如何…

上海配眼镜哪里最好,镜片、镜框、验光,一篇让你避开所有坑!

任贤齐妻子和女儿现身深圳,打卡任学长雕塑,20岁女儿气质出众!

有现场歌迷感叹:&34要不是那头标志性金发,完全认不出这是天王的家属!不同于其他明星家属常有的保镖随行,陈则妤始终保持着普通观众的低调作派,这种&34隐身&34在人群中的能力,或许正是维系这段

任贤齐妻子和女儿现身深圳,打卡任学长雕塑,20岁女儿气质出众!

德云社七队聚会,郭龙远坐C位,孟鹤堂周九良作陪,网友:咋回事

看到孟鹤堂、周九良带队,郭龙远坐C位的时候,也有网友不解,询问是咋回事?昨晚在天桥德云社演出的有十四位演员,要想人人都有位置,都有空间,势必就有人要牺牲一些。前段时间,三队聚餐,估计也给了众队长启发,是时候回…

德云社七队聚会,郭龙远坐C位,孟鹤堂周九良作陪,网友:咋回事

出手即18禁,尺度大胆突破,观众欲罢不能

电影的主角罗妮娅,是一个芭蕾舞者,虽在《疾速追杀3》中仅短短几秒钟出现,但这一镜头却成为了她独立电影诞生的催化剂。 虽然导演换成了伦·怀斯曼,但影片的动作核心依然由查德·斯塔赫斯基的班底操刀,这也是《疾速追…

出手即18禁,尺度大胆突破,观众欲罢不能

艾柯维护宁夏葡萄酒防沙治沙职业技术学院实验室纯水机exceed

2025年6月30日,艾柯厂家技术团队跨越千里抵达宁夏葡萄酒与防沙治沙职业技术学院,为实验室核心设备——Exceed系列纯水机开展专项维护。这台服务3年的“水质卫士”,支撑着葡萄酒成分分析、土壤微生物检测等教…

艾柯维护宁夏葡萄酒防沙治沙职业技术学院实验室纯水机exceed