声网新版对话式AI引擎亮相WAIC 解锁声纹识别、数字人与视觉理解(声网 rtc)

声网新版对话式AI引擎亮相WAIC 解锁声纹识别、数字人与视觉理解(声网 rtc)

7月26日—28日,2025世界人工智能大会(WAIC)在上海举办,声网在本届WAIC上正式发布新版对话式AI引擎,该版本新增声纹识别、数字人与视觉理解三项功能,实现对话式AI音视频交互体验的全新升级。同时,口袋AI毛绒宠物——芙崽Fuzozo、家庭陪伴机器人——赋之EBO Air2 Plus等一系列搭载对话式AI引擎的人气AI硬件也亮相声网展台。

对话式AI正从基础的互动问答向深度理解、情感共鸣和情境感知演进,新版声网对话式AI集成了声纹识别、数字人交互和视觉理解功能。

具体来看,声纹识别功能可以选择性注意力锁定新增声纹识别功能,该功能使AI具备精准识别用户声纹特征的能力,有效区分不同说话者,也适用于多人与AI对话的场景。

数字人交互功能支持商汤等市场主流的数字人方案,通过集成高度拟真、表情动作自然的数字人,用户可与屏幕中的高度拟人化的数字形象进行实时、生动的对话互动,增强交互的临场感与情感连接,且有多个数字人形象供选择,适用于虚拟客服、教育陪伴、娱乐社交等多种场景。

视觉理解功能是新增的视觉理解能力,为AI加上“眼睛”,一方面支持实时视频,能够解析摄像头捕捉的画面信息,结合语音指令,AI能“看懂”用户手势、环境物体或特定视觉线索,实现“所见即所言”的智能反馈。

此次WAIC期间,声网展台设置了多个对话式AI的体验展区,其中人气最高的为AI硬件展区,多款搭载对话式AI功能的AI硬件集中亮相,包括:对话式AI开发套件以及搭载了开发套件的卡皮巴拉AI玩偶与数字人全息仓;具备AI陪伴功能的AI毛绒宠物——芙崽、家庭陪伴机器人——赋之EBO Air2 Plus、将AI玩具与角色手办结合的赛博大舞台、具备翻译与识图功能的AI眼镜等,让现场的观众体验到既会说话,又能共情的各类AI硬件。

声网表示,未来将持续完善对话式AI引擎与开发套件,通过多元化的功能、极致的对话体验,加速智能对话在各类终端和场景中的普及与深化,推动更加自然、智能、安全的人机共生时代加速到来。

特别声明:[声网新版对话式AI引擎亮相WAIC 解锁声纹识别、数字人与视觉理解(声网 rtc)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

男子误吞牙签致刺穿肠壁插入右肾 小牙签成大隐患(误吃牙签)

牙签是日常生活中常见的小工具,但有时也可能成为潜在的危险。李先生因腹痛难忍前往广州医科大学附属番禺中心医院急诊就诊,结果发现一根牙签卡在他的胃部十二指肠上段,并已穿出肠道,另一端还插进了右肾

男子误吞牙签致刺穿肠壁插入右肾 小牙签成大隐患(误吃牙签)

从首季到最终季零差评的6部美剧,哪部让你至今都意难平?(首季是指)

相比《绝命毒师》的主角,在这能体会到不一样的一面,在油滑头衔下,他还能是个善良、看中家人,充满正义的人。导演用八十年代复古滤镜裹着少年们的勇敢,怪物和异次元只是流于表面,内核则是被排挤者的抱团、成人世界的虚伪…

从首季到最终季零差评的6部美剧,哪部让你至今都意难平?(首季是指)

AutoCAD macwin版安装包(autocad for mac下载)

软件提供了丰富的绘图工具集,能够以毫米级的精度创建技术图纸,自动生成尺寸标注和材料清单,大幅提升设计效率。随着行业数字化转型加速,AutoCAD的BIM(建筑信息模型)功能正在改变传统建筑设计流程,实现从单一…

AutoCAD macwin版安装包(autocad for mac下载)

如何制作有效沟通PPT课件(如何制作有效沟通记录)

一份优秀的有效沟通PPT课件,能够清晰地传达信息,吸引听众的注意力,增强沟通效果。 制作有效沟通PPT课件的要点内容设计内容是PPT的核心。图表是一种很好的视觉呈现方式,能够直观地展示数据和信息,使复杂的内容…

如何制作有效沟通PPT课件(如何制作有效沟通记录)

她到底是凭什么红的啊?!(她到底是谁)

不仅一直在争自己是唯一原唱,居然到后面《年轮》演唱权被收回了之后还表示自己有全球演唱权,是她选择不唱了:你别说内娱了,就是放眼全球也没有哪一个歌手是蒙着脸出现在演唱会现场的啊? 至于未来还能不能赚钱呢,难…

她到底是凭什么红的啊?!(她到底是谁)