赛道Hyper | Soul推出全双工通话大模型(赛道spin)

作者:周源/华尔街见闻

在 2025 世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2025)展览现场,『社交平台』Soul App展示了其自研的全双工通话大模型。

该模型即将在Soul平台开启内测,后续计划应用于虚拟人实时通话、AI匹配等1V1及多对多互动场景,是社交领域的一项新探索。

就眼下Soul的“虚拟人”应对用户互动场景的表现来看,已深具“真实感”,但这种互动目前仅限于文字形式。

此次推出自研全双工通话大模型,若能实现实时通话,则其智能性确然会有更大提升。

调整传统交互模式

传统语音交互长期依赖VAD(话音活性检测)机制与延迟控制逻辑,形成轮次对话模式。

这种模式的人机对话,呈现一问一答刻板节奏:用户发言结束后,AI才开始响应,中间存在明显延迟,影响了交互的自然性。

在很多时候,用户发言过程中会出现短暂停顿,这可能被系统误判为发言结束,导致AI过早介入,打断用户思路,交流显得过于生硬。

Soul自研的端到端全双工语音通话大模型,对这一传统模式做了调整:不再采用VAD机制,尝试通过算法让AI自主把控对话节奏。

在实际交互中,AI可实时监测对话动态,有能力做出主动打破沉默、适时打断用户、边听边说等操作。

比如,用户讲述事情时稍作停顿思考,AI能察觉并非发言结束,补充引导性话语推动话题;在多人交流场景中,AI能判断发言时机加入讨论,与用户发言相互交织,使对话更流畅,接近人与人面对面交流的状态。

在理论上,这种交互模式使AI从被动的回应者转变为主动的参与者,在一定程度上能提升人机对话的自然度。

为让AI在交互中更接近“真人”,Soul的全双工通话大模型构建了多维度感知体系,包括时间感知、环境感知、事件感知等。通过分析这些维度的信息,AI试图更好地理解用户意图和情感状态,给出贴合情境的回应。

从时间感知来看,AI会依据对话时间调整语言风格和话题。清晨可能以“早上好,新的一天有什么安排吗?”开启对话;深夜用户倾诉烦恼时,回应会更温柔,给予情感支持。

在环境感知上,模型能识别用户所处环境,嘈杂时适当提高音量保证清晰,安静时声音则更轻柔。

在事件感知方面,AI能结合讨论的事件给出针对性观点。用户分享工作中完成重要项目时,AI会表示祝贺并询问细节,增加对话的真实感。

此外,模型在口语化表达和音色复刻上做了优化:能模拟语气词、结巴、情绪起伏等日常口语特征,还可根据用户需求复刻特定音色。

还有情绪表达,AI的声音情绪会随对话推进变化,用户分享喜悦时语调上扬,用户情绪低落时声音低沉关切。

这些处理在一定程度上提升了AI交互的真实感,但距离完全模拟真人还有差距,仍有较大的提升空间。

事实上,在该大模型推出前,Soul虚拟人在1V1或在响应用户评论时的互动中,其表现也有较高的自然性和智能性。若Soul没有标注“虚拟人”标签,其应对内容已具有高度的“真人”感。

AI推升电子社交真实性

全双工通话大模型在Soul平台的多个应用场景中得以应用,在1V1和多对多互动场景中,会对用户的社交体验产生影响。

在虚拟人实时通话场景中,该模型有望让虚拟人与用户的交流更自然。

以往虚拟人对话较刻板,有了这一模型后,虚拟人可实时捕捉用户情绪和话语变化,调整回应方式和语气,提供更个性化的陪伴服务,使用户感受到更真实的情感反馈。

在AI匹配的1V1互动场景中,模型发挥了怎样的作用?比如能通过算法帮助用户筛选契合的聊天对象,提高社交匹配效率。

在交流过程中,模型分析双方对话内容和情绪,适时提供话题建议或引导:当匹配双方初次交流出现冷场,AI会抛出与双方兴趣相关的话题,如“听说你们都喜欢摄影,最近有拍到满意的作品吗?”打破僵局,让交流更顺畅。

在多人语音互动场景如群聊派对中,AI主持人具备相应功能:用户进入群聊派对后,AI主持人能管理群聊秩序,控制发言顺序、提醒文明交流,还能与用户语音互动。

当群内气氛沉闷时,发起如“大家最近有看什么好电影,分享一下吧?”的话题,吸引用户参与;新成员加入时,热情打招呼并引导相互认识,帮助新成员融入,在一定程度上可能提升群聊派对的参与度。

Soul全双工通话大模型的出现,为自身平台发展带来了新的方向,也为AI社交行业提供了参考案例。

这个模型展示了AI技术在社交领域的一种应用可能:即通过技术创新突破传统交互限制,实现更自然的社交体验。

随着该技术的推广应用,其他『社交平台』可能会增加AI技术研发投入,探索将AI技术融入社交场景,推动行业技术发展。比如提升对话流畅性,或在多维度感知方面深入研究,增强社交体验的沉浸感。

Soul的实践会吸引更多开发者关注AI社交领域,促使新的社交应用和服务出现。AI社交的发展会影响人们的社交方式和观念,打破地域、时间限制,让人们更便捷地结识不同地区的朋友,拓展社交圈。

随着AI在社交中作用渐显,人们对“社交”的定义可能发生变化,更注重与AI及其他用户的情感共鸣和信息交流。

Soul全双工通话大模型即将内测并应用,是AI社交领域的一次新尝试:凭借新的技术架构和应用场景,为用户带来新的社交体验,为行业发展提供思路。

特别声明:[赛道Hyper | Soul推出全双工通话大模型(赛道spin)] 该文观点仅代表作者本人,今日霍州系信息发布平台,霍州网仅提供信息存储空间服务。

猜你喜欢

【星链卫星曾两次危险抵近中国空间站】当地时间12月29日,中国代表在低地球轨道卫星问题安理会阿里亚模式会议上发言时表示,个别国家的商业卫星星座肆意扩张,缺乏有效监管,带来显著安全挑战。以 “星链”为例,“星链”在轨卫星超1万颗,曾两次迫近中国空间站致紧急避

威胁缺乏控轨能力的发展中国家航天器。此外,一些低轨卫星星座无视相关国家法律规定,在他国上空和边界私自开通信号服务,成为干预他国内政的工具。在非洲萨赫勒、南亚及东南亚地区,“星链”被暴恐分子、分离势力以及电诈集…

【星链卫星曾两次危险抵近中国空间站】当地时间12月29日,中国代表在低地球轨道卫星问题安理会阿里亚模式会议上发言时表示,个别国家的商业卫星星座肆意扩张,缺乏有效监管,带来显著安全挑战。以 “星链”为例,“星链”在轨卫星超1万颗,曾两次迫近中国空间站致紧急避

时隔36年,林妹妹与宝哥哥同框,网友惊呼逆生长

当陶慧敏身穿鲜红色长裙👗,夏菁则穿着一套黑色套裙,站在一起合影时,现场观众不禁惊叹:这两位仿佛从大观园走出来的美女,简直逆生长,依旧容光焕发。 时光流转,36年后的今天,陶慧敏与夏菁在第六届新时代国际电影节…

时隔36年,林妹妹与宝哥哥同框,网友惊呼逆生长

跨年的 N 种打开方式 花王陪你自在赴新岁(跨年跨年)

为不同跨年场景精心挑选适配的发色,以一抹新发色“好运密码”开启新年。 阿德莱德紫,跳动于发梢的灵动亮紫,是奔赴时尚派对的自信宣言,让你在光影中成为瞩目的焦点;米兰烟灰,一抹清冷深邃的灰调,适配职场跨年酒会的场…

跨年的 N 种打开方式 花王陪你自在赴新岁(跨年跨年)

曝光GPU价格狂飙,全民算力自由梦碎!(gpu爆满)

2026年开年,全球科技圈迎来一场“算力大地震”——『英伟达』与AMD正式开启显卡全线涨价潮,消费级与『数据中心』级GPU无一幸免。更关键的是,如今GPU与显存已采用“打包销售”模式,成本压力无法内部消化,只能层层转…

曝光GPU价格狂飙,全民算力自由梦碎!(gpu爆满)

木村拓哉工藤静香遛狗被偶遇,两人背情侣包,『穿搭』『打扮』都很显年轻(木村拓哉工藤静香星座)

最近,有网友在日本的街头偶遇了木村拓哉和妻子工藤静香,他们正带着狗散步。他一只手牵着狗走在前面,身上还背了一个斜挎包。更有趣的是,在两人散步时,木村拓哉一直保持着酷酷的姿态,始终没有回头,也没有等静香一…

木村拓哉工藤静香遛狗被偶遇,两人背情侣包,『穿搭』『打扮』都很显年轻(木村拓哉工藤静香星座)