Soul在WAIC 2025宣布内测全双工通话大模型,革新AI社交互动体验

在2025世界人工智能大会(WAIC 2025)上,社交平台Soul宣布即将内测其最新研发的全双工通话大模型,这一技术革新将显著提升虚拟人实时通话和AI匹配互动体验。该模型摒弃了传统语音交互中的话音活性检测(VAD)机制与延迟控制逻辑,打破了行业中普遍存在的“轮次对话”模式,赋予AI自主决策对话节奏的能力,实现了双向实时语音交流,用户与AI之间可以无缝对话而不会出现语音重叠或延迟问题。

Soul的全双工通话大模型将应用于虚拟人实时通话、AI匹配等1V1和多对多的互动场景。在WAIC现场演示中,AI主持人在多人语音互动场景中表现出色,不仅能有效管理群聊秩序,还能自然地进行语音互动,活跃气氛并鼓励用户参与讨论。这一技术的引入将减少沟通中的尴尬和不适,让参与者更轻松地表达观点,从而提升社交平台的活跃度和用户参与感。

此外,Soul还展示了全双工实时视频通话能力的最新探索成果。基于全双工语音通话和实时视频生成技术,用户可以看到“AI的形象和世界”,更立体地塑造“数字人格”,促进关系的深度链接。此前,Soul团队在实时人像视频生成领域的研究成果已被国际学术顶会CVPR 2025接收。

Soul App CTO陶明表示,在新质生产力深刻影响人类生活的背景下,AI融入社交关系网络、重构交互方式已成为趋势。Soul致力于构建AI Being与Human Being共存的社交社区,通过AI赋能链接、构建场景、提升体验,为用户带来幸福感和归属感。

随着全双工通话大模型的内测和后续落地,用户将在虚拟人实时通话和AI匹配等多个场景中享受到更加高效、自然的互动体验。这一技术的推出不仅标志着AI在社交领域的应用迈向新高度,也为社交平台的未来发展指明了方向。

© 版权声明

相关文章