腾讯混元近日推出国内首个交互式AI播客,标志着播客行业进入智能化互动新阶段。该产品于2025年8月正式上线,其核心创新在于突破传统播客单向传播模式,用户可通过语音或文字实时打断主持人与嘉宾发言进行提问。这一功能依托腾讯混元大模型的四项关键技术:意图识别、长上下文理解、多轮对话及外部联网检索,使系统能结合播客内容上下文精准响应查询。例如在收听社会议题讨论时,用户可即时追问”相关研究数据来源”或”延伸阅读建议”,AI将基于实时检索生成补充信息。
技术实现层面,该播客具备跨模态生成能力,支持将文本、网页及PDF文档自动转换为自然流畅的双人对话音频。目前已接入微信公众号、腾讯新闻、腾讯文档等平台,用户可对内容呈现形式进行多维度定制:内容风格提供默认、深度探索(结合AI搜索延展)和思辨讨论(双主持人观点交锋)三种模式;主持配置支持单人讲述或双人对谈;音色库包含8种高质感声线,如”古风小玉”“京腔大叔”等,可实现跨时空角色对话。
行业观察人士指出,这种”静态转动态”的内容生产方式与实时交互能力的结合,不仅提升信息获取效率,更重构了音频内容的消费逻辑。实测显示,在收听关于”Z世代社交习惯变迁”的播客时,用户提出”比较中日青年宅文化差异”的即时请求,系统能在10秒内整合学术论文与媒体报道生成结构化回答。目前该功能已面向全量用户开放,预计将推动知识类音频内容的沉浸式体验升级。
© 版权声明
文章版权归作者所有,未经允许请勿转载。