2025年6月17日起,豆包电脑版及网页版全量上线“AI播客”功能,用户可通过上传PDF或网页链接一键生成双人对话式播客内容。该功能基于豆包大模型团队研发的语音播客模型,其语音效果因高度拟人化、自然停顿及语气词模拟等特点引发广泛关注,被视为AI技术在日常应用中的一次突破性尝试。
技术亮点:还原真人对话场景
新功能通过音色与语调差异区分对话角色,模拟真实聊天场景,甚至能捕捉情感起伏。内测用户反馈称,生成的播客在语气词附和(如“嗯”“没错”)及节奏把控上与真人对话几乎无异,大幅提升了长文资料的学习效率。此外,流式模型架构使生成时间缩短至5秒内,支持实时字幕输出。
操作便捷性:三步完成内容转化
用户登录豆包官网或电脑版客户端后,可在输入框下方找到“AI播客”入口,上传文件或粘贴网页链接即可生成内容。目前支持PDF格式的学术论文、行业报告等文本,网页版还提供“网页播客”一键转化选项。需注意,该功能暂未开放手机端使用,且需更新至最新版本。
应用场景拓展:低成本创作与知识传播
功能上线后,部分用户将其用于通勤学习、会议纪要转化等场景。火山引擎透露,相关技术已同步接入扣子空间(Coze平台),支持通过Prompt指令生成定制化播客。行业分析认为,此类工具将降低音频内容创作门槛,尤其适用于教育、媒体等领域的高效知识输出。
目前,豆包团队尚未公布后续功能迭代计划,但用户普遍期待增加多语言支持及更细粒度的音色定制选项。
© 版权声明
文章版权归作者所有,未经允许请勿转载。