YouTube推出AI音乐主持人功能:基于Gemini大模型打造个性化音乐体验

AI新闻资讯2个月前发布 AI视野

YouTube近日通过其Labs计划推出了一项创新性的AI音乐主持人功能,旨在通过动态生成的音频内容提升用户的音乐流媒体体验。这项实验性功能目前面向美国、加拿大等地区的YouTube Premium订阅用户开放测试,需在Android设备上启用”Labs体验”开关,且暂仅支持英文内容生成。

该功能依托Google Gemini大模型的自然语言处理能力,结合Tacotron和WaveNet等先进的语音合成技术,能够在音乐播放过程中智能插入15-90秒的个性化音频片段。系统通过分析用户收听历史、歌曲元数据及实时播放曲目特征,动态生成与音乐氛围契合的幕后故事、艺术冷知识或专业评论。例如在播放爵士乐时,AI可能会讲述某位萨克斯手的创作轶事;而在电子音乐场景下则转为介绍合成器技术的发展历程。

技术实现上,YouTube充分利用其庞大的视频资源库优势,能够从音乐MV、艺术家访谈等内容中提取独家素材进行二次创作。与Spotify的AI DJ功能相比,该系统的差异化优势在于:一是内容生成更具场景适配性,能在混音曲目切换间隙或广告时段实现”无缝衔接”;二是未来计划支持语音交互,用户可通过”讲讲这首歌的编曲故事”等指令实现内容定制。

行业观察指出,这标志着音乐流媒体竞争从”曲目覆盖广度”向”内容体验深度”转变。YouTube表示该功能仍处于测试阶段,存在生成内容质量不稳定的风险,但强调其音频概述技术在小剂量使用时已展现出良好效果。平台同时透露,作为Labs计划的一部分,未来还将探索更多AI驱动的音乐交互创新。

© 版权声明

相关文章