YouTube推出AI音乐主持人功能：基于Gemini大模型打造个性化音乐体验

AI新闻资讯7个月前发布 AI视野

YouTube近日通过其Labs计划推出了一项创新性的AI音乐主持人功能，旨在通过动态生成的音频内容提升用户的音乐流媒体体验。这项实验性功能目前面向美国、加拿大等地区的YouTube Premium订阅用户开放测试，需在Android设备上启用”Labs体验”开关，且暂仅支持英文内容生成。

该功能依托Google Gemini大模型的自然语言处理能力，结合Tacotron和WaveNet等先进的语音合成技术，能够在音乐播放过程中智能插入15-90秒的个性化音频片段。系统通过分析用户收听历史、歌曲元数据及实时播放曲目特征，动态生成与音乐氛围契合的幕后故事、艺术冷知识或专业评论。例如在播放爵士乐时，AI可能会讲述某位萨克斯手的创作轶事；而在电子音乐场景下则转为介绍合成器技术的发展历程。

技术实现上，YouTube充分利用其庞大的视频资源库优势，能够从音乐MV、艺术家访谈等内容中提取独家素材进行二次创作。与Spotify的AI DJ功能相比，该系统的差异化优势在于：一是内容生成更具场景适配性，能在混音曲目切换间隙或广告时段实现”无缝衔接”；二是未来计划支持语音交互，用户可通过”讲讲这首歌的编曲故事”等指令实现内容定制。

行业观察指出，这标志着音乐流媒体竞争从”曲目覆盖广度”向”内容体验深度”转变。YouTube表示该功能仍处于测试阶段，存在生成内容质量不稳定的风险，但强调其音频概述技术在小剂量使用时已展现出良好效果。平台同时透露，作为Labs计划的一部分，未来还将探索更多AI驱动的音乐交互创新。

文章版权归作者所有，未经允许请勿转载。

YouTube推出AI音乐主持人功能：基于Gemini大模型打造个性化音乐体验

欢瑞世纪《江山北望》互动影游定档2025年Q4，携手阶跃星辰深度应用AI技术

香港首部全AI生成短片《九宵》入选釜山国际电影节，开创AI电影新纪元

相关文章

OpenAI估值冲刺5000亿美元：GPT-5革新在即，股权出售锁定核心人才

苹果AI入华再延期！Apple Intelligence推迟至iOS 26.4，技术难题与合规挑战成主因

微软WinUI开源计划分四阶段推进，2025年10月完成首阶段

苹果AI高管再流失！搜索负责人Ke Yang跳槽Meta，Siri升级计划或受影响

最新资讯

热门AI工具

热门资讯