微软近日正式推出实验性AI中心Copilot Labs,该平台旨在通过开放创新工具推动人工智能技术的社区共创。作为首款上线产品,”Copilot音频表达”(Copilot Audio Expressions)文本转语音工具凭借其情感化输出和创意控制功能引发行业关注。
这款语音生成工具采用微软最新语音模型,支持Emotive(情感表达)和Story(故事创作)两种核心模式。在Emotive模式下,系统能自动优化文本措辞并添加细节,使生成的英文语音具有更丰富的情感层次;Story模式则提供多角色叙事能力,可自动区分不同角色的口音和对话风格。技术文档显示,该工具目前支持最长90秒的MP3格式音频输出,用户无需注册即可直接使用。
值得注意的是,该平台采用”实验性”定位,强调用户参与对AI演进的塑造作用。微软表示,Copilot Labs将持续引入前沿AI工具,并鼓励开发者社区共同探索应用场景。不过现阶段该工具仅支持英文文本输入,官方尚未公布多语言扩展的具体时间表。
行业分析指出,这是微软继Copilot智能助手后,在生成式AI领域的又一重要布局。通过将语音生成技术开放给普通用户测试,微软可能意在收集真实场景数据以优化底层模型。与同类产品相比,该工具在情感表达维度的精细化控制具有一定技术差异性。
© 版权声明
文章版权归作者所有,未经允许请勿转载。