MiniMax发布Voice Design音色设计功能,AI语音合成进入个性化时代

国内人工智能企业稀宇科技(MiniMax)于6月21日至23日期间陆续发布其语音合成技术的重要更新——Voice Design音色设计功能。该功能作为MiniMax Speech-02模型的核心升级,通过自然语言交互实现音色全维度定制,标志着AI语音生成进入个性化时代。

最新技术资料显示,用户仅需在文本框中输入描述性指令(如”性感有气息的女声”或”古代侠客的正直洪亮声”),系统即可生成三种不同风格的语音样本供选择。该功能支持5000字符的长文本输入,并允许对音频质量、情感表达等12项参数进行微调。值得注意的是,其创新性在于突破传统音色库限制,能生成”世界上不存在的音色”,同时规避真人声纹复制的法律风险。

据企业披露,Speech系列模型已累计生成1.5亿小时语音内容,服务覆盖30个国家。此次升级特别针对细分场景需求,例如可快速生成符合悬疑播客、新闻播报等专业场景的定制化音色。技术团队强调,系统采用”语言×口音×音色”的全自定义架构,在Artificial Analysis国际评测中保持领先地位。

目前该功能已在minimaxi.com/audio平台开放体验,初期提供3次免费生成额度。市场分析认为,这项技术将重塑语音合成行业标准,特别是在有声读物、智能客服等需要高度个性化语音的领域产生深远影响。企业方表示,后续将推出商业订阅方案,并计划于今夏整合至视频创作工具生态中。

© 版权声明

相关文章