MiniMax发布Voice Design音色设计功能，AI语音合成进入个性化时代

AI产品动态11个月前发布 AI视野

国内人工智能企业稀宇科技（MiniMax）于6月21日至23日期间陆续发布其语音合成技术的重要更新——Voice Design音色设计功能。该功能作为MiniMax Speech-02模型的核心升级，通过自然语言交互实现音色全维度定制，标志着AI语音生成进入个性化时代。

最新技术资料显示，用户仅需在文本框中输入描述性指令（如”性感有气息的女声”或”古代侠客的正直洪亮声”），系统即可生成三种不同风格的语音样本供选择。该功能支持5000字符的长文本输入，并允许对音频质量、情感表达等12项参数进行微调。值得注意的是，其创新性在于突破传统音色库限制，能生成”世界上不存在的音色”，同时规避真人声纹复制的法律风险。

据企业披露，Speech系列模型已累计生成1.5亿小时语音内容，服务覆盖30个国家。此次升级特别针对细分场景需求，例如可快速生成符合悬疑播客、新闻播报等专业场景的定制化音色。技术团队强调，系统采用”语言×口音×音色”的全自定义架构，在Artificial Analysis国际评测中保持领先地位。

目前该功能已在minimaxi.com/audio平台开放体验，初期提供3次免费生成额度。市场分析认为，这项技术将重塑语音合成行业标准，特别是在有声读物、智能客服等需要高度个性化语音的领域产生深远影响。企业方表示，后续将推出商业订阅方案，并计划于今夏整合至视频创作工具生态中。

文章版权归作者所有，未经允许请勿转载。

MiniMax发布Voice Design音色设计功能，AI语音合成进入个性化时代

月之暗面开源多模态模型Kimi-VL-A3B-Thinking-2506，性能超越GPT-4o

特斯拉Robotaxi试点服务正式启动：无人驾驶出租车进入商业化验证阶段

相关文章

北京发布三项AI+教育成果：大模型精准教学、AI应用超市3.0、可信数据空间

可灵AI 2.1首尾帧功能重磅发布，视频生成效果提升235%突破技术瓶颈

Databricks完成超40亿美元L轮融资，估值达1340亿美元，加速AI与数据分析业务扩张

Adobe发布Project Graph可视化节点编辑系统，重塑AI辅助创作流程

最新资讯

热门AI工具

热门资讯