微软发布自研AI模型MAI-Voice-1与MAI-1-preview，构建独立技术体系

AI产品动态4个月前发布 AI视野

在全球人工智能竞争持续升级的背景下，微软于2025年8月29日正式发布两款自主研发的AI模型——语音生成模型MAI-Voice-1与大语言模型MAI-1-preview，标志着其在与OpenAI深度合作七年后，首次构建独立技术体系。这一战略举措被视为微软AI发展的重要转折点，同时也折射出行业格局的深刻变革。

技术双轨布局：语音与通用模型的突破
MAI-Voice-1作为微软首款端到端训练的语音生成模型，展现出显著的性能优势。该模型支持40种语体风格与情绪模板，可模拟海盗、机器人等多样化声线，并在单块GPU上实现每秒生成1分钟音频的实时响应。其核心技术突破包括动态语调调节技术和多说话人交互模式，目前已应用于Copilot Daily的AI新闻播报功能，并通过Copilot Labs向开发者开放定制测试。用户可自主选择音色与表达风格，实测显示其播客对话生成能力已具备高度自然度。

同步发布的MAI-1-preview是微软首个完全自主训练的大语言模型，基于15,000块Nvidia H100 GPU完成训练，采用混合专家（MoE）架构以平衡性能与成本。该模型在LMArena文本任务榜单中排名第13位，其指令遵循能力已应用于Copilot助手的特定文本场景。微软AI负责人穆斯塔法・苏莱曼强调，该模型表现“远超其硬件规模预期”，未来数周将通过用户反馈持续优化。

战略转向：降低OpenAI依赖的深层考量
此次发布恰逢OpenAI同日推出语音模型，凸显双方竞合关系的微妙变化。尽管微软对OpenAI累计投资超130亿美元，但近期财报已将其列为竞争对手。分析指出，MAI系列模型的推出旨在构建技术自主权，尤其在语音交互这一未来核心赛道上抢占先机。微软明确表示，MAI-1-preview将逐步替代部分OpenAI模型在Copilot中的功能，但现阶段仍保持双轨并行策略。

目前，两款模型已面向特定用户开放测试，微软计划通过实际应用数据加速迭代。行业观察家认为，此举或重塑AI供应链格局，推动企业从单一供应商依赖转向多元化技术布局。随着MAI系列后续版本的研发投入，微软在通用人工智能领域的自主化进程将进一步提速。

文章版权归作者所有，未经允许请勿转载。

微软发布自研AI模型MAI-Voice-1与MAI-1-preview，构建独立技术体系

OpenAI发布GPT-Realtime语音对话模型：延迟降低、多语言支持与图像感知成亮点

夸克推出AI创作平台“造点”：一键生成图片视频，降低创作门槛

相关文章

大疆创新进军智能家居领域：首款扫拖一体机器人ROMO即将发布

OpenAI发布GPT-Realtime语音对话模型：延迟降低、多语言支持与图像感知成亮点

智联招聘发布AI版本：通义千问3大模型技术助力人岗匹配精准度提升70%

谷歌上线Weather Lab气象预测网站，用DeepMind AI模型预测台风路径

最新资讯

热门AI工具

热门资讯