火山引擎豆包大模型全面升级：语音合成2.0突破情感演绎，1.6版本首创思考长度分档调节

AI产品动态7个月前发布 AI视野

10月16日，在FORCE LINK AI创新巡展武汉站上，火山引擎宣布对豆包大模型系列进行全面升级，重点推出豆包语音合成模型2.0（Doubao-Seed-TTS 2.0）及豆包声音复刻模型2.0（Doubao-Seed-ICL 2.0）。此次升级标志着语义理解与情感演绎能力的双重突破，新模型可精准朗读复杂数学公式（准确率90%），并支持通过自然语言指令动态调节语速、情绪、音调等11项参数，实现更具表现力的语音合成效果。

同期发布的豆包大模型1.6版本成为国内首个原生支持”分档调节思考长度”的模型，提供Minimal/Low/Medium/High四档选择。实测数据显示，在低思考长度模式下，总输出tokens减少77.5%，思考时间缩短84.6%，同时保持模型效果不变。针对轻量化需求推出的豆包大模型1.6 lite版本，在0-32k输入区间的综合使用成本较1.5 pro降低53.3%，企业级场景测评性能提升14%。

火山引擎总裁谭待披露，截至2025年9月底，豆包大模型日均tokens调用量突破30万亿，较5月底增长超80%。这一数据印证了AI产业落地的加速趋势。IDC最新报告显示，火山引擎以49.2%的市场份额领跑2025年上半年中国公有云大模型服务市场。

技术演进方面，谭待指出当前大模型发展呈现三大趋势：深度思考与多模态理解的融合加速、音视频模型达到生产级水准、企业级复杂Agent逐步成熟。为应对企业多元化需求，火山引擎同步推出”智能模型路由”系统，支持豆包、DeepSeek、Qwen、Kimi等主流模型的智能调度。

文章版权归作者所有，未经允许请勿转载。

火山引擎豆包大模型全面升级：语音合成2.0突破情感演绎，1.6版本首创思考长度分档调节

Windows 11重大AI更新：语音唤醒Copilot与视觉分析功能全面上线

影目科技发布INMO GO3 AI智能眼镜，开启“AI+AR”时尚生态新纪元

相关文章

马斯克：Grok 5有10%概率实现AGI，实时数据是突破关键

马斯克xAI启动Grokipedia太空知识保存计划：将人类文明刻入星际介质

百度智能云曦灵手语数字人获联合国AI向善杰出案例奖，助力全球听障群体信息无障碍

美团开源5600亿参数混合专家模型LongCat-Flash，推理速度提升3倍

最新资讯

热门AI工具

热门资讯