10月16日,在FORCE LINK AI创新巡展武汉站上,火山引擎宣布对豆包大模型系列进行全面升级,重点推出豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)及豆包声音复刻模型2.0(Doubao-Seed-ICL 2.0)。此次升级标志着语义理解与情感演绎能力的双重突破,新模型可精准朗读复杂数学公式(准确率90%),并支持通过自然语言指令动态调节语速、情绪、音调等11项参数,实现更具表现力的语音合成效果。
同期发布的豆包大模型1.6版本成为国内首个原生支持”分档调节思考长度”的模型,提供Minimal/Low/Medium/High四档选择。实测数据显示,在低思考长度模式下,总输出tokens减少77.5%,思考时间缩短84.6%,同时保持模型效果不变。针对轻量化需求推出的豆包大模型1.6 lite版本,在0-32k输入区间的综合使用成本较1.5 pro降低53.3%,企业级场景测评性能提升14%。
火山引擎总裁谭待披露,截至2025年9月底,豆包大模型日均tokens调用量突破30万亿,较5月底增长超80%。这一数据印证了AI产业落地的加速趋势。IDC最新报告显示,火山引擎以49.2%的市场份额领跑2025年上半年中国公有云大模型服务市场。
技术演进方面,谭待指出当前大模型发展呈现三大趋势:深度思考与多模态理解的融合加速、音视频模型达到生产级水准、企业级复杂Agent逐步成熟。为应对企业多元化需求,火山引擎同步推出”智能模型路由”系统,支持豆包、DeepSeek、Qwen、Kimi等主流模型的智能调度。
© 版权声明
文章版权归作者所有,未经允许请勿转载。