Mistral AI发布新一代Mistral 3系列开源模型,挑战科技巨头推动企业级AI应用

法国人工智能初创公司Mistral AI于12月2日正式发布新一代Mistral 3系列开放权重模型,包含多款小型密集模型及旗舰版Mistral Large 3,所有模型均基于Apache 2.0开源协议发布。此次发布标志着该公司在挑战科技巨头、推动企业级AI应用方面迈出重要一步。

Mistral 3系列包含三款小型密集模型(14B、8B和3B参数规模)以及采用稀疏架构的混合专家模型Mistral Large 3。其中Large 3作为该系列的旗舰产品,拥有6750亿总参数和410亿活跃参数,采用”细粒度专家混合”架构,支持256,000上下文窗口的高效推理,具备多模态和多语言处理能力。该模型使用3000块英伟达H200 GPU训练完成,在LMArena排行榜的OSS非推理模型类别中位列第二。

公司联合创始人兼首席科学家Guillaume Lample指出,虽然大型闭源模型在开箱即用性能上可能占优,但经过微调的小型模型往往能更高效地满足企业实际需求。他表示:”绝大多数企业用例可以通过小型模型解决,特别是在经过定制化微调后,其性能甚至可以超越闭源模型。”

作为一家成立仅两年的初创企业,Mistral AI由前DeepMind和Meta研究人员创立,目前已筹集约27亿美元资金,估值达137亿美元。此次发布的开放权重模型策略,与OpenAI等公司的闭源商业模式形成鲜明对比,体现了该公司”更大并不总是更好”的技术理念。

分析认为,Mistral 3系列的推出不仅丰富了开放权重模型生态,也为企业客户提供了更具成本效益的AI解决方案选择,特别是在机器人、自主设备等应用领域展现出独特优势。

© 版权声明

相关文章