法国人工智能初创企业Mistral AI近期密集发布多项技术进展,其最新推出的Devstral 2代码模型及配套工具引发行业高度关注。这款专为高级软件工程设计的AI模型延续了该公司开源策略,进一步巩固了其在开发者生态中的技术影响力。
12月9日发布的Devstral 2是该系列模型的重大升级版本,参数规模达到1230亿,较前代240亿参数的Devstral实现显著跃升。该模型通过API提供免费试用,未来商业定价设定为每百万tokens输入0.4美元、输出2美元。为满足不同场景需求,Mistral AI同步推出240亿参数的Devstral Small版本,定价维持前代水平。技术文档显示,运行完整版模型需至少四块NVIDIA H100 GPU,体现出其对高性能计算场景的优化。
值得关注的是,此次发布配套推出了名为Mistral Vibe的命令行工具,标志着公司正式进军”氛围编程”赛道。该工具整合了文件处理、代码检索、版本控制等核心功能,通过自然语言指令实现开发流程自动化。其创新性在于具备上下文感知能力,可扫描Git状态和文件结构,构建持续优化的开发环境上下文。这种设计理念与该公司AI助手Le Chat的记忆功能形成技术协同,为复杂软件开发提供全流程支持。
性能方面,官方披露Devstral 2在SWE-Bench Verified基准测试中取得46.8%的得分,较同类开源模型领先6个百分点以上。实际应用测试表明,该模型能有效处理多文件编辑、代码库探索等复杂任务,并兼容OpenHands等主流代理框架。技术团队特别强调,模型在解决真实GitHub问题时的表现已接近部分闭源商业模型水平。
此次发布恰逢Mistral 3系列基础模型上市一周后,形成技术矩阵效应。12月2日推出的Mistral 3系列包含3B至14B参数的小型密集模型及41B参数的Mistral Large 3旗舰模型,全部采用Apache 2.0开源协议。该系列通过混合注意力机制设计,实现在单张A100显卡上完成128K上下文窗口推理,吞吐量提升达42%,为企业级部署提供了更具性价比的选择。
市场分析认为,Mistral AI通过Devstral 2与Mistral 3的技术组合,正在构建从基础模型到垂直应用的完整生态。其坚持的开源策略显著降低了AI技术的使用门槛,目前模型权重已全面登陆Hugging Face等平台。公司披露正与HTX、Stellantis等企业合作推进机器人、车载AI等场景落地,显示出从开发者社区向商业市场扩展的战略意图。
© 版权声明
文章版权归作者所有,未经允许请勿转载。