IBM发布Granite 4.0 Nano系列:3.5亿至15亿参数小型AI模型,支持消费级硬件部署

IBM近日发布Granite 4.0 Nano系列模型组,包含四款参数规模从3.5亿至15亿的小型生成式AI模型,以高效能、低硬件门槛为核心优势实现差异化竞争。该系列于2025年10月29日正式亮相,采用Apache 2.0开源协议,支持商业应用与研究开发。

性能表现方面,15亿参数的Granite-4.0-H-1B在关键基准测试中超越同类产品:IFEval指令跟随评估达78.5分,优于Quen3 1.7B的73.1分;伯克利函数调用排行榜v3中工具调用得分54.8,较竞品高出5个百分点。值得注意的是,3.5亿参数版本可在8-16GB内存的消费级笔记本CPU运行,最小模型甚至支持浏览器端部署,显著降低开发者对云计算资源的依赖。

技术实现上,该系列通过优化架构实现硬件适配性突破。15亿参数模型仅需6-8GB显存GPU或等效CPU交换空间,Transformer.js创建者Joshua Lochner证实其边缘计算潜力。IBM强调,这种设计使模型在智能体工作流程中展现出色表现,尤其在数学推理、编程辅助及安全评估等场景。

此次发布延续了IBM 10月初推出的Granite 4.0系列技术路线,但Nano版本通过参数精简进一步拓展了移动端和轻量化应用场景。所有模型均通过ISO42001负责任AI认证,并兼容llama.cpp、vLLM等主流工具链,为企业和独立开发者提供即插即用的AI解决方案。

© 版权声明

相关文章