耐能发布全球首款终端Mamba模型AI芯片KL1140,实现1200亿参数本地化运行

AI芯片企业Kneron耐能于2025年11月26日正式发布新一代旗舰产品KL1140,该芯片是全球首款能在终端设备完整执行Mamba模型架构的神经处理单元(NPU)。作为边缘AI领域的重要突破,KL1140采用40e TOPS算力设计,通过四芯级联技术可支持运行1200亿参数的大语言模型,同时将功耗控制在传统GPU解决方案的三分之一水平。

KL1140主要面向语音理解、自然语言处理、智能视觉、边缘决策及机器人等应用场景。其技术核心在于实现了Mamba架构的端侧完整执行能力,这项突破使得大语言模型能够脱离云端数据中心,直接在本地设备运行。公司创始人Albert Liu强调,该技术不仅降低了硬件成本(最高可达云方案的十分之一),更重要的是为隐私敏感型应用提供了符合监管要求的解决方案,包括金融、医疗等行业的实时数据处理需求。

耐能同时公布了产品路线图,计划于2028年推出算力达200e TOPS的迭代型号KL1150。当前KL1140已进入量产阶段,其多芯片协同工作模式可提供相当于图形处理器的性能表现,特别适用于需要离线环境运行的智能终端设备。行业分析认为,这项技术将加速边缘计算在自动驾驶、工业物联网等领域的商业化落地进程。

© 版权声明

相关文章