面壁智能于8月5日正式开源新一代多模态模型MiniCPM-V 4.0,该模型在图像理解能力上实现显著突破,超越GPT-4.1-mini-20250414等主流模型。作为MiniCPM-V系列的最新版本,其参数规模为4B,通过OpenCompass评测显示,其性能优于Qwen2.5-VL-3B-Instruct和InternVL2.5-8B等同类模型。
此次开源的亮点在于模型的高效部署能力。MiniCPM-V 4.0针对移动端优化,在iPhone 16 Pro Max等设备上运行时,首token延迟低于2秒,解码速度达17 token/s以上。面壁智能同步发布了适配iOS系统的开源应用,进一步降低了终端用户的使用门槛。
技术层面,该模型继承了MiniCPM-V 2.6的实用特性,并通过架构优化大幅提升推理效率。其核心优势体现在两方面:一是采用轻量化设计,使4B参数模型在保持高性能的同时降低计算资源需求;二是实现端侧部署的稳定性,为移动场景下的实时多模态交互提供可能。
此次开源标志着面壁智能在端侧AI模型领域取得新进展。通过将实验室技术转化为可落地的终端应用,该公司正推动多模态AI从云端向边缘设备延伸。目前模型及相关代码已通过官方渠道开放访问。
© 版权声明
文章版权归作者所有,未经允许请勿转载。