面壁智能开源多模态模型MiniCPM-V 4.0，图像理解能力超越主流模型

AI产品动态10个月前发布 AI视野

面壁智能于8月5日正式开源新一代多模态模型MiniCPM-V 4.0，该模型在图像理解能力上实现显著突破，超越GPT-4.1-mini-20250414等主流模型。作为MiniCPM-V系列的最新版本，其参数规模为4B，通过OpenCompass评测显示，其性能优于Qwen2.5-VL-3B-Instruct和InternVL2.5-8B等同类模型。

此次开源的亮点在于模型的高效部署能力。MiniCPM-V 4.0针对移动端优化，在iPhone 16 Pro Max等设备上运行时，首token延迟低于2秒，解码速度达17 token/s以上。面壁智能同步发布了适配iOS系统的开源应用，进一步降低了终端用户的使用门槛。

技术层面，该模型继承了MiniCPM-V 2.6的实用特性，并通过架构优化大幅提升推理效率。其核心优势体现在两方面：一是采用轻量化设计，使4B参数模型在保持高性能的同时降低计算资源需求；二是实现端侧部署的稳定性，为移动场景下的实时多模态交互提供可能。

此次开源标志着面壁智能在端侧AI模型领域取得新进展。通过将实验室技术转化为可落地的终端应用，该公司正推动多模态AI从云端向边缘设备延伸。目前模型及相关代码已通过官方渠道开放访问。

AI产品动态 # AI # MiniCPM-V4.0 # 图像理解 # 多模态模型 # 开源 # 移动端优化 # 面壁智能

文章版权归作者所有，未经允许请勿转载。

面壁智能开源多模态模型MiniCPM-V 4.0，图像理解能力超越主流模型

微软通过Windows AI Foundry推出OpenAI轻量化模型gpt-oss-20b，助力本地AI部署

腾讯推出智能问答框架WeKnora，助力企业级文档问答场景

相关文章

OpenAI发布GPT-5-Codex：动态智能AI编程工具，代码重构成功率提升20%

Dexmal开源VLA代码库Dexbotic：统一框架解决具身智能碎片化难题

企业微信AI新功能助力工厂高效管理，巡检整改周期缩短至1-2天

OpenAI重磅发布两款开源大模型GPT-OSS-120B和GPT-OSS-20B，性能媲美专有模型

最新资讯

热门AI工具

热门资讯