中科院SolidGeo基准揭示MLLM立体几何推理短板,最优模型准确率不足50% 中科院最新SolidGeo基准测试显示:主流多模态大语言模型在立体几何推理任务中平均准确率不足50%,较人类水平差距达28%。研究深入分析3113道三维几何问题,揭示MLLM在空间折叠、多图推理等复杂... AI新闻资讯# SolidGeo基准# 中科院研究# 人工智能 6个月前
百度地图发布新一代AI语音座舱系统,五大功能重构人机交互体验 百度地图2025年推出新一代跨模态AI语音座舱系统,基于端到端大模型实现情感交互、精准时空识别和座舱硬件控制,复合指令准确率达92%,为车企提供端云协同的智能座舱解决方案。 AI产品动态# AI语音系统# 多模态大模型# 智能座舱 4个月前
快手开源多模态大模型Kwai Keye-VL-8B,视频理解与逻辑推理能力突破 快手发布并开源多模态大语言模型Kwai Keye-VL-8B,突破视频理解与逻辑推理性能,支持文本、图像、视频多模态处理,并在高考数学测试中表现优异,加速AI技术商业化进程。 AI产品动态# AI# KwaiKeye-VL-8B# 多模态大模型 6个月前
通义APP上线AI形象自定义功能,支持多模态个性化交互 阿里巴巴通义APP全面上线AI形象自定义功能,支持视觉形象、声音特征及人格设定定制,集成多模态大模型技术,适用于智能陪伴、教育辅助等场景,探索人机交互新范式。 AI产品动态# AI形象自定义# 个性化AI# 人机交互 4个月前
小红书开源多模态大模型dots.vlm1,性能接近国际领先水平 小红书正式开源多模态大模型dots.vlm1,基于自研NaViT视觉编码器和DeepSeek V3构建,在MMMU、MathVision等基准测试中性能接近Gemini 2.5 Pro等闭源先进模型... AI产品动态# AI开源# DeepSeekV3# dots.vlm1 4个月前
宇树科技发布Unitree R1人形机器人:起售价3.99万元,集成多模态大模型技术 宇树科技发布Unitree R1人形机器人,起售价3.99万元,集成多模态大模型技术,支持开发者定制。具备26个高自由度关节,运动控制能力突出,为消费级和行业级市场提供高性能通用平台。 AI产品动态# AI机器人# UnitreeR1# 人形机器人 5个月前
OpenAI推出ChatGPT Pro云存储连接器功能,支持Google Drive等多平台集成 OpenAI最新推出ChatGPT Pro云存储连接器功能,深度集成Google Drive、Dropbox等平台,通过MCP技术提升企业文档处理效率。了解这一企业AI解决方案如何改变知识管理方式。 AI产品动态# ChatGPT# MCP技术# OpenAI 6个月前
2025深圳AI产品榜·2周年大会:AI与智能硬件的深度融合 2025年深圳AI产品榜·2周年大会聚焦AI与智能硬件的深度融合,邀请200余位行业精英,探讨多模态大模型、AI编程工具等前沿技术,展示最新创新成果。免费报名审核制,获取前沿产品体验与专家交流机会。 AI新闻资讯# AI大会# AI技术# 多模态大模型 5个月前
阿里国际开源多模态大模型Ovis2.5:视觉推理突破,中小企业AI应用门槛大降 阿里国际发布并开源多模态大模型Ovis2.5,9B与2B版本在OpenCompass评测领先,支持动态分辨率与跨模态推理。适用于电商、翻译及终端设备,助力企业低成本AI转型,技术全面开源。 AI产品动态# Ovis2.5# 人工智能技术# 多模态大模型 4个月前
上海AI Lab与浙大联合团队突破AI视觉推理:RRVF方法验证非对称性原理 上海AI Lab与浙大团队发布AI视觉推理重大突破:RRVF方法通过验证非对称性原理实现97.83%执行率,实证验证者法则。研究揭示未来AI发展核心在于构建可验证环境,为多模态大模型提供新范式。 AI新闻资讯# AI视觉推理# 上海AILab# 人工智能 4个月前