快手开源多模态大模型Kwai Keye-VL-8B,视频理解与逻辑推理能力突破 快手发布并开源多模态大语言模型Kwai Keye-VL-8B,突破视频理解与逻辑推理性能,支持文本、图像、视频多模态处理,并在高考数学测试中表现优异,加速AI技术商业化进程。 AI产品动态# AI# KwaiKeye-VL-8B# 多模态大模型 4个月前
中科院SolidGeo基准揭示MLLM立体几何推理短板,最优模型准确率不足50% 中科院最新SolidGeo基准测试显示:主流多模态大语言模型在立体几何推理任务中平均准确率不足50%,较人类水平差距达28%。研究深入分析3113道三维几何问题,揭示MLLM在空间折叠、多图推理等复杂... AI新闻资讯# SolidGeo基准# 中科院研究# 人工智能 4个月前
小红书开源多模态大模型dots.vlm1,性能接近国际领先水平 小红书正式开源多模态大模型dots.vlm1,基于自研NaViT视觉编码器和DeepSeek V3构建,在MMMU、MathVision等基准测试中性能接近Gemini 2.5 Pro等闭源先进模型... AI产品动态# AI开源# DeepSeekV3# dots.vlm1 3个月前
哈工大与度小满联合开源多模态大模型高效化基准框架EFFIVLM-BENCH EFFIVLM-BENCH是业界首个面向多模态大模型(LVLM)高效化部署的跨场景基准测试框架,旨在解决LVLM在产业落地中面临的显存占用高、算力需求大等核心瓶颈。 AI新闻资讯# AI技术# 多模态大模型# 开源框架 5个月前
通义APP上线AI形象自定义功能,支持多模态个性化交互 阿里巴巴通义APP全面上线AI形象自定义功能,支持视觉形象、声音特征及人格设定定制,集成多模态大模型技术,适用于智能陪伴、教育辅助等场景,探索人机交互新范式。 AI产品动态# AI形象自定义# 个性化AI# 人机交互 2个月前
百度地图发布新一代AI语音座舱系统,五大功能重构人机交互体验 百度地图2025年推出新一代跨模态AI语音座舱系统,基于端到端大模型实现情感交互、精准时空识别和座舱硬件控制,复合指令准确率达92%,为车企提供端云协同的智能座舱解决方案。 AI产品动态# AI语音系统# 多模态大模型# 智能座舱 2个月前
宇树科技发布Unitree R1人形机器人:起售价3.99万元,集成多模态大模型技术 宇树科技发布Unitree R1人形机器人,起售价3.99万元,集成多模态大模型技术,支持开发者定制。具备26个高自由度关节,运动控制能力突出,为消费级和行业级市场提供高性能通用平台。 AI产品动态# AI机器人# UnitreeR1# 人形机器人 3个月前
上海AI Lab与浙大联合团队突破AI视觉推理:RRVF方法验证非对称性原理 上海AI Lab与浙大团队发布AI视觉推理重大突破:RRVF方法通过验证非对称性原理实现97.83%执行率,实证验证者法则。研究揭示未来AI发展核心在于构建可验证环境,为多模态大模型提供新范式。 AI新闻资讯# AI视觉推理# 上海AILab# 人工智能 3个月前
OpenAI推出ChatGPT Pro云存储连接器功能,支持Google Drive等多平台集成 OpenAI最新推出ChatGPT Pro云存储连接器功能,深度集成Google Drive、Dropbox等平台,通过MCP技术提升企业文档处理效率。了解这一企业AI解决方案如何改变知识管理方式。 AI产品动态# ChatGPT# MCP技术# OpenAI 4个月前
2025深圳AI产品榜·2周年大会:AI与智能硬件的深度融合 2025年深圳AI产品榜·2周年大会聚焦AI与智能硬件的深度融合,邀请200余位行业精英,探讨多模态大模型、AI编程工具等前沿技术,展示最新创新成果。免费报名审核制,获取前沿产品体验与专家交流机会。 AI新闻资讯# AI大会# AI技术# 多模态大模型 4个月前