腾讯混元开源HunyuanWorld-Voyager:全球首个原生3D重建超长漫游世界模型 腾讯混元团队开源HunyuanWorld-Voyager,业界首个原生3D重建超长漫游世界模型,斯坦福WorldScore综合第一。支持单图像生成3D点云视频,提升VR与游戏开发效率,代码已开放下载。 AI产品动态# 3D重建# AI模型# VR技术 2个月前
腾讯混元再推四款轻量化开源模型,边缘计算与消费级硬件迎来AI普惠新突破 腾讯混元发布四款轻量化开源大模型,覆盖0.5B-7B参数规模,支持消费级硬件与边缘计算场景,具备256K长文本处理与多Agent决策能力,已应用于腾讯会议、智能座舱等产品,推动AI技术低成本普惠化落地... AI产品动态# AI开源# 多Agent框架# 大模型应用 2个月前
阶跃星辰发布开源语音大模型Step-Audio 2 mini,多模态架构革新语音交互 阶跃星辰发布开源语音大模型Step-Audio 2 mini,突破端到端多模态架构,在MMAU、URO Bench测试中领先,中文识别错误率仅3.19%,已与吉利、TCL合作落地,推动语音交互技术革新... AI产品动态# Step-Audio# 人工智能# 多模态AI 2个月前
Meta加速开发Llama 4.X AI模型,2025年底前推出增强版应对竞争 Meta加速开发Llama 4.X AI模型,以解决Llama 4系列性能争议并应对市场竞争。了解新模型的技术迭代、算力扩展计划及2025年发布目标,分析Meta在开源AI生态中的战略布局。 AI产品动态# AI模型# Llama4.X# Meta 2个月前
阿里国际开源多模态大模型Ovis2.5:视觉推理突破,中小企业AI应用门槛大降 阿里国际发布并开源多模态大模型Ovis2.5,9B与2B版本在OpenCompass评测领先,支持动态分辨率与跨模态推理。适用于电商、翻译及终端设备,助力企业低成本AI转型,技术全面开源。 AI产品动态# Ovis2.5# 人工智能技术# 多模态大模型 2个月前
面壁智能开源MiniCPM-V4.5:8B参数实现高刷视频理解,端侧AI迎来突破 面壁智能开源MiniCPM-V4.5多模态模型,8B参数实现高刷视频理解,性能超越72B级竞品。创新3D-Resampler技术达12倍压缩率,适用于智能座舱、工业质检等实时场景,现已在GitHub等... AI产品动态# 人工智能# 多模态模型# 开源AI 2个月前
VAREdit突破AI图像编辑瓶颈:自回归框架实现0.7秒高保真编辑 智象未来研发的VAREdit框架突破扩散模型局限,采用视觉自回归架构实现0.7秒极速图像编辑,在PIE-Bench测试中性能提升41.5%,开源推动AI图像编辑技术产业化与实时创作应用。 AI产品动态# AI图像编辑# VAREdit# 图像生成技术 2个月前
上海AI实验室开源Intern-S1-mini:80亿参数轻量多模态模型,专攻科学数据处理 上海AI实验室开源Intern-S1-mini多模态推理模型,80亿参数紧凑架构专攻科学数据处理,支持化学分子解析、蛋白质分析,适用于自动驾驶、医疗影像及智能客服场景,性能超越同类轻量模型。 AI产品动态# 上海AI实验室# 人工智能# 多模态模型 2个月前
字节跳动开源512K长文本大模型Seed-OSS-36B:性能超越Gemma3、Qwen3-32B 字节跳动开源360亿参数大模型Seed-OSS-36B,支持512K超长文本处理,性能超越Gemma3-27B和Qwen3-32B。Apache-2.0协议可免费商用,适用于法律分析、代码库理解等长文... AI产品动态# AI大模型# GPT替代方案# Seed-OSS-36B 2个月前
阿里巴巴开源多模态智能体WebWatcher,性能超越GPT-4o 阿里巴巴开源多模态智能体WebWatcher在HLE-VL等基准测试中表现超越GPT-4o,提供图文融合的深度研究能力。了解这款革命性AI工具如何改变多模态信息处理格局。 AI产品动态# GPT-4o# WebWatcher# 多模态智能体 2个月前