腾讯混元世界模型1.5正式开源:国内首个实时交互式3D世界建模技术突破 腾讯混元世界模型1.5正式开源,实现文本或图片输入实时生成可自由探索的3D交互场景,具备24FPS高清视频流、几何一致性及多视角交互能力,为AI内容生成与具身智能研究提供全链路技术基础设施。 AI产品动态# 3D生成# AI开源# AI技术突破 5个月前
昆仑万维开源Skywork-Reward-V2系列奖励模型,刷新七大评测基准SOTA成绩 昆仑万维最新开源Skywork-Reward-V2系列奖励模型,覆盖6亿至80亿参数规模,在七大评测基准中刷新SOTA成绩。该模型采用创新人机协同数据构建方法,推动RLHF技术进步,降低AI技术门槛... AI产品动态# AI开源# RLHF# Skywork-Reward-V2 11个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 8个月前
Pokee AI开源7B深度研究代理,模块化架构助力科研效率突破 Pokee AI正式开源PokeeResearch-7B深度研究代理,采用MoE架构支持多领域科研任务分解,提供标准化API接口,单张A100即可实现高效科研推理,助力中小团队专业级研究。 AI产品动态# AI开源# API接口# PokeeResearch-7B 7个月前
阶跃星辰开源图像生成模型NextStep-1.1:150亿参数自回归模型实现视觉伪影系统性优化 阶跃星辰于2025年12月开源NextStep-1.1图像生成模型,该150亿参数自回归模型通过基于流的强化学习技术,系统性解决视觉伪影问题,提升细节保真度与训练稳定性,现已托管于Hugging Fa... AI产品动态# AI开源# NextStep-1.1# 人工智能技术 5个月前
阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,语音技术实现音色克隆与轻量化识别突破 阿里巴巴通义大模型团队开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,实现3秒音色克隆、多语言情感控制及轻量化高精度识别,降低延迟50%,支持实时场景与创意产业应用,加速语音... AI产品动态# AI开源# Fun-ASR-Nano# Fun-CosyVoice 5个月前
华为开源昇腾多模态推理加速套件MindIE SD,四大核心特性赋能AI开发者 华为正式开源昇腾多模态推理加速套件MindIE SD,集成加速插件、以存代算、多卡并行与量化稀疏优化四大核心功能,助力开发者高效部署多模态AI模型,提升昇腾平台推理性能与资源利用率。 AI产品动态# AI加速# AI开源# MindIESD 5个月前
商汤科技开源空间智能大模型SenseNova-SI系列,8B版本性能超越GPT-5 2025年商汤科技开源空间智能大模型SenseNova-SI系列,8B版本以60.99分超越GPT-5和Gemini-2.5-Pro。突破空间结构理解技术短板,提供完整技术资源下载,推动自动驾驶、机器... AI产品动态# AI开源# GPT-5对比# SenseNova-SI 6个月前
阿里通义千问发布Qwen3-VL 2B/32B新版本,实现全场景多模态AI覆盖 阿里巴巴通义千问团队最新发布Qwen3-VL 2B和32B版本,在STEM问答、视觉理解等多项测试中超越GPT-5 mini和Claude 4 Sonnet。32B模型仅用少量参数实现与235B模型竞... AI产品动态# AI开源# Qwen3-VL# 人工智能 7个月前
AI21 Labs开源Jamba Reasoning 3B:首款支持手机端运行的商业级开源大模型 AI21 Labs开源Jamba Reasoning 3B大模型,采用创新SSM-Transformer混合架构,专为移动端优化。作为首款支持手机运行的商业级开源模型,在保持高性能的同时大幅降低资源消... AI产品动态# AI21Labs# AI开源# JambaReasoning3B 8个月前