DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型 DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。 AI产品动态# DeepSeek# 人工智能# 大语言模型 8个月前
面壁智能发布VoxCPM 0.5B语音生成模型:支持中英双语与实时流式输出,开源可商用 面壁智能发布VoxCPM 0.5B参数语音生成基座模型,支持中英双语流式输出与高精度音色克隆,在自然度和韵律表现达SOTA水平。模型已开源,适用于智能语音交互与数字内容创作。 AI产品动态# TTS技术# VoxCPM# 人工智能 8个月前
Meta发布Omnilingual ASR系统:支持1600种语言的突破性语音识别技术 Meta发布突破性Omnilingual ASR语音识别系统,支持1600余种语言转录,包含500种首次获AI支持语种。采用开源策略和少样本学习,字符错误率低于10%,为边缘语言群体提供数字接入解决方... AI产品动态# AI技术# Meta# 人工智能 7个月前
全球首个ViLLA架构具身智能模型开源!智元机器人GO-1基座模型全面开放 深度解析智元机器人GO-1通用具身基座大模型的开源价值:全球首个ViLLA架构具身智能模型技术突破,配套Genie Studio开发平台降低应用门槛,推动机器人技术普惠化发展。 AI产品动态# GenieStudio# GO-1模型# ViLLA架构 8个月前
Mistral AI发布企业级平台Mistral Medium 3.1:多模态性能超越GPT-4o,成本降低80% 深度解析Mistral Medium 3.1模型在MT-Bench 8.6分、32K上下文长度及80+编程语言支持方面的技术优势,揭示其相比GPT-4o降低80%企业成本的部署方案与微软Azure生态... AI产品动态# Azure云服务# GPT-4o# MistralAI 9个月前
微软开源rStar2-Agent数学推理模型:140亿参数超越6710亿大模型,主动式强化学习突破 微软研究院开源rStar2-Agent数学推理模型,仅140亿参数超越6710亿参数大模型。基于主动式强化学习架构,实现高效训练和卓越泛化能力,降低计算成本,推动AI推理技术发展。 AI产品动态# AI模型# 主动式强化学习# 小参数模型 9个月前
上海AI实验室开源Intern-S1-mini:80亿参数轻量多模态模型,专攻科学数据处理 上海AI实验室开源Intern-S1-mini多模态推理模型,80亿参数紧凑架构专攻科学数据处理,支持化学分子解析、蛋白质分析,适用于自动驾驶、医疗影像及智能客服场景,性能超越同类轻量模型。 AI产品动态# 上海AI实验室# 人工智能# 多模态模型 9个月前
极佳视界开源GigaWorld-0具身世界模型:90%数据由生成,突破机器人泛化瓶颈 极佳视界开源具身世界模型GigaWorld-0,凭借90%的世界模型生成数据占比,解决机器人数据稀缺与泛化不足问题。本文详解其与VLA模型GigaBrain-0的技术协同、资本背景及在工业与服务场景的... AI产品动态# AI泛化# GigaWorld-0# VLA模型 6个月前
巨人网络联合清华西工大发布三项AI音视频生成技术,GitHub全面开源 巨人网络联合清华西工大发布YingVideo-MV音乐视频生成、YingMusic-SVC歌声转换和YingMusic-Singer歌声合成三项AI技术,支持镜头与音乐毫秒级同步、零样本声音克隆,代码... AI新闻资讯# AI多模态生成# 巨人网络# 开源AI 6个月前
腾讯混元开源HunyuanWorld-Voyager:全球首个原生3D重建超长漫游世界模型 腾讯混元团队开源HunyuanWorld-Voyager,业界首个原生3D重建超长漫游世界模型,斯坦福WorldScore综合第一。支持单图像生成3D点云视频,提升VR与游戏开发效率,代码已开放下载。 AI产品动态# 3D重建# AI模型# VR技术 9个月前