英伟达开源Audio2Face面部动画模型,实时生成式AI技术助力游戏与3D开发 英伟达于2025年9月开源Audio2Face生成式AI面部动画模型,提供完整SDK与训练框架,支持Unreal Engine、Maya等平台,可实现实时口型同步与情感表达,已应用于《切尔诺贝利人2... AI产品动态# 3D应用# AI开源# Audio2Face 1个月前
全球首个原生全双工语音对话大模型RoboBrain-Audio发布,实现80毫秒级拟人实时对话 北京智源研究院联合发布全球首个原生全双工语音对话大模型RoboBrain-Audio,突破性实现80毫秒级边听边说能力,对话自然度提升47%,资源占用降低60%,模型权重与代码已开源,助力服务机器人与... AI产品动态# AI开源# RoboBrain-Audio# 人工智能 1个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 1个月前
蚂蚁百灵开源Ring-mini-2.0:轻量级AI推理模型,16B参数激活1.4B实现高效性能 蚂蚁百灵开源Ring-mini-2.0 AI推理模型,采用高效MoE设计,仅激活1.4B参数实现强大推理性能,支持128K长文本处理,吞吐量超500 token/s,助力企业降低AI应用成本。 AI产品动态# AI优化# AI开源# MoE架构 2个月前
2025全球大模型开源生态报告:中美路线分化、AI编程工具爆发与技术边界突破 2025年外滩大会AI开源论坛发布《全球大模型开源生态报告》2.0版,深度解析中美开源路线分化、AI编程工具爆发增长与技术边界突破三大趋势,涵盖114个开源项目与36万开发者数据,为AI行业提供关键洞... AI新闻资讯# AI开源# AI编程工具# GPT 2个月前
Kimi开源Checkpoint-Engine:20秒完成万亿级LLM权重更新,推理效率革命性突破 Kimi开源Checkpoint-Engine中间件实现万亿参数LLM权重20秒极速更新,采用广播与P2P双模式架构,节省40%磁盘IO,提升GPU利用率,推动大模型实时推理技术发展。 AI新闻资讯# AI开源# GPU集群# 大语言模型 2个月前
腾讯混元再推四款轻量化开源模型,边缘计算与消费级硬件迎来AI普惠新突破 腾讯混元发布四款轻量化开源大模型,覆盖0.5B-7B参数规模,支持消费级硬件与边缘计算场景,具备256K长文本处理与多Agent决策能力,已应用于腾讯会议、智能座舱等产品,推动AI技术低成本普惠化落地... AI产品动态# AI开源# 多Agent框架# 大模型应用 2个月前
马斯克xAI申请“Macrohard”商标,公开挑战微软AI生态 埃隆·马斯克xAI公司提交Macrohard商标申请,戏谑挑战微软AI布局。详解Grok模型开源策略、隐私风险及马斯克与盖茨竞争态势,洞察AI行业品牌博弈与技术趋势。 AI新闻资讯# AI开源# Grok# Macrohard 2个月前
微软开源VibeVoice-1.5B音频模型,突破90分钟长语音合成技术壁垒 微软开源VibeVoice-1.5B音频模型,突破90分钟连续语音合成技术,解决音色失真与语义连贯性问题。适用于有声书、在线教育及实时交互场景,降低制作成本,推动AI语音技术发展。 AI产品动态# AI开源# VibeVoice# 人工智能 2个月前
xAI开源Grok 2.5大模型:代码/数据全面开放,同步预告Grok 3突破性能力 xAI正式开源Grok 2.5大模型,提供500GB数据与42个模块,商业授权限年收入百万美元以下企业。详解Grok 3的百万级文本处理、电池故障预测能力,及移动端多模态功能升级,洞察AI开源战略与竞... AI产品动态# AI开源# Grok# xAI 2个月前