蚂蚁技术研究院发布LLaDA2.0系列扩散大模型,参数突破百亿颠覆传统架构 蚂蚁技术研究院2025年发布LLaDA2.0离散扩散大语言模型,参数规模突破千亿,采用WSD训练策略降低90%成本,推理速度达535 tokens/s,在代码生成与数学推理任务中超越传统模型。模型已开... AI产品动态# AI大模型# LLaDA2.0# 人工智能技术 2个月前
智谱科技发布工业级文本转语音模型GLM-TTS:3秒音色克隆、10万小时低数据训练,开源语音合成新标杆 智谱科技发布开源工业级文本转语音模型GLM-TTS,实现3秒音色克隆、10万小时低数据训练需求,字错误率低至0.89%。模型已应用于教育、客服等场景,训练成本降低50%以上,助力语音合成技术普惠化。 AI产品动态# AI技术# GLM-TTS# 多模态大模型 2个月前
智谱开源全球首个手机操作AI Agent模型AutoGLM,推动AI手机生态开放化 智谱正式开源全球首个具备手机操作能力的AI Agent模型AutoGLM,支持外卖、订票等复杂任务,覆盖50+中文应用。开源包含完整框架、工具链及Demo,采用MIT许可证,推动AI手机技术普及与生态... AI产品动态# AIAgent# AI手机# AutoGLM 2个月前
微软发布VibeVoice-Realtime-0.5B:5亿参数实现300ms实时语音合成,支持中英文与多角色对话 微软最新开源轻量级实时文本转语音模型VibeVoice-Realtime-0.5B,以仅5亿参数实现300毫秒首音延迟,支持中英文双语合成与4角色自然对话,适用于智能客服、数字人、电商直播等场景,推动... AI产品动态# AI语音模型# TTS# VibeVoice 2个月前
阿里千问App月活增速149%登顶全球,中国AI应用创下载量破千万纪录 阿里千问App以149.03%月活增速登顶全球AI应用增长榜,公测首周下载量突破1000万次。深度解析Qwen大模型技术如何超越GPT5,以及“AI规划→消费”闭环模式如何引领AI Agent商业化浪... AI产品动态# AI助手# AI应用市场# AI竞争 2个月前
英伟达发布开源自动驾驶模型Alpamayo-R1,L4级具身智能迎来关键突破 英伟达在NeurIPS 2025发布开源推理视觉语言动作模型Alpamayo-R1,专为L4级自动驾驶设计,实现多模态端到端融合,提升环境感知与决策能力。性能测试显示规划准确率提高12%,碰撞率降低2... AI产品动态# AI技术# Alpamayo-R1# L4级自动驾驶 2个月前
阿里开源Z-Image图像生成模型:60亿参数实现商业级画质,技术门槛大幅降低 阿里巴巴开源Z-Image图像生成模型,采用60亿参数轻量架构,通过DMD解耦技术实现8步采样出图,支持复杂指令解析与双语文字渲染,显存占用仅16GB,兼容RTX 30系列显卡,推动AI绘图技术普惠化... AI产品动态# AI图像生成# DiT架构# Z-Image 2个月前
德国Black Forest Labs发布FLUX.2系列AI图像生成模型,硬件门槛降低40% 德国Black Forest Labs于2025年推出FLUX.2 AI图像生成模型,采用创新架构降低GPU显存需求40%,支持4MP输出与多图参考功能,助力消费级显卡运行专业图像任务,现已开源并实现... AI产品动态# AI图像生成# FLUX.2# NVIDIA 2个月前
腾讯混元3D创作引擎国际站正式上线,全球用户可免费体验AI 3D建模 腾讯混元3D创作引擎国际站正式上线,采用自研Hunyuan3D 3.0模型,支持1536几何分辨率与36亿体素超高清建模。全球用户可通过文字、图片、草图直接生成3D作品,新用户每日享20次免费生成权益... AI产品动态# 3D-DiT技术# 3D创作引擎# AI建模 2个月前
东南亚AI格局生变:新加坡国家AI计划弃用Llama转向阿里通义千问,Qwen-SEA-LION-v4登顶区域榜单 新加坡国家AI计划放弃Meta Llama,采用阿里巴巴通义千问架构开发东南亚语言大模型Qwen-SEA-LION-v4。该模型在区域性语言处理性能提升30%,登顶SEA-HELM榜单,仅需32GB内... AI产品动态# Qwen# 东南亚语言模型# 人工智能 2个月前