百度蒸汽机2.0全球首发多人有声视频生成,成本直降70% 百度蒸汽机MuseSteamer 2.0实现全球首个多人有声中文视频一体化生成,采用多模态时空规划技术,支持电影级画质与高精度语音还原,成本降低70%,已通过百度搜索、绘想平台开放商用。 AI产品动态# AI视频生成# 人工智能技术# 多模态AI 4个月前
Suno V5震撼发布:AI音乐创作迈入专业录音棚时代,人声表现力实现重大突破 深度解析Suno V5 AI音乐生成模型的突破性技术:沉浸式音频体验、情感化人声表现、精细化创作控制功能,探讨其对音乐产业工作流程和创作者角色的变革性影响。 AI产品动态# AI音乐# SunoV5# 人工智能 3个月前
华为鸿蒙AI超级智能体即将登陆Pura 80系列,开启智能体产业化元年 华为鸿蒙AI超级智能体将于本月在Pura 80系列手机首发上线,标志着2025年智能体产业化元年。该技术实现跨应用自主决策,交互效率提升200%,相关概念股表现活跃,产业链合作加速,有望推动新一轮换机... AI产品动态# AI智能体# Pura80# 产业链 4个月前
李沐团队开源语音大模型Higgs Audio V2:多语言对话生成与零样本克隆技术解析 深度解读李沐团队开源的Higgs Audio V2语音大模型:该模型以75.7%情感表达胜率刷新TTS基准,实现5秒音色克隆与多角色情感对话,将重塑智能客服、虚拟主播等场景的语音交互体验。 AI产品动态# AI语音合成# HiggsAudioV2# TTS技术 5个月前
月之暗面开源万亿参数MoE模型Kimi K2,AI领域迎来新旗舰 月之暗面于2025年7月11日发布并开源新一代MoE架构基础模型Kimi K2,该模型以1万亿总参数规模成为开源领域旗舰产品,在编程、智能体任务及工具调用等核心能力维度实现显著突破。本文详细解读Kim... AI产品动态# AI# KimiK2# MoE架构 5个月前
全球首个AI原生游戏引擎Mirage发布,开启游戏开发新纪元 Dynamics Lab发布全球首个AI原生游戏引擎Mirage,支持通过自然语言或简单指令动态生成游戏内容,彻底改变传统游戏开发模式,开启UGC2.0新时代。 AI产品动态# AI游戏引擎# Mirage# UGC2.0 6个月前
华人团队打造AI设计黑马Readdy.ai:高完成度界面生成工具引领行业变革 深度解析Readdy.ai核心技术:这款由蓝湖团队打造的AI设计工具如何通过网格系统优化、智能配色算法实现90%初稿可用率,并支持React/Vue多框架输出。了解其快速占领海外市场的6大竞争优势。 AI产品动态# AI设计工具# Readdy.ai# 前端开发 6个月前
生数科技Vidu Q1视频大模型:多元素同框与零分镜生成技术颠覆视频制作 生数科技Vidu Q1视频大模型通过参考生功能实现多元素同框、角色一致性强化及零分镜视频生成,显著降低专业视频制作门槛,成本仅为传统方法的1/30,已在电商广告、影视动漫等领域展开内测,推动视频生产范... AI产品动态# AI视频生成# ViduQ1# 商业化应用 5个月前
智谱科技发布工业级文本转语音模型GLM-TTS:3秒音色克隆、10万小时低数据训练,开源语音合成新标杆 智谱科技发布开源工业级文本转语音模型GLM-TTS,实现3秒音色克隆、10万小时低数据训练需求,字错误率低至0.89%。模型已应用于教育、客服等场景,训练成本降低50%以上,助力语音合成技术普惠化。 AI产品动态# AI技术# GLM-TTS# 多模态大模型 6天前
阿里开源3D数字人框架Mnn3dAvatar,支持面部捕捉和3D 虚拟角色动画映射 阿里巴巴近日正式开源3D数字人框架Mnn3dAvatar,该技术基于自研的3D高斯溅射算法,实现了高精度实时面部捕捉与虚拟角色动画映射,标志着消费级硬件迈入影视级数字人应用时代。 AI产品动态# 3D数字人# AI技术# 开源框架 6个月前