字节跳动发布OmniHuman-1.5视频生成模型:语音驱动多角色动画技术突破 深度解析字节跳动OmniHuman-1.5视频生成模型的技术特性:支持语音驱动、多角色互动与情感感知,突破分钟级动画生成限制,适用于影视、虚拟主播等商业化场景,推动AI内容创作技术发展。 AI产品动态# AI技术突破# OmniHuman# 人工智能 5个月前
Rokid Glasses完成Kickstarter众筹40万美元,多模态AR眼镜实现消费级突破 深度解析Rokid Glasses AR眼镜的众筹成果与技术优势:49克轻量化设计、多模态AI协同、支付宝声纹支付及高德全场景导航功能,涵盖产品特性、生态合作及全球市场订单数据,为AR行业提供消费级落... AI产品动态# AR眼镜# Kickstarter# Rokid 5个月前
字节跳动豆包平台推出AI驱动3D模型生成工具,助力游戏开发与多模态AI生态 了解字节跳动豆包平台最新AI驱动的3D模型生成工具,支持图像和混合生成模式,专注于游戏开发和工业级应用,预计短期开放,助力多模态AI生态发展。 AI产品动态# AI3D生成# AIGC# 多模态AI 5个月前
谷歌Gemini 2.5 Flash图像模型发布:多模态编辑精度超越GPT-4o 15% 深度解析谷歌Gemini 2.5 Flash图像模型的技术突破:多模态编辑精度超GPT-4o 15%,支持角色一致性保持与多图像融合,商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。 AI产品动态# AI商业应用# AI图像生成# OpenAI竞争 5个月前
DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean,颠覆传统视频制作模式 DeepFuture发布全球首个接入GPT-5的视频生成智能体Video Ocean,支持通过自然语言生成1-5分钟高质量视频,完播率提升3倍,适用于新闻、科普、商业演示等多场景,现已开放企业版订阅服... AI产品动态# AIGC# DeepFuture# GPT-5 5个月前
华为鸿蒙小艺助手12.2.6.402版本众测升级:交互重构与多模态AI全面增强 华为小艺智能助手12.2.6.402版本开启众测,新增桌面入口、智能体集成与多模态AI功能,优化语音交互与任务处理能力,适用于健康咨询、文案生成等场景,推动鸿蒙生态AI服务体验全面提升。 AI产品动态# AI升级# DeepSeek# HarmonyOS 5个月前
谷歌Gemini大模型能耗报告发布:文本生成单次仅0.24瓦时,Gemma 3轻量版同步亮相 谷歌发布Gemini大模型能耗报告:文本生成单次仅耗电0.24瓦时,同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术,及在移动端多模态处理场景的... AI产品动态# AI能耗# Gemma3# Transformer架构 5个月前
可灵AI 2.1首尾帧功能重磅发布,视频生成效果提升235%突破技术瓶颈 可灵AI推出2.1首尾帧功能,视频生成效果较前代提升235%,GSB评分行业领先,支持复杂运镜与艺术风格切换,已应用于宣传片、AI短剧等场景,全球用户超2200万。 AI产品动态# AI创作工具# AI视频生成# 可灵AI 5个月前
NSF与英伟达1.52亿美元投资AI2开发开源多模态AI模型,加速科学研究突破 NSF与英伟达宣布投资1.52亿美元支持AI2开发开源多模态AI模型OMAI,推动材料科学、生物学等领域的透明化研究。项目涵盖完整开源工具链与人才培养,加速科学发现进程。 AI新闻资讯# AI2# NSF# 人工智能 6个月前
百度蒸汽机2.0全球首发多人有声视频生成,成本直降70% 百度蒸汽机MuseSteamer 2.0实现全球首个多人有声中文视频一体化生成,采用多模态时空规划技术,支持电影级画质与高精度语音还原,成本降低70%,已通过百度搜索、绘想平台开放商用。 AI产品动态# AI视频生成# 人工智能技术# 多模态AI 6个月前