多模态AI

字节跳动发布OmniHuman-1.5视频生成模型：语音驱动多角色动画技术突破

深度解析字节跳动OmniHuman-1.5视频生成模型的技术特性：支持语音驱动、多角色互动与情感感知，突破分钟级动画生成限制，适用于影视、虚拟主播等商业化场景，推动AI内容创作技术发展。

9个月前

Rokid Glasses完成Kickstarter众筹40万美元，多模态AR眼镜实现消费级突破

深度解析Rokid Glasses AR眼镜的众筹成果与技术优势：49克轻量化设计、多模态AI协同、支付宝声纹支付及高德全场景导航功能，涵盖产品特性、生态合作及全球市场订单数据，为AR行业提供消费级落...

AI产品动态 # AR眼镜 # Kickstarter # Rokid

9个月前

字节跳动豆包平台推出AI驱动3D模型生成工具，助力游戏开发与多模态AI生态

了解字节跳动豆包平台最新AI驱动的3D模型生成工具，支持图像和混合生成模式，专注于游戏开发和工业级应用，预计短期开放，助力多模态AI生态发展。

AI产品动态 # AI3D生成 # AIGC # 多模态AI

9个月前

谷歌Gemini 2.5 Flash图像模型发布：多模态编辑精度超越GPT-4o 15%

深度解析谷歌Gemini 2.5 Flash图像模型的技术突破：多模态编辑精度超GPT-4o 15%，支持角色一致性保持与多图像融合，商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。

AI产品动态 # AI商业应用 # AI图像生成 # OpenAI竞争

9个月前

DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean，颠覆传统视频制作模式

DeepFuture发布全球首个接入GPT-5的视频生成智能体Video Ocean，支持通过自然语言生成1-5分钟高质量视频，完播率提升3倍，适用于新闻、科普、商业演示等多场景，现已开放企业版订阅服...

AI产品动态 # AIGC # DeepFuture # GPT-5

9个月前

华为鸿蒙小艺助手12.2.6.402版本众测升级：交互重构与多模态AI全面增强

华为小艺智能助手12.2.6.402版本开启众测，新增桌面入口、智能体集成与多模态AI功能，优化语音交互与任务处理能力，适用于健康咨询、文案生成等场景，推动鸿蒙生态AI服务体验全面提升。

AI产品动态 # AI升级 # DeepSeek # HarmonyOS

9个月前

谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

谷歌发布Gemini大模型能耗报告：文本生成单次仅耗电0.24瓦时，同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术，及在移动端多模态处理场景的...

AI产品动态 # AI能耗 # Gemma3 # Transformer架构

9个月前

可灵AI 2.1首尾帧功能重磅发布，视频生成效果提升235%突破技术瓶颈

可灵AI推出2.1首尾帧功能，视频生成效果较前代提升235%，GSB评分行业领先，支持复杂运镜与艺术风格切换，已应用于宣传片、AI短剧等场景，全球用户超2200万。

AI产品动态 # AI创作工具 # AI视频生成 # 可灵AI

9个月前

NSF与英伟达1.52亿美元投资AI2开发开源多模态AI模型，加速科学研究突破

NSF与英伟达宣布投资1.52亿美元支持AI2开发开源多模态AI模型OMAI，推动材料科学、生物学等领域的透明化研究。项目涵盖完整开源工具链与人才培养，加速科学发现进程。

AI新闻资讯 # AI2 # NSF # 人工智能

9个月前

百度蒸汽机2.0全球首发多人有声视频生成，成本直降70%

百度蒸汽机MuseSteamer 2.0实现全球首个多人有声中文视频一体化生成，采用多模态时空规划技术，支持电影级画质与高精度语音还原，成本降低70%，已通过百度搜索、绘想平台开放商用。

AI产品动态 # AI视频生成 # 人工智能技术 # 多模态AI

9个月前

字节跳动发布OmniHuman-1.5视频生成模型：语音驱动多角色动画技术突破

Rokid Glasses完成Kickstarter众筹40万美元，多模态AR眼镜实现消费级突破

字节跳动豆包平台推出AI驱动3D模型生成工具，助力游戏开发与多模态AI生态

谷歌Gemini 2.5 Flash图像模型发布：多模态编辑精度超越GPT-4o 15%

DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean，颠覆传统视频制作模式

华为鸿蒙小艺助手12.2.6.402版本众测升级：交互重构与多模态AI全面增强

谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

可灵AI 2.1首尾帧功能重磅发布，视频生成效果提升235%突破技术瓶颈

NSF与英伟达1.52亿美元投资AI2开发开源多模态AI模型，加速科学研究突破

百度蒸汽机2.0全球首发多人有声视频生成，成本直降70%

热门AI工具

最新资讯