Flowith推出多模态AI人生模拟器flolife.me,革新游戏体验 Flowith团队发布多模态AI人生模拟器flolife.me,结合多模态画布和Multi-Agent技术,提供自定义角色和动态人生轨迹生成。了解AI如何革新游戏体验,支持社交分享,并探讨未来在教育仿... AI产品动态# AI人生模拟器# AI游戏# flolife.me 2个月前
谷歌Gemini API全面上线URL Context功能,革新AI文档处理与多模态理解 谷歌Gemini API全面集成URL Context功能,支持直接处理URL内容(网页、PDF、图像),实现34MB大文档解析和多模态理解。本文解析其技术优势、对RAG架构的革新及在数据分析领域的S... AI产品动态# AIAPI# RAG架构# URLContext 2个月前
阶跃星辰发布开源语音大模型Step-Audio 2 mini,多模态架构革新语音交互 阶跃星辰发布开源语音大模型Step-Audio 2 mini,突破端到端多模态架构,在MMAU、URO Bench测试中领先,中文识别错误率仅3.19%,已与吉利、TCL合作落地,推动语音交互技术革新... AI产品动态# Step-Audio# 人工智能# 多模态AI 2个月前
腾讯混元开源视频音效生成模型HunyuanVideo-Foley,AI驱动影视音效制作变革 腾讯混元开源视频音效生成模型HunyuanVideo-Foley,通过扩散模型技术实现85%以上音画同步准确率,助力影视与游戏行业降低制作成本,支持环境音与动作音效自动生成。 AI产品动态# AI音效生成# 多模态AI# 开源模型 2个月前
字节跳动发布OmniHuman-1.5视频生成模型:语音驱动多角色动画技术突破 深度解析字节跳动OmniHuman-1.5视频生成模型的技术特性:支持语音驱动、多角色互动与情感感知,突破分钟级动画生成限制,适用于影视、虚拟主播等商业化场景,推动AI内容创作技术发展。 AI产品动态# AI技术突破# OmniHuman# 人工智能 2个月前
Rokid Glasses完成Kickstarter众筹40万美元,多模态AR眼镜实现消费级突破 深度解析Rokid Glasses AR眼镜的众筹成果与技术优势:49克轻量化设计、多模态AI协同、支付宝声纹支付及高德全场景导航功能,涵盖产品特性、生态合作及全球市场订单数据,为AR行业提供消费级落... AI产品动态# AR眼镜# Kickstarter# Rokid 2个月前
字节跳动豆包平台推出AI驱动3D模型生成工具,助力游戏开发与多模态AI生态 了解字节跳动豆包平台最新AI驱动的3D模型生成工具,支持图像和混合生成模式,专注于游戏开发和工业级应用,预计短期开放,助力多模态AI生态发展。 AI产品动态# AI3D生成# AIGC# 多模态AI 2个月前
谷歌Gemini 2.5 Flash图像模型发布:多模态编辑精度超越GPT-4o 15% 深度解析谷歌Gemini 2.5 Flash图像模型的技术突破:多模态编辑精度超GPT-4o 15%,支持角色一致性保持与多图像融合,商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。 AI产品动态# AI商业应用# AI图像生成# OpenAI竞争 2个月前
DeepFuture发布全球首个GPT-5视频生成智能体Video Ocean,颠覆传统视频制作模式 DeepFuture发布全球首个接入GPT-5的视频生成智能体Video Ocean,支持通过自然语言生成1-5分钟高质量视频,完播率提升3倍,适用于新闻、科普、商业演示等多场景,现已开放企业版订阅服... AI产品动态# AIGC# DeepFuture# GPT-5 2个月前
华为鸿蒙小艺助手12.2.6.402版本众测升级:交互重构与多模态AI全面增强 华为小艺智能助手12.2.6.402版本开启众测,新增桌面入口、智能体集成与多模态AI功能,优化语音交互与任务处理能力,适用于健康咨询、文案生成等场景,推动鸿蒙生态AI服务体验全面提升。 AI产品动态# AI升级# DeepSeek# HarmonyOS 2个月前