腾讯混元开源视频音效生成模型HunyuanVideo-Foley,AI驱动影视音效制作变革 腾讯混元开源视频音效生成模型HunyuanVideo-Foley,通过扩散模型技术实现85%以上音画同步准确率,助力影视与游戏行业降低制作成本,支持环境音与动作音效自动生成。 AI产品动态# AI音效生成# 多模态AI# 开源模型 5个月前
谷歌发布Titans与MIRAS大模型架构:突破Transformer限制,推动AGI进程 谷歌发布全新大模型架构Titans和MIRAS,Titans支持超200万token上下文,突破Transformer记忆瓶颈;MIRAS解决多模态对齐问题。两大架构已应用于实际平台,预计2026年商... AI新闻资讯# AI突破# DeepMind# MIRAS架构 2个月前
Poe推出200人AI群聊功能!集成200+模型重塑协作体验 深度解析Poe最新推出的AI群聊功能:支持200人同时协作,集成200余个先进AI模型,具备智能调度系统和多设备同步技术,适用于家庭旅行规划、企业团队协作等多场景,重新定义人机交互模式。 AI产品动态# AI群聊# Poe平台# Quora 3个月前
谷歌开源T5Gemma 2模型系列:多模态与长上下文处理的编码器-解码器新突破 谷歌开源T5Gemma 2模型系列,支持视觉-语言多模态输入与128K tokens长上下文处理,基于Gemma 3架构开发。涵盖270M、1B、4B参数版本,在数学推理、医疗文本生成等任务中性能显著... AI产品动态# Gemma3# T5Gemma2# 医疗AI 1个月前
谷歌Doppl推出AI沉浸式购物模块:静态商品秒变动态视频,虚拟试穿技术重塑电商体验 谷歌Doppl推出基于AI的沉浸式购物模块,通过多模态算法将静态商品转为动态视频,结合虚拟试穿实现全链路消费闭环。本文解析其技术原理、用户数据提升效果及行业差异化策略,探讨生成式AI如何重塑电商未来。 AI产品动态# 人工智能# 动态视频展示# 多模态AI 2个月前
字节跳动发布OmniHuman-1.5视频生成模型:语音驱动多角色动画技术突破 深度解析字节跳动OmniHuman-1.5视频生成模型的技术特性:支持语音驱动、多角色互动与情感感知,突破分钟级动画生成限制,适用于影视、虚拟主播等商业化场景,推动AI内容创作技术发展。 AI产品动态# AI技术突破# OmniHuman# 人工智能 5个月前
谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆 谷歌推出Gemini 3 Flash模型,以Pro版1/4的成本实现3倍运行速度,在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索,标志AI竞赛进入白热化阶段... AI产品动态# AI模型# Gemini3Flash# OpenAI 2个月前
谷歌发布Gemini 3 Pro Image:多模态AI实现对话式图像编辑与4K高清生成 谷歌推出Gemini 3 Pro Image多模态AI模型,支持4K分辨率图像生成和对话式迭代编辑,在图像质量提升40%的同时集成Google搜索确保事实准确性,现已在Vertex AI平台开放调用。 AI产品动态# AI技术# Gemini3Pro# VertexAI 2个月前
Rokid Glasses完成Kickstarter众筹40万美元,多模态AR眼镜实现消费级突破 深度解析Rokid Glasses AR眼镜的众筹成果与技术优势:49克轻量化设计、多模态AI协同、支付宝声纹支付及高德全场景导航功能,涵盖产品特性、生态合作及全球市场订单数据,为AR行业提供消费级落... AI产品动态# AR眼镜# Kickstarter# Rokid 5个月前
AI虚拟走秀《名作艺术秀》全球热议:梵高、达利跨时空亮相T台 深度解析全球首个AI艺术虚拟走秀《名作艺术秀》的技术突破与行业价值:通过2000万组色彩数据算法还原名画细节,探索AI在艺术创作、文物修复及商业应用中的前沿实践,获卢浮宫等顶级机构关注。 AI新闻资讯# AI艺术# 人机共创# 多模态AI 7个月前