AI视频生成新突破:Luma AI发布Ray3 Modify模型,实拍视频高保真修改保留表演细节 Luma AI最新发布的Ray3 Modify模型实现重大突破,首次支持对实拍视频进行高保真AI修改,完整保留演员表演细节。该技术通过角色参考图像和关键帧控制,实现服装、场景无缝转换及连贯过渡镜头生成... AI产品动态# AI突破# AI视频生成# LumaAI 1个月前
谷歌Gemini推出AI视频检测功能,可识别自家AI生成内容 谷歌Gemini平台正式推出AI视频检测功能,支持用户上传视频快速识别是否由谷歌AI生成。本文详细介绍功能使用方法、技术原理(基于SynthID水印)、当前限制及未来与C2PA标准的整合计划,助力应对... AI产品动态# AI生成内容识别# AI视频检测# SynthID数字水印 1个月前
国内首个具身智能国标VLA模型XR-1开源,北京人形机器人创新中心发布完整技术生态 2025年12月18日,北京人形机器人创新中心开源国内首个通过具身智能国标测试的VLA大模型XR-1,配套RoboMIND 2.0数据平台与ArtVIP数据集,实现“大脑+小脑+本体”全技术链,推动机... AI产品动态# VLA大模型# 人工智能# 人形机器人 1个月前
华为开源昇腾多模态推理加速套件MindIE SD,四大核心特性赋能AI开发者 华为正式开源昇腾多模态推理加速套件MindIE SD,集成加速插件、以存代算、多卡并行与量化稀疏优化四大核心功能,助力开发者高效部署多模态AI模型,提升昇腾平台推理性能与资源利用率。 AI产品动态# AI加速# AI开源# MindIESD 1个月前
OpenAI推出ChatGPT置顶对话功能,解决用户信息查找难题 OpenAI于2025年12月19日推出ChatGPT“聊天置顶”功能,支持多端使用,帮助用户快速固定重要对话,解决历史记录查找难题,进一步提升AI助手的信息管理效率与用户体验。 AI产品动态# AI助手# ChatGPT# OpenAI 1个月前
谷歌开源T5Gemma 2模型系列:多模态与长上下文处理的编码器-解码器新突破 谷歌开源T5Gemma 2模型系列,支持视觉-语言多模态输入与128K tokens长上下文处理,基于Gemma 3架构开发。涵盖270M、1B、4B参数版本,在数学推理、医疗文本生成等任务中性能显著... AI产品动态# Gemma3# T5Gemma2# 医疗AI 1个月前
苹果发布UniGen 1.5多模态AI模型:统一架构实现图像理解、生成与编辑一体化 苹果研究团队推出多模态AI模型UniGen 1.5,实现图像理解、生成与编辑一体化集成,通过创新编辑指令对齐和统一奖励系统提升任务准确度,在多项测试中表现优异,为AI视觉领域带来重要技术突破与应用前景... AI产品动态# AI模型突破# UniGen1.5# 人工智能技术 1个月前
微信AI助手元宝上线“一句话提醒”功能,语音指令占比超1/4,中老年用户成主力 微信AI助手元宝全新推出“一句话提醒”功能,用户可通过自然语言对话快速设置会议、服药等提醒。该功能依托混元与DeepSeek双引擎,支持语音输入,上线三天日均提醒量破百万,34%用户为50岁以上群体... AI产品动态# DeepSeek# 一句话提醒# 元宝 1个月前
大晓机器人发布ACE具身研发范式及开悟世界模型3.0,引领具身智能新突破 2025年大晓机器人发布ACE具身研发范式、开源开悟世界模型3.0及A1模组,解决行业数据瓶颈,推动具身智能商业化。联合壁仞科技等构建国产化生态,重塑全球技术竞争路径。 AI产品动态# ACE研发范式# AI商业化# 世界模型 2个月前
微软开源TRELLIS.2:40亿参数AI模型革新图像到3D生成,助力游戏与工业设计 微软最新开源AI工具TRELLIS.2是一款40亿参数的3D生成模型,专为高保真图像到3D转换设计。它基于3D VAE架构,支持1536³分辨率PBR资产生成,在H100 GPU上仅3秒即可生成512... AI产品动态# 3D生成# AI模型# PBR渲染 2个月前