计算机视觉

清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

清华大学与IDEA研发的GUAVA框架实现单张照片0.1秒生成高保真3D化身，渲染速度50帧/秒，突破传统多视角限制。技术入选ICCV 2025，开源代码推动影视、游戏与虚拟会议应用，助力元宇宙基础设...

9个月前

小红书AIGC团队突破DynamicFace算法，实现高质量换脸技术

小红书AIGC团队研发的DynamicFace算法在计算机视觉领域取得重要突破，实现了高质量、高一致性的换脸效果，广泛应用于影视、游戏和电商领域。

AI产品动态 # AI技术 # 小红书AIGC # 换脸技术

9个月前

上海交通大学发布全球首个AI生成3D人脸质量评估数据集Gen3DHF

上海交通大学发布全球首个AI生成3D人脸质量评估数据集Gen3DHF，配套创新LMME3DHF评估框架，解决行业可解释性痛点，推动虚拟现实、数字人等应用标准化发展。

AI新闻资讯 # 3D人脸生成 # AI # 上海交通大学

10个月前

Meta开源视觉大模型DINOv3：70亿参数自监督学习技术突破

深度解析Meta最新开源的DINOv3视觉大模型：70亿参数规模、17亿训练图像的自监督学习技术突破，及其在医疗影像、卫星遥感、自动驾驶等领域的革命性应用。了解这一计算机视觉领域里程碑式进展的技术细节...

AI产品动态 # AI # DINOv3 # Meta

10个月前

中科院深圳先进院发布HYPIR图像复原大模型，1.7秒实现8K超高清修复

中科院深圳先进院发布HYPIR图像复原大模型，1.7秒完成8K超高清修复，速度提升数十倍。该技术突破在影视修复、医疗影像和文化遗产保护领域具有广泛应用前景。

AI产品动态 # 8K修复 # HYPIR模型 # 人工智能

10个月前

小米AI团队两项突破性研究成果入选ICCV 2025，Q-Frame与Any-SSR技术引领行业创新

小米AI团队在ICCV 2025发表两项行业首创技术：Q-Frame视频理解大模型和Any-SSR持续学习框架。Q-Frame通过动态帧选择与分辨率自适应提升模型性能，Any-SSR解决大语言模型持续...

AI新闻资讯 # Any-SSR # ICCV2025 # Q-Frame

11个月前

MIT华人团队突破具身智能研究：普通摄像头实现机器人高精度控制

麻省理工学院华人团队在《Nature》发表具身智能突破性研究，开发出仅需普通RGB摄像头即可实现多类型机器人高精度控制的深度学习框架，为医疗、制造等领域提供低成本自动化解决方案。

AI新闻资讯 # MIT # 人工智能 # 具身智能

11个月前

智源研究院发布OmniGen2：新一代开源统一图像生成模型，多模态能力全面升级

深度解析智源研究院OmniGen2图像生成模型技术亮点：40亿参数开源架构，支持文本到图像无缝切换，在GenEval测试中评分0.86。了解其反思机制、多模态生成能力及FlagScale推理加速方案。

AI产品动态 # AI生成模型 # 多模态AI # 开源项目

11个月前

字节跳动开源4D视频生成框架EX-4D：单目视频转高质量多视角4D序列

字节跳动最新开源的EX-4D框架实现单目视频到4D序列的突破性转换，采用深度防水网格与双mask策略，在FID/VBench指标上超越现有方案70.7%用户认可其物理一致性，为VR/影视行业提供高效解...

AI新闻资讯 # 4D生成 # AI技术 # 字节跳动

11个月前

腾讯开源全球首个全链路混元3D 2.1生成大模型，适配消费级显卡

腾讯在计算机视觉领域顶级会议CVPR 2025上宣布开源混元3D 2.1大模型。作为全球首个全链路开源的工业级3D生成模型，该技术实现了从模型权重、训练代码到数据处理流程的完整开放，显著降低了3D内容...

AI产品动态 # 3D生成 # AI # 开源技术

12个月前

清华大学与IDEA联合研发GUAVA框架：单张照片0.1秒生成3D化身，实时渲染破局元宇宙基建

小红书AIGC团队突破DynamicFace算法，实现高质量换脸技术

上海交通大学发布全球首个AI生成3D人脸质量评估数据集Gen3DHF

Meta开源视觉大模型DINOv3：70亿参数自监督学习技术突破

中科院深圳先进院发布HYPIR图像复原大模型，1.7秒实现8K超高清修复

小米AI团队两项突破性研究成果入选ICCV 2025，Q-Frame与Any-SSR技术引领行业创新

MIT华人团队突破具身智能研究：普通摄像头实现机器人高精度控制

智源研究院发布OmniGen2：新一代开源统一图像生成模型，多模态能力全面升级

字节跳动开源4D视频生成框架EX-4D：单目视频转高质量多视角4D序列

腾讯开源全球首个全链路混元3D 2.1生成大模型，适配消费级显卡

热门AI工具

最新资讯