MIT华人团队突破具身智能研究:普通摄像头实现机器人高精度控制 麻省理工学院华人团队在《Nature》发表具身智能突破性研究,开发出仅需普通RGB摄像头即可实现多类型机器人高精度控制的深度学习框架,为医疗、制造等领域提供低成本自动化解决方案。 AI新闻资讯# MIT# 人工智能# 具身智能 3个月前
智源研究院发布OmniGen2:新一代开源统一图像生成模型,多模态能力全面升级 深度解析智源研究院OmniGen2图像生成模型技术亮点:40亿参数开源架构,支持文本到图像无缝切换,在GenEval测试中评分0.86。了解其反思机制、多模态生成能力及FlagScale推理加速方案。 AI产品动态# AI生成模型# 多模态AI# 开源项目 4个月前
字节跳动开源4D视频生成框架EX-4D:单目视频转高质量多视角4D序列 字节跳动最新开源的EX-4D框架实现单目视频到4D序列的突破性转换,采用深度防水网格与双mask策略,在FID/VBench指标上超越现有方案70.7%用户认可其物理一致性,为VR/影视行业提供高效解... AI新闻资讯# 4D生成# AI技术# 字节跳动 4个月前
腾讯开源全球首个全链路混元3D 2.1生成大模型,适配消费级显卡 腾讯在计算机视觉领域顶级会议CVPR 2025上宣布开源混元3D 2.1大模型。作为全球首个全链路开源的工业级3D生成模型,该技术实现了从模型权重、训练代码到数据处理流程的完整开放,显著降低了3D内容... AI产品动态# 3D生成# AI# 开源技术 4个月前