多模态AI

全国首个规划资源领域基础大模型“云宇星空（专业版）”在沪发布，开启城市空间治理智能化新纪元

上海市规划资源局与商汤科技联合推出全国首个规划资源领域基础大模型“云宇星空（专业版）”，6000亿参数多模态技术覆盖十大核心场景，实现自然语言调图、智能统计分析，助力城市空间治理进入科学化、精细化新阶...

5个月前

微软发布自研图像生成模型MAI-Image-1，LMArena榜单跻身前十

微软正式推出首款完全自研图像生成模型MAI-Image-1，在LMArena文生图排行榜中跻身前十。该模型在真实感光影处理、生成速度等方面表现优异，将集成至Copilot和Bing Image Cre...

AI产品动态 # LMArena # MAI-Image-1 # 图像生成模型

7个月前

OpenAI秘密测试GPT-Alpha智能体：基于GPT-5的多模态AI或将重塑行业

OpenAI被曝正在测试基于GPT-5模型的全新AI智能体GPT-Alpha。该技术突破传统生成式AI边界，支持文本、代码、图像多模态协同处理，具备高级推理与工具使用能力。本文详解其核心功能、应用场景...

AI新闻资讯 # AI技术 # GPT-5 # GPT-Alpha

8个月前

OpenAI GPT-5.2携Image-2系列图像模型即将发布：2K-4K画质、专业编辑功能，多模态能力再升级

OpenAI即将发布GPT-5.2中的Image-2系列图像生成模型，提供2K-4K高分辨率、专业级编辑功能与优化色彩还原。本文解读新模型在画质、提示词理解及多模态AI领域的升级，分析其与谷歌Nano...

AI产品动态 # AI技术 # AI新闻 # GPT-5.2

6个月前

昆仑万维发布SkyReels AI视频创作平台：整合全球顶尖模型，实现零门槛多模态创作

昆仑万维正式发布升级版SkyReels AI视频创作平台，集成Google Veo 3.1、Sora 2等全球顶尖模型与自研SkyReels V3技术，提供无限画布、Agent系统、数字人多轮对话等功...

AI产品动态 # AGI战略 # AI视频创作 # SkyReels

7个月前

阿里通义千问视觉模型登顶全球空间推理榜，超越GPT-5.1和Gemini 3

阿里云通义千问Qwen3-VL在权威空间推理测试SpatialBench中以13.5分登顶全球第一，超越GPT-5.1和Gemini 3等国际主流模型。该模型具备增强3D检测、视觉编程等创新功能，已在...

AI产品动态 # AI技术 # SpatialBench # 人工智能

6个月前

昆仑万维发布轻量级多模态AI智能体Skywork R1V4-Lite，多项性能超越Gemini 2.5系列

昆仑万维Skywork R1V4-Lite多模态智能体正式发布，集成视觉操作、深度推理与任务规划，在多项基准测试中超越Gemini 2.5系列，响应延迟降低19倍，为移动端AI应用提供高效解决方案。

AI产品动态 # AI模型 # Gemini对比 # SkyworkR1V4-Lite

6个月前

Elastic收购Jina AI：开启多模态AI搜索新纪元，向量搜索技术迎来重大突破

Elastic完成对Jina AI战略收购，深度整合向量搜索与多模态AI技术。Jina AI核心模型将融入Elastic搜索平台，提升多语言文档和视觉文档检索效率，为企业提供更智能的搜索解决方案。

AI新闻资讯 # AI搜索 # Elastic # JinaAI

8个月前

腾讯混元OCR开源模型发布：1B参数实现多项突破，OmniDocBench测评超越谷歌Gemini

腾讯发布开源OCR模型HunyuanOCR，以1B轻量化参数在OmniDocBench测评获94.1分超越谷歌Gemini，支持14种语种翻译并获ICDAR2025冠军，已在GitHub开源。

AI产品动态 # AI技术突破 # GitHub开源 # 多模态AI

6个月前

盛数科技Vidu视频大模型全球内测：一键生成产品广告成片，AI视频商业化加速

盛数科技Vidu视频大模型全球内测上线，核心功能一键生成可直接投放的产品广告成片，基于Vidu Q2模型实现多主体一致性控制与高清音画同步，平均生成时间3分钟内，助力电商、美妆等行业降低70%制作成本...

AI产品动态 # AI视频生成 # MaaS # Vidu大模型

5个月前

全国首个规划资源领域基础大模型“云宇星空（专业版）”在沪发布，开启城市空间治理智能化新纪元

微软发布自研图像生成模型MAI-Image-1，LMArena榜单跻身前十

OpenAI秘密测试GPT-Alpha智能体：基于GPT-5的多模态AI或将重塑行业

OpenAI GPT-5.2携Image-2系列图像模型即将发布：2K-4K画质、专业编辑功能，多模态能力再升级

昆仑万维发布SkyReels AI视频创作平台：整合全球顶尖模型，实现零门槛多模态创作

阿里通义千问视觉模型登顶全球空间推理榜，超越GPT-5.1和Gemini 3

昆仑万维发布轻量级多模态AI智能体Skywork R1V4-Lite，多项性能超越Gemini 2.5系列

Elastic收购Jina AI：开启多模态AI搜索新纪元，向量搜索技术迎来重大突破

腾讯混元OCR开源模型发布：1B参数实现多项突破，OmniDocBench测评超越谷歌Gemini

盛数科技Vidu视频大模型全球内测：一键生成产品广告成片，AI视频商业化加速

热门AI工具

最新资讯