多模态模型

Meta下一代AI模型Mango与Avocado曝光：2026年挑战OpenAI与谷歌的多模态革命

Meta公布2026年核心AI产品计划：多模态模型Mango可生成图像视频，对标OpenAI Sora；文本模型Avocado突破代码与环境感知。本文深度解读Meta技术路线、社交平台整合战略及对AI...

5个月前

国产AI图像生成工具星流Agent中文版发布，深度优化中文场景支持

星流AI发布中文版星流Agent，突破中文图像生成技术瓶颈。基于自研Star-3模型，优化中文字体渲染与提示词理解，集成10万+LoRA模型库，支持电商、新媒体等场景。与腾讯云合作提升30%推理速度...

AI产品动态 # AI图像生成 # 中文AI工具 # 国产AI技术

11个月前

vivo发布端侧多模态模型BlueLM-2.5-3B，突破GUI理解与能效比极限

vivo AI Lab最新发布的BlueLM-2.5-3B端侧多模态模型，以3B参数量实现GUI深度理解，创新思考预算机制提升数学推理能力，端侧部署内存仅1.4GB，为移动AI应用树立新标杆。

AI产品动态 # AI模型 # BlueLM # GUI理解

11个月前

快手可灵AI推出视频音效功能，实现音画同步创作新突破

快手可灵AI最新推出视频音效功能，通过自研多模态模型Kling-Foley实现视频与立体声音效的同步生成，显著提升创作效率与沉浸感。该技术或将成为AI视频赛道差异化竞争的关键，助力创作者降低70%后期...

AI产品动态 # AI视频 # 可灵AI # 多模态模型

11个月前

DeepSeek-OCR开源多模态模型发布：视觉文本压缩技术实现10倍无损压缩

DeepSeek AI发布革命性开源多模态模型DeepSeek-OCR，实现10倍无损文本压缩，显著提升OCR处理效率。模型采用创新视觉压缩技术，单卡日处理20万页文档，为大规模语言模型训练提供全新解...

AI产品动态 # AI开源 # DeepSeek-OCR # OCR技术

7个月前

西安交大研发SongCi模型：AI突破法医病理诊断，准确率提升30%

西安交通大学研发的SongCi多模态AI模型在法医病理诊断领域实现重大突破，通过自监督对比学习技术使诊断一致性提高30%，为司法鉴定与公共安全提供智能解决方案。

AI新闻资讯 # 人工智能 # 医学诊断 # 医疗AI

10个月前

可灵AI 2.5版本突破微表情技术，电影级视频生成进入创作者时代

可灵AI 2.5版本实现微表情与复杂情绪突破性进展，采用多模态两阶段生成框架，支持中英日韩多语种情绪表达，已服务4500万用户，显著降低影视制作门槛。

AI产品动态 # AI视频生成 # 可灵AI # 多模态模型

8个月前

松下发布多模态大模型OmniFlow，实现文本、图像与音频自由转换 | AI技术突破

松下近日正式推出多模态大模型OmniFlow，该模型支持文本、图像、音频之间的任意转换生成，标志着多模态AI技术迈向更灵活、高效的商业化应用阶段。

AI产品动态 # AI技术 # 图像生成 # 多模态模型

11个月前

OpenAI发布GPT-5系列模型：多任务处理能力再升级，迈向AGI关键一步

OpenAI推出革命性GPT-5模型，实现文本/图像/语音统一处理，上下文窗口扩展至200万Token，微软生态首批接入。了解这一AI技术里程碑如何重塑行业竞争格局。

AI产品动态 # AGI # AI技术 # GPT-5

10个月前

OpenAI重新开放GPT-4o访问并推出模型切换功能，同时推荐GPT-4.1系列

OpenAI宣布GPT-4o模型重新开放访问，支持文本、图像及音频交互处理，同时为付费用户提供模型切换功能。新一代GPT-4.1系列在长文档分析和专业场景中表现更优。

AI产品动态 # AI技术 # GPT-4.1 # GPT-4o

10个月前

Meta下一代AI模型Mango与Avocado曝光：2026年挑战OpenAI与谷歌的多模态革命

国产AI图像生成工具星流Agent中文版发布，深度优化中文场景支持

vivo发布端侧多模态模型BlueLM-2.5-3B，突破GUI理解与能效比极限

快手可灵AI推出视频音效功能，实现音画同步创作新突破

DeepSeek-OCR开源多模态模型发布：视觉文本压缩技术实现10倍无损压缩

西安交大研发SongCi模型：AI突破法医病理诊断，准确率提升30%

可灵AI 2.5版本突破微表情技术，电影级视频生成进入创作者时代

松下发布多模态大模型OmniFlow，实现文本、图像与音频自由转换 | AI技术突破

OpenAI发布GPT-5系列模型：多任务处理能力再升级，迈向AGI关键一步

OpenAI重新开放GPT-4o访问并推出模型切换功能，同时推荐GPT-4.1系列

热门AI工具

最新资讯