多模态模型

可灵AI 2.5版本突破微表情技术，电影级视频生成进入创作者时代

可灵AI 2.5版本实现微表情与复杂情绪突破性进展，采用多模态两阶段生成框架，支持中英日韩多语种情绪表达，已服务4500万用户，显著降低影视制作门槛。

7个月前

OpenAI重启机器人研发计划，聚焦通用机器人技术以加速AGI实现

OpenAI重启机器人研发计划，聚焦通用机器人技术开发，通过物理世界交互加速AGI实现。了解新团队目标、技术突破与行业竞争，探索AI从虚拟向物理空间的延伸。

AI新闻资讯 # AGI # OpenAI # 人工智能

7个月前

快手可灵AI数字人技术重大升级：突破60秒长视频生成，实现精准表情动作控制

快手可灵AI发布新一代数字人功能，实现60秒长视频生成与高精度表情动作控制。该技术基于多模态大语言模型，支持跨语种演唱和多画风切换，适用于短剧、虚拟直播等场景。了解最新AI进展与应用潜力。

AI产品动态 # AI生成视频 # 人工智能 # 可灵AI

7个月前

英伟达发布Rubin CPX芯片：AI长序列处理突破，百万token上下文推理革新硬件架构

英伟达Rubin CPX芯片专为大规模上下文推理设计，支持百万级token处理，性能提升3倍。了解其分离式架构、技术参数及Vera Rubin平台如何推动AI视频生成与代码开发革命，2026年上市配套...

AI产品动态 # AI芯片 # GPU # RubinCPX

7个月前

谷歌发布Gemini 2.5 Flash Nano Banana官方Prompt模板：六大场景标准化AI图像创作指南

谷歌发布Gemini 2.5 Flash（Nano Banana）多模态模型官方Prompt模板，详解摄影、商业设计等六大场景应用，支持低成本高效图像生成与多轮迭代优化，助力创作者标准化AI创作流程。

AI产品动态 # AI图像生成 # AI设计工具 # GoogleAIStudio

7个月前

Mistral AI发布企业级平台Mistral Medium 3.1：多模态性能超越GPT-4o，成本降低80%

深度解析Mistral Medium 3.1模型在MT-Bench 8.6分、32K上下文长度及80+编程语言支持方面的技术优势，揭示其相比GPT-4o降低80%企业成本的部署方案与微软Azure生态...

AI产品动态 # Azure云服务 # GPT-4o # MistralAI

7个月前

面壁智能开源MiniCPM-V4.5：8B参数实现高刷视频理解，端侧AI迎来突破

面壁智能开源MiniCPM-V4.5多模态模型，8B参数实现高刷视频理解，性能超越72B级竞品。创新3D-Resampler技术达12倍压缩率，适用于智能座舱、工业质检等实时场景，现已在GitHub等...

AI产品动态 # 人工智能 # 多模态模型 # 开源AI

8个月前

苹果开源SlowFast-LLaVA-1.5模型：长视频理解技术突破，显存占用降30%

苹果开源SlowFast-LLaVA-1.5模型革新长视频理解技术：双流架构降低30%显存占用，1B参数超越7B模型性能，支持2小时视频分析。了解其在MLVU基准91.5%OCR准确率及商业应用潜力。

AI产品动态 # 人工智能 # 多模态模型 # 开源模型

8个月前

上海AI实验室开源Intern-S1-mini：80亿参数轻量多模态模型，专攻科学数据处理

上海AI实验室开源Intern-S1-mini多模态推理模型，80亿参数紧凑架构专攻科学数据处理，支持化学分子解析、蛋白质分析，适用于自动驾驶、医疗影像及智能客服场景，性能超越同类轻量模型。

AI产品动态 # 上海AI实验室 # 人工智能 # 多模态模型

8个月前

百度官宣文心大模型5.0即将发布，多模态与推理效率重大突破

百度正式宣布研发文心大模型5.0，将于8月底推出。新版本在推理效率、多模态能力及模型规模实现突破，日均调用量超15亿次。解读百度AI战略升级与行业竞争布局。

AI新闻资讯 # AI技术突破 # 人工智能 # 多模态模型

8个月前

可灵AI 2.5版本突破微表情技术，电影级视频生成进入创作者时代

OpenAI重启机器人研发计划，聚焦通用机器人技术以加速AGI实现

快手可灵AI数字人技术重大升级：突破60秒长视频生成，实现精准表情动作控制

英伟达发布Rubin CPX芯片：AI长序列处理突破，百万token上下文推理革新硬件架构

谷歌发布Gemini 2.5 Flash Nano Banana官方Prompt模板：六大场景标准化AI图像创作指南

Mistral AI发布企业级平台Mistral Medium 3.1：多模态性能超越GPT-4o，成本降低80%

面壁智能开源MiniCPM-V4.5：8B参数实现高刷视频理解，端侧AI迎来突破

苹果开源SlowFast-LLaVA-1.5模型：长视频理解技术突破，显存占用降30%

上海AI实验室开源Intern-S1-mini：80亿参数轻量多模态模型，专攻科学数据处理

百度官宣文心大模型5.0即将发布，多模态与推理效率重大突破

热门AI工具

最新资讯