多模态模型

英伟达发布Rubin CPX芯片：AI长序列处理突破，百万token上下文推理革新硬件架构

英伟达Rubin CPX芯片专为大规模上下文推理设计，支持百万级token处理，性能提升3倍。了解其分离式架构、技术参数及Vera Rubin平台如何推动AI视频生成与代码开发革命，2026年上市配套...

7个月前

上海AI实验室开源Intern-S1-mini：80亿参数轻量多模态模型，专攻科学数据处理

上海AI实验室开源Intern-S1-mini多模态推理模型，80亿参数紧凑架构专攻科学数据处理，支持化学分子解析、蛋白质分析，适用于自动驾驶、医疗影像及智能客服场景，性能超越同类轻量模型。

AI产品动态 # 上海AI实验室 # 人工智能 # 多模态模型

8个月前

OpenAI重启机器人研发计划，聚焦通用机器人技术以加速AGI实现

OpenAI重启机器人研发计划，聚焦通用机器人技术开发，通过物理世界交互加速AGI实现。了解新团队目标、技术突破与行业竞争，探索AI从虚拟向物理空间的延伸。

AI新闻资讯 # AGI # OpenAI # 人工智能

7个月前

OpenAI重新开放GPT-4o访问并推出模型切换功能，同时推荐GPT-4.1系列

OpenAI宣布GPT-4o模型重新开放访问，支持文本、图像及音频交互处理，同时为付费用户提供模型切换功能。新一代GPT-4.1系列在长文档分析和专业场景中表现更优。

AI产品动态 # AI技术 # GPT-4.1 # GPT-4o

8个月前

全球首个ViLLA架构具身智能模型开源！智元机器人GO-1基座模型全面开放

深度解析智元机器人GO-1通用具身基座大模型的开源价值：全球首个ViLLA架构具身智能模型技术突破，配套Genie Studio开发平台降低应用门槛，推动机器人技术普惠化发展。

AI产品动态 # GenieStudio # GO-1模型 # ViLLA架构

7个月前

苹果将携八篇前沿论文亮相ICCV 2025，多模态模型与视频生成技术成焦点

深度解析苹果在ICCV 2025大会发布的八篇前沿论文，涵盖MM-Spatial三维空间应用、STIV视频生成等突破性技术，揭秘这些研究如何推动AR设备和iPhone创作功能的未来发展。

AI新闻资讯 # AI研究 # AppleVisionPro # ICCV2025

6个月前

商汤科技开源空间智能大模型SenseNova-SI系列，8B版本性能超越GPT-5

2025年商汤科技开源空间智能大模型SenseNova-SI系列，8B版本以60.99分超越GPT-5和Gemini-2.5-Pro。突破空间结构理解技术短板，提供完整技术资源下载，推动自动驾驶、机器...

AI产品动态 # AI开源 # GPT-5对比 # SenseNova-SI

5个月前

快手可灵AI数字人技术重大升级：突破60秒长视频生成，实现精准表情动作控制

快手可灵AI发布新一代数字人功能，实现60秒长视频生成与高精度表情动作控制。该技术基于多模态大语言模型，支持跨语种演唱和多画风切换，适用于短剧、虚拟直播等场景。了解最新AI进展与应用潜力。

AI产品动态 # AI生成视频 # 人工智能 # 可灵AI

7个月前

商汤科技开源NEO原生多模态架构，引领AI进入“原生架构”时代

商汤科技于2025年12月1日开源与南洋理工大学联合研发的NEO原生多模态架构，通过原生图块嵌入、统一注意力等创新技术，实现视觉与语言的深层融合，推动多模态AI进入“原生架构”时代，加速产业级技术标准...

AI产品动态 # AI基础设施 # NEO架构 # 人工智能

4个月前

谷歌发布MedGemma 27B与MedSigLIP医疗AI模型，推动跨模态医学应用

深度解读谷歌最新医疗AI模型MedGemma 27B与MedSigLIP的技术特性：27B参数多模态模型在MedQA达87.7%准确率，4亿参数轻量编码器实现专业级医学影像理解，推动临床诊断效率革命。

AI产品动态 # MedGemma # MedSigLIP # 人工智能

9个月前

英伟达发布Rubin CPX芯片：AI长序列处理突破，百万token上下文推理革新硬件架构

上海AI实验室开源Intern-S1-mini：80亿参数轻量多模态模型，专攻科学数据处理

OpenAI重启机器人研发计划，聚焦通用机器人技术以加速AGI实现

OpenAI重新开放GPT-4o访问并推出模型切换功能，同时推荐GPT-4.1系列

全球首个ViLLA架构具身智能模型开源！智元机器人GO-1基座模型全面开放

苹果将携八篇前沿论文亮相ICCV 2025，多模态模型与视频生成技术成焦点

商汤科技开源空间智能大模型SenseNova-SI系列，8B版本性能超越GPT-5

快手可灵AI数字人技术重大升级：突破60秒长视频生成，实现精准表情动作控制

商汤科技开源NEO原生多模态架构，引领AI进入“原生架构”时代

谷歌发布MedGemma 27B与MedSigLIP医疗AI模型，推动跨模态医学应用

热门AI工具

最新资讯