多模态AI

昆仑万维发布轻量级多模态AI智能体Skywork R1V4-Lite，多项性能超越Gemini 2.5系列

昆仑万维Skywork R1V4-Lite多模态智能体正式发布，集成视觉操作、深度推理与任务规划，在多项基准测试中超越Gemini 2.5系列，响应延迟降低19倍，为移动端AI应用提供高效解决方案。

6个月前

Token消耗量激增400%！2025中国AI大模型产业格局深度解析

2025年中国AI大模型Token消耗量达536.7万亿，同比激增400%。火山引擎以49.2%份额领先，企业服务占比50%成主力场景，技术降本99.3%驱动产业爆发，深度解析AI产业竞争格局与发展趋...

AI新闻资讯 # AI大模型 # Token消耗 # 云计算

6个月前

谷歌Nano Banana 2震撼亮相：10秒生成4K图像，AI绘图进入新纪元

谷歌最新AI图像生成工具Nano Banana 2预览版曝光，生成速度提升60%至10秒，支持2K/4K分辨率输出，具备数学推导和物理规律模拟能力，监控画面生成功能引发伦理讨论，或将重塑创意设计行业格...

AI产品动态 # AI技术 # NanoBanana2 # 伦理讨论

7个月前

美团发布业界首个中文全模态评测基准UNO-Bench，揭示全模态大模型”组合定律”

美团发布业界首个中文全模态评测基准UNO-Bench，包含1250条全模态样本和2480条单模态样本，覆盖44类任务及5种模态组合。该基准首次验证全模态大模型"组合定律"，为AI行业提供科学评估标准...

AI产品动态 # AI大模型 # UNO-Bench # 人工智能基准

7个月前

谷歌Gemini 3 Pro将于2025年11月推出：百万token上下文窗口重塑AI处理能力

谷歌下一代旗舰AI模型Gemini 3 Pro确认2025年11月发布，具备革命性100万token上下文处理能力，可完整分析300页书籍内容。多模态升级与Agent技术结合，将重塑企业AI服务竞争格...

AI产品动态 # AI模型 # Gemini3Pro # GPT-5竞争

7个月前

苹果联手谷歌！Siri将搭载Gemini 2.5 Pro实现三大突破

深度解析苹果与谷歌Gemini 2.5 Pro合作：Siri将实现128K上下文处理、AI网络搜索与多模态交互三大突破，2026年春季随iOS 26.4推送。了解1.2万亿参数模型技术优势及苹果隐私保...

AI产品动态 # AI语音助手 # iOS26.4 # Siri升级

7个月前

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架，通过语言感知优化机制提升小语种理解能力，在主流多语言VQA基准测试中准确率提升9.5%，评测总分超越GPT-4o、Gemini等国际主流模型...

AI产品动态 # 人工智能技术 # 多模态AI # 多语种大模型

7个月前

昆仑万维发布SkyReels AI视频创作平台：整合全球顶尖模型，实现零门槛多模态创作

昆仑万维正式发布升级版SkyReels AI视频创作平台，集成Google Veo 3.1、Sora 2等全球顶尖模型与自研SkyReels V3技术，提供无限画布、Agent系统、数字人多轮对话等功...

AI产品动态 # AGI战略 # AI视频创作 # SkyReels

7个月前

谷歌Gemini 3官宣2026年发布：瞄准GPT-5技术差距，智能代理能力将迎重大突破

谷歌正式宣布Gemini 3将于2026年发布，目标直指缩小与GPT-5技术差距。新一代模型将突破300万token上下文，强化智能代理自主决策能力，深度整合Workspace与地图生态，为企业级AI...

AI产品动态 # AI大模型 # GPT-5 # MoE架构

7个月前

百度文心APP推出’魔法漫画’功能：一句话生成AI连载漫画，5分钟创作8页内容

百度文心APP全新推出'魔法漫画'功能，支持用户通过一句话或图片快速生成高质量AI连载漫画，5分钟内创作8页连贯剧情，实现低门槛漫画创作，推动AI多模态内容生成技术发展。

AI产品动态 # AI漫画生成 # UGC内容 # 内容创作

7个月前

昆仑万维发布轻量级多模态AI智能体Skywork R1V4-Lite，多项性能超越Gemini 2.5系列

Token消耗量激增400%！2025中国AI大模型产业格局深度解析

谷歌Nano Banana 2震撼亮相：10秒生成4K图像，AI绘图进入新纪元

美团发布业界首个中文全模态评测基准UNO-Bench，揭示全模态大模型”组合定律”

谷歌Gemini 3 Pro将于2025年11月推出：百万token上下文窗口重塑AI处理能力

苹果联手谷歌！Siri将搭载Gemini 2.5 Pro实现三大突破

蚂蚁数科发布多语种多模态大模型训练框架，突破小语种AI理解瓶颈

昆仑万维发布SkyReels AI视频创作平台：整合全球顶尖模型，实现零门槛多模态创作

谷歌Gemini 3官宣2026年发布：瞄准GPT-5技术差距，智能代理能力将迎重大突破

百度文心APP推出’魔法漫画’功能：一句话生成AI连载漫画，5分钟创作8页内容

热门AI工具

最新资讯