Warning: Array to string conversion in /www/wwwroot/ai4yes_com/wp-content/themes/onenav/inc/wp-optimization.php on line 108
多模态AI - AI资讯 - AI视野 | 全球AI信息聚合平台
AI视野 | 全球AI信息聚合平台
  • 首页
  • AI工具
    • 智能聊天
    • 职场办公
    • 个人助手
    • 写作应用
    • 图像处理
    • 音频处理
    • 视频处理
    • 设计工具
    • 开发编程
    • 智能体
    • 智慧搜索
    • 教育应用
    • 商业应用
    • 生态应用
  • AI资讯
    • AI每日资讯
    • AI产品动态
    • AI新闻资讯
  • 站内排行榜
  • AI排行榜
    • 全球AI排行榜Top30 | 2025年07月
    • 中国AI排行榜Top30 | 2025年07月
    • 智能聊天AI排行榜Top20 | 2025年07月
    • 职场办公AI排行榜Top20 | 2025年07月
    • 个人助手AI排行榜Top20 | 2025年07月
    • 写作应用AI排行榜Top20 | 2025年07月
    • 图像处理AI排行榜Top20 | 2025年07月
    • 音频处理AI排行榜Top20 | 2025年07月
    • 视频处理AI排行榜Top20 | 2025年07月
    • 设计工具AI排行榜Top20 | 2025年07月
    • 开发编程AI排行榜Top20 | 2025年07月
    • 智慧搜索AI排行榜Top20 | 2025年07月
    • 智能体AI排行榜Top20 | 2025年07月
    • 教育应用AI排行榜Top20 | 2025年07月
    • 商业应用AI排行榜Top20 | 2025年07月
    • 生态应用AI排行榜Top20 | 2025年07月
    • 往期AI排行榜
    • 首页
    • AI工具
      • 智能聊天
      • 职场办公
      • 个人助手
      • 写作应用
      • 图像处理
      • 音频处理
      • 视频处理
      • 设计工具
      • 开发编程
      • 智能体
      • 智慧搜索
      • 教育应用
      • 商业应用
      • 生态应用
    • AI资讯
      • AI每日资讯
      • AI产品动态
      • AI新闻资讯
    • 站内排行榜
    • AI排行榜
      • 全球AI排行榜Top30 | 2025年07月
      • 中国AI排行榜Top30 | 2025年07月
      • 智能聊天AI排行榜Top20 | 2025年07月
      • 职场办公AI排行榜Top20 | 2025年07月
      • 个人助手AI排行榜Top20 | 2025年07月
      • 写作应用AI排行榜Top20 | 2025年07月
      • 图像处理AI排行榜Top20 | 2025年07月
      • 音频处理AI排行榜Top20 | 2025年07月
      • 视频处理AI排行榜Top20 | 2025年07月
      • 设计工具AI排行榜Top20 | 2025年07月
      • 开发编程AI排行榜Top20 | 2025年07月
      • 智慧搜索AI排行榜Top20 | 2025年07月
      • 智能体AI排行榜Top20 | 2025年07月
      • 教育应用AI排行榜Top20 | 2025年07月
      • 商业应用AI排行榜Top20 | 2025年07月
      • 生态应用AI排行榜Top20 | 2025年07月
      • 往期AI排行榜

    多模态AI

    共 122 篇AI资讯
    多模态AI
    排序
    发布更新浏览
    谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流

    谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流

    谷歌实验室推出基于Gemini大模型的AI助手CC,深度融合Gmail、日历等核心服务,提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问,加速AI个人助手赛道竞争。
    AI产品动态# AI助手# CC助手# Gemini大模型
    1天前
    Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业

    Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业

    Meta最新开源的SAM Audio多模态音频分离模型,通过文本、视觉和时间段提示实现精准声音分离,适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源,探讨AI音频处理的...
    AI产品动态# AI工具# Meta# SAMAudio
    2天前
    美的医疗发布国产医学影像多模态智能诊断大模型,实现基层医疗AI关键技术突破

    美的医疗发布国产医学影像多模态智能诊断大模型,实现基层医疗AI关键技术突破

    美的医疗正式发布国产自主知识产权的医学影像多模态智能诊断大模型,实现肺结核、肺炎等胸部疾病自动检测与报告生成。该模型采用轻量化设备端与高精度云端双架构,适配不同医疗机构需求,已进入临床验证,计划202...
    AI产品动态# DR影像# 人工智能# 医学影像
    2天前
    盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速

    盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速

    盛数科技Vidu视频大模型全球内测上线,核心功能一键生成可直接投放的产品广告成片,基于Vidu Q2模型实现多主体一致性控制与高清音画同步,平均生成时间3分钟内,助力电商、美妆等行业降低70%制作成本...
    AI产品动态# AI视频生成# MaaS# Vidu大模型
    2天前
    谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆

    谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆

    谷歌推出Gemini 3 Flash模型,以Pro版1/4的成本实现3倍运行速度,在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索,标志AI竞赛进入白热化阶段...
    AI产品动态# AI模型# Gemini3Flash# OpenAI
    2天前
    多模态AI为何数不清六根手指?揭秘模型在空间认知与逻辑推理的结构性缺陷

    多模态AI为何数不清六根手指?揭秘模型在空间认知与逻辑推理的结构性缺陷

    本文深入探讨多模态AI模型在六指手识别中暴露的系统性错误,分析数据偏差、Transformer架构局限导致的逻辑割裂,并提出未来需融合神经符号系统的解决路径。了解AI在简单任务中犯错的深层原因。
    AI新闻资讯# AI缺陷# AI训练# Transformer架构
    3天前
    阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元

    阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元

    阿里巴巴通义万相2.6模型正式发布,作为国内首个支持角色扮演的AI视频生成技术,可实现基于人物外观与音色的定制化视频生成,提升至15秒时长,适用于影视、广告及短剧制作,现已上线阿里云百炼平台,助力企业...
    AI产品动态# AI商业化# AI视频生成# 人工智能技术
    3天前
    OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20%

    OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20%

    OpenAI于2025年12月17日推出GPT Image 1.5,新一代图像生成模型在生成质量、编辑功能和效率上实现突破,生成速度提升4倍,API费用降低20%。了解其核心性能提升、商业化应用及对行...
    AI产品动态# AI图像编辑# AI竞争# API成本优化
    3天前
    Thinking Machines Lab开放Tinker平台:集成万亿参数Kimi K2与Qwen3-VL多模态模型

    Thinking Machines Lab开放Tinker平台:集成万亿参数Kimi K2与Qwen3-VL多模态模型

    由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式开放Tinker AI平台,集成万亿参数Kimi K2推理模型与Qwen3-VL视觉语言模型,支持多...
    AI产品动态# AI平台# MiraMurati# OpenAI
    4天前
    谷歌发布AI浏览器Disco:用Gemini 3将网页变成智能应用

    谷歌发布AI浏览器Disco:用Gemini 3将网页变成智能应用

    谷歌推出基于Gemini 3 Pro的Disco实验浏览器,可将任意网页动态重构为定制化Web应用,支持价格追踪、内容摘要等功能。了解Gemini 3的1501 Elo评分、多模态处理能力及浏览器技术...
    AI产品动态# AI浏览器# Disco浏览器# Gemini3
    5天前
    加载更多

    热门AI工具

    最新资讯

    AI视野 | 全球AI信息聚合平台
    AI视野 - 全球AI信息聚合平台,拓展AI视野,致力于打造全面专业的AI信息平台。 整合全球最全面的AI应用资源库,实时追踪最新AI行业资讯与技术动态,深度解析AI产品发展趋势,提供多维度的AI应用排名。 以专业视角为您打开AI视野,了解全球AI领域动态,助力您在AI智能时代把握先机,智领未来。

    AI资讯 站内排行 全球AI排行榜Top30 中国AI排行榜Top30 往期AI排行榜 关于我们

    扫码加公众号AI视野 | 全球AI信息聚合平台
    扫码加公众号
    扫码加微信AI视野 | 全球AI信息聚合平台
    扫码加微信
    Copyright © 2025 AI视野 | 全球AI信息聚合平台  粤ICP备2025421237号 
    AI工具
    AI工具AI资讯