AI视野 | 全球AI信息聚合平台
  • 首页
  • AI工具
    • 智能聊天
    • 职场办公
    • 个人助手
    • 写作应用
    • 图像处理
    • 音频处理
    • 视频处理
    • 设计工具
    • 开发编程
    • 智能体
    • 智慧搜索
    • 教育应用
    • 商业应用
    • 生态应用
  • AI资讯
    • AI每日资讯
    • AI产品动态
    • AI新闻资讯
  • 站内排行榜
  • AI排行榜
    • 全球AI排行榜Top30 | 2025年07月
    • 中国AI排行榜Top30 | 2025年07月
    • 智能聊天AI排行榜Top20 | 2025年07月
    • 职场办公AI排行榜Top20 | 2025年07月
    • 个人助手AI排行榜Top20 | 2025年07月
    • 写作应用AI排行榜Top20 | 2025年07月
    • 图像处理AI排行榜Top20 | 2025年07月
    • 音频处理AI排行榜Top20 | 2025年07月
    • 视频处理AI排行榜Top20 | 2025年07月
    • 设计工具AI排行榜Top20 | 2025年07月
    • 开发编程AI排行榜Top20 | 2025年07月
    • 智慧搜索AI排行榜Top20 | 2025年07月
    • 智能体AI排行榜Top20 | 2025年07月
    • 教育应用AI排行榜Top20 | 2025年07月
    • 商业应用AI排行榜Top20 | 2025年07月
    • 生态应用AI排行榜Top20 | 2025年07月
    • 往期AI排行榜
    • 首页
    • AI工具
      • 智能聊天
      • 职场办公
      • 个人助手
      • 写作应用
      • 图像处理
      • 音频处理
      • 视频处理
      • 设计工具
      • 开发编程
      • 智能体
      • 智慧搜索
      • 教育应用
      • 商业应用
      • 生态应用
    • AI资讯
      • AI每日资讯
      • AI产品动态
      • AI新闻资讯
    • 站内排行榜
    • AI排行榜
      • 全球AI排行榜Top30 | 2025年07月
      • 中国AI排行榜Top30 | 2025年07月
      • 智能聊天AI排行榜Top20 | 2025年07月
      • 职场办公AI排行榜Top20 | 2025年07月
      • 个人助手AI排行榜Top20 | 2025年07月
      • 写作应用AI排行榜Top20 | 2025年07月
      • 图像处理AI排行榜Top20 | 2025年07月
      • 音频处理AI排行榜Top20 | 2025年07月
      • 视频处理AI排行榜Top20 | 2025年07月
      • 设计工具AI排行榜Top20 | 2025年07月
      • 开发编程AI排行榜Top20 | 2025年07月
      • 智慧搜索AI排行榜Top20 | 2025年07月
      • 智能体AI排行榜Top20 | 2025年07月
      • 教育应用AI排行榜Top20 | 2025年07月
      • 商业应用AI排行榜Top20 | 2025年07月
      • 生态应用AI排行榜Top20 | 2025年07月
      • 往期AI排行榜

    多模态AI

    共 129 篇AI资讯
    多模态AI
    排序
    发布更新浏览
    腾讯混元OCR开源模型发布:1B参数实现多项突破,OmniDocBench测评超越谷歌Gemini

    腾讯混元OCR开源模型发布:1B参数实现多项突破,OmniDocBench测评超越谷歌Gemini

    腾讯发布开源OCR模型HunyuanOCR,以1B轻量化参数在OmniDocBench测评获94.1分超越谷歌Gemini,支持14种语种翻译并获ICDAR2025冠军,已在GitHub开源。
    AI产品动态# AI技术突破# GitHub开源# 多模态AI
    2个月前
    阿里通义千问视觉模型登顶全球空间推理榜,超越GPT-5.1和Gemini 3

    阿里通义千问视觉模型登顶全球空间推理榜,超越GPT-5.1和Gemini 3

    阿里云通义千问Qwen3-VL在权威空间推理测试SpatialBench中以13.5分登顶全球第一,超越GPT-5.1和Gemini 3等国际主流模型。该模型具备增强3D检测、视觉编程等创新功能,已在...
    AI产品动态# AI技术# SpatialBench# 人工智能
    2个月前
    ChatGPT语音交互重大升级!语音模式全面整合至主界面,多模态体验再进化

    ChatGPT语音交互重大升级!语音模式全面整合至主界面,多模态体验再进化

    OpenAI对ChatGPT语音功能进行重大升级,将语音模式全面整合至主界面,实现语音、文本、视觉内容实时同步显示,显著提升多模态人机交互体验,适用于教育、导航等多种场景。
    AI产品动态# ChatGPT# OpenAI# 人工智能升级
    2个月前
    腾讯开源10亿参数轻量OCR模型HunyuanOCR,多项基准测试达SOTA水平

    腾讯开源10亿参数轻量OCR模型HunyuanOCR,多项基准测试达SOTA水平

    腾讯正式开源1B参数轻量OCR模型HunyuanOCR,在OmniDocBench、OCRBench等权威测试中获SOTA成绩,支持14种语言识别,适用于文档解析、视频字幕识别等场景,推动AI文本识别...
    AI产品动态# HunyuanOCR# OCR模型# 人工智能技术
    2个月前
    Anthropic发布Claude Opus 4.5:编程能力首超人类,API价格大幅下调三分之二

    Anthropic发布Claude Opus 4.5:编程能力首超人类,API价格大幅下调三分之二

    Anthropic于2025年发布Claude Opus 4.5 AI模型,在编程测试中首次超越人类表现,SWE-bench准确率达80.9%领先行业,同时API价格大幅下调三分之二,支持30小时连续...
    AI产品动态# AI模型# Anthropic# API定价
    2个月前
    OpenAI宣布GPT-4o API服务将于2026年2月终止,开发者需迁移至GPT-5.1

    OpenAI宣布GPT-4o API服务将于2026年2月终止,开发者需迁移至GPT-5.1

    OpenAI宣布GPT-4o API服务将于2026年2月16日正式终止,影响全球开发者。本文提供详细迁移指南、GPT-5.1性能优势分析及行业影响解读,帮助开发者顺利完成技术过渡。
    AI产品动态# AI技术升级# API终止# GPT-4o
    2个月前
    Luma AI完成90亿美元C轮融资,沙特PIF领投估值达400亿美元

    Luma AI完成90亿美元C轮融资,沙特PIF领投估值达400亿美元

    2025年11月,美国AI视频公司Luma AI完成90亿美元C轮融资,沙特PIF旗下Humain领投,估值400亿美元。资金将用于加速多模态世界模型研发和建设2吉瓦AI超级计算集群,技术性能已超越O...
    AI新闻资讯# AGI# AI融资# AMDVentures
    2个月前
    谷歌发布Gemini 3 Pro Image:多模态AI实现对话式图像编辑与4K高清生成

    谷歌发布Gemini 3 Pro Image:多模态AI实现对话式图像编辑与4K高清生成

    谷歌推出Gemini 3 Pro Image多模态AI模型,支持4K分辨率图像生成和对话式迭代编辑,在图像质量提升40%的同时集成Google搜索确保事实准确性,现已在Vertex AI平台开放调用。
    AI产品动态# AI技术# Gemini3Pro# VertexAI
    2个月前
    Poe推出200人AI群聊功能!集成200+模型重塑协作体验

    Poe推出200人AI群聊功能!集成200+模型重塑协作体验

    深度解析Poe最新推出的AI群聊功能:支持200人同时协作,集成200余个先进AI模型,具备智能调度系统和多设备同步技术,适用于家庭旅行规划、企业团队协作等多场景,重新定义人机交互模式。
    AI产品动态# AI群聊# Poe平台# Quora
    3个月前
    谷歌Gemini 3正式发布:全面超越GPT-5.1,AI竞赛进入”执行力”新时代

    谷歌Gemini 3正式发布:全面超越GPT-5.1,AI竞赛进入”执行力”新时代

    深度解析谷歌Gemini 3大模型:在LMArena以1501分超越GPT-5.1,GPQA Diamond测试达91.9%,配备生成式界面和Vibe Coding技术,重新定义AI执行力标准。了解G...
    AI产品动态# AI大模型# GPT-5.1# 人工智能竞赛
    3个月前
    加载更多

    热门AI工具

    最新资讯

    AI视野 | 全球AI信息聚合平台
    AI视野 - 全球AI信息聚合平台,拓展AI视野,致力于打造全面专业的AI信息平台。 整合全球最全面的AI应用资源库,实时追踪最新AI行业资讯与技术动态,深度解析AI产品发展趋势,提供多维度的AI应用排名。 以专业视角为您打开AI视野,了解全球AI领域动态,助力您在AI智能时代把握先机,智领未来。

    AI资讯 站内排行 全球AI排行榜Top30 中国AI排行榜Top30 往期AI排行榜 关于我们

    扫码加公众号AI视野 | 全球AI信息聚合平台
    扫码加公众号
    扫码加微信AI视野 | 全球AI信息聚合平台
    扫码加微信
    Copyright © 2026 AI视野 | 全球AI信息聚合平台  粤ICP备2025421237号 
    AI工具
    AI工具AI资讯