多模态AI

苹果多模态AI模型Manzano技术细节首度曝光，35亿参数支持2048像素处理

深度解析苹果Manzano多模态AI模型的混合分词器架构、35亿参数性能表现及其在iOS系统中的战略意义，对比GPT-4o技术优势。

8个月前

谷歌发布AI浏览器Disco：用Gemini 3将网页变成智能应用

谷歌推出基于Gemini 3 Pro的Disco实验浏览器，可将任意网页动态重构为定制化Web应用，支持价格追踪、内容摘要等功能。了解Gemini 3的1501 Elo评分、多模态处理能力及浏览器技术...

AI产品动态 # AI浏览器 # Disco浏览器 # Gemini3

5个月前

Luma AI发布全球首款多模态推理视频模型Ray3，支持4K HDR生成与智能修正

Luma AI推出全球首款多模态推理视频模型Ray3，支持16位HDR生成、4K输出与智能修正功能，深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。

AI产品动态 # Adobe # AI视频生成 # LumaAI

8个月前

谷歌Gemini API全面上线URL Context功能，革新AI文档处理与多模态理解

谷歌Gemini API全面集成URL Context功能，支持直接处理URL内容（网页、PDF、图像），实现34MB大文档解析和多模态理解。本文解析其技术优势、对RAG架构的革新及在数据分析领域的S...

AI产品动态 # AIAPI # RAG架构 # URLContext

9个月前

马斯克圣诞礼物引爆争议：X平台Grok AI图片编辑功能上线，创作者集体抗议

本文深度解读马斯克在X平台推出的Grok AI图片编辑功能：技术实现包括自然语言修图、图转视频等创新，同时分析其引发的版权失控、创作者抵制及行业影响。探讨AI技术便利与创作权益的冲突，展望社交媒体生态...

AI产品动态 # AI图片编辑 # AI新闻 # Grok模型

5个月前

小米开源语音大模型Xiaomi-MiMo-Audio：7B级别性能全球领先，超越谷歌Gemini与OpenAI GPT-4o

小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio，在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智...

AI产品动态 # AI开源 # 人机交互 # 多模态AI

8个月前

谷歌Gemini 3官宣2026年发布：瞄准GPT-5技术差距，智能代理能力将迎重大突破

谷歌正式宣布Gemini 3将于2026年发布，目标直指缩小与GPT-5技术差距。新一代模型将突破300万token上下文，强化智能代理自主决策能力，深度整合Workspace与地图生态，为企业级AI...

AI产品动态 # AI大模型 # GPT-5 # MoE架构

7个月前

商汤科技杨帆：AI重构知识产权全链条效率，大模型加速专利转化与侵权监测

深度解读上海知识产权国际论坛核心议题：商汤科技展示AI如何通过大模型技术提升专利检索、侵权监测效率，实现知识产权全场景智能化，并分享AI与知识产权全球治理的前瞻思考。

AI新闻资讯 # AI治理 # 专利转化 # 人工智能

7个月前

谷歌发布Gemini 3 Flash模型：成本仅Pro版1/4，速度提升3倍，成AI市场新标杆

谷歌推出Gemini 3 Flash模型，以Pro版1/4的成本实现3倍运行速度，在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索，标志AI竞赛进入白热化阶段...

AI产品动态 # AI模型 # Gemini3Flash # OpenAI

5个月前

苹果秘密研发多模态AI模型Manzano，剑指OpenAI与谷歌图像编辑霸主地位

深度揭秘苹果秘密研发的Manzano多模态AI模型：具备图像理解与生成双重能力，技术指标接近行业领先的GPT-4o和谷歌Gemini 2.5 Flash Image。分析苹果如何挑战现有AI市场格局...

AI产品动态 # AI竞赛 # Manzano模型 # OpenAI

8个月前

苹果多模态AI模型Manzano技术细节首度曝光，35亿参数支持2048像素处理

谷歌发布AI浏览器Disco：用Gemini 3将网页变成智能应用

Luma AI发布全球首款多模态推理视频模型Ray3，支持4K HDR生成与智能修正

谷歌Gemini API全面上线URL Context功能，革新AI文档处理与多模态理解

马斯克圣诞礼物引爆争议：X平台Grok AI图片编辑功能上线，创作者集体抗议

小米开源语音大模型Xiaomi-MiMo-Audio：7B级别性能全球领先，超越谷歌Gemini与OpenAI GPT-4o

谷歌Gemini 3官宣2026年发布：瞄准GPT-5技术差距，智能代理能力将迎重大突破

商汤科技杨帆：AI重构知识产权全链条效率，大模型加速专利转化与侵权监测

谷歌发布Gemini 3 Flash模型：成本仅Pro版1/4，速度提升3倍，成AI市场新标杆

苹果秘密研发多模态AI模型Manzano，剑指OpenAI与谷歌图像编辑霸主地位

热门AI工具

最新资讯