苹果多模态AI模型Manzano技术细节首度曝光,35亿参数支持2048像素处理 深度解析苹果Manzano多模态AI模型的混合分词器架构、35亿参数性能表现及其在iOS系统中的战略意义,对比GPT-4o技术优势。 AI新闻资讯# AI技术# GPT-5# iOS26 8个月前
谷歌发布AI浏览器Disco:用Gemini 3将网页变成智能应用 谷歌推出基于Gemini 3 Pro的Disco实验浏览器,可将任意网页动态重构为定制化Web应用,支持价格追踪、内容摘要等功能。了解Gemini 3的1501 Elo评分、多模态处理能力及浏览器技术... AI产品动态# AI浏览器# Disco浏览器# Gemini3 5个月前
Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正 Luma AI推出全球首款多模态推理视频模型Ray3,支持16位HDR生成、4K输出与智能修正功能,深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。 AI产品动态# Adobe# AI视频生成# LumaAI 8个月前
谷歌Gemini API全面上线URL Context功能,革新AI文档处理与多模态理解 谷歌Gemini API全面集成URL Context功能,支持直接处理URL内容(网页、PDF、图像),实现34MB大文档解析和多模态理解。本文解析其技术优势、对RAG架构的革新及在数据分析领域的S... AI产品动态# AIAPI# RAG架构# URLContext 9个月前
马斯克圣诞礼物引爆争议:X平台Grok AI图片编辑功能上线,创作者集体抗议 本文深度解读马斯克在X平台推出的Grok AI图片编辑功能:技术实现包括自然语言修图、图转视频等创新,同时分析其引发的版权失控、创作者抵制及行业影响。探讨AI技术便利与创作权益的冲突,展望社交媒体生态... AI产品动态# AI图片编辑# AI新闻# Grok模型 5个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 8个月前
谷歌Gemini 3官宣2026年发布:瞄准GPT-5技术差距,智能代理能力将迎重大突破 谷歌正式宣布Gemini 3将于2026年发布,目标直指缩小与GPT-5技术差距。新一代模型将突破300万token上下文,强化智能代理自主决策能力,深度整合Workspace与地图生态,为企业级AI... AI产品动态# AI大模型# GPT-5# MoE架构 7个月前
商汤科技杨帆:AI重构知识产权全链条效率,大模型加速专利转化与侵权监测 深度解读上海知识产权国际论坛核心议题:商汤科技展示AI如何通过大模型技术提升专利检索、侵权监测效率,实现知识产权全场景智能化,并分享AI与知识产权全球治理的前瞻思考。 AI新闻资讯# AI治理# 专利转化# 人工智能 7个月前
谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆 谷歌推出Gemini 3 Flash模型,以Pro版1/4的成本实现3倍运行速度,在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索,标志AI竞赛进入白热化阶段... AI产品动态# AI模型# Gemini3Flash# OpenAI 5个月前
苹果秘密研发多模态AI模型Manzano,剑指OpenAI与谷歌图像编辑霸主地位 深度揭秘苹果秘密研发的Manzano多模态AI模型:具备图像理解与生成双重能力,技术指标接近行业领先的GPT-4o和谷歌Gemini 2.5 Flash Image。分析苹果如何挑战现有AI市场格局... AI产品动态# AI竞赛# Manzano模型# OpenAI 8个月前