谷歌Gemini 2.5 Flash图像模型发布:多模态编辑精度超越GPT-4o 15% 深度解析谷歌Gemini 2.5 Flash图像模型的技术突破:多模态编辑精度超GPT-4o 15%,支持角色一致性保持与多图像融合,商业化成本降低25%。了解AI图像生成行业最新竞争格局与应用前景。 AI产品动态# AI商业应用# AI图像生成# OpenAI竞争 5个月前
微软发布自研图像生成模型MAI-Image-1,LMArena榜单跻身前十 微软正式推出首款完全自研图像生成模型MAI-Image-1,在LMArena文生图排行榜中跻身前十。该模型在真实感光影处理、生成速度等方面表现优异,将集成至Copilot和Bing Image Cre... AI产品动态# LMArena# MAI-Image-1# 图像生成模型 4个月前
小米开源语音大模型Xiaomi-MiMo-Audio:7B级别性能全球领先,超越谷歌Gemini与OpenAI GPT-4o 小米发布全球领先的开源语音大模型Xiaomi-MiMo-Audio,在MMAU和Big Bench音频测试中超越谷歌Gemini与OpenAI GPT-4o。了解其亿小时训练数据、少样本学习能力及在智... AI产品动态# AI开源# 人机交互# 多模态AI 4个月前
NSF与英伟达1.52亿美元投资AI2开发开源多模态AI模型,加速科学研究突破 NSF与英伟达宣布投资1.52亿美元支持AI2开发开源多模态AI模型OMAI,推动材料科学、生物学等领域的透明化研究。项目涵盖完整开源工具链与人才培养,加速科学发现进程。 AI新闻资讯# AI2# NSF# 人工智能 6个月前
OpenAI推出GPT-5 Thinking功能并研发儿童版,AI技术进入深度优化新阶段 OpenAI推出GPT-5 Thinking功能,响应速度提升40%,支持代码生成与实时调试。同步研发儿童版AI,布局教育细分市场。了解GPT-5技术优势、应用场景及行业竞争态势。 AI产品动态# AI儿童版# AI商业化# ChatGPT 5个月前
Higgsfield推出Draw-to-Video功能:用箭头绘制即可生成电影级AI视频 深度解析Higgsfield革命性Draw-to-Video功能:无需复杂文本提示,通过图形标记和自然语言指令即可生成专业级动态视频。了解其自主研发的DoP I2V-01模型如何整合70+电影运镜模板... AI产品动态# AI视频生成# Draw-to-Video# Higgsfield 6个月前
谷歌Gemini 3深度思考模式正式开放:性能全面超越Pro版,AI推理能力再突破 2025年12月5日,谷歌正式开放Gemini 3的深度思考模式(Deep Think),在GPQA、AIME等测试中性能全面超越Pro版本。该模式提升多模态融合、代码生成及安全防护能力,已集成至Ge... AI产品动态# AI安全# AI模型# Gemini3 2个月前
美团发布业界首个中文全模态评测基准UNO-Bench,揭示全模态大模型”组合定律” 美团发布业界首个中文全模态评测基准UNO-Bench,包含1250条全模态样本和2480条单模态样本,覆盖44类任务及5种模态组合。该基准首次验证全模态大模型"组合定律",为AI行业提供科学评估标准... AI产品动态# AI大模型# UNO-Bench# 人工智能基准 3个月前
Claude桌面版正式发布:新增智能截图与语音交互,性能提升40% 2025年10月22日Anthropic正式发布Claude桌面版,新增智能截图识别和Caps Lock语音输入功能,内存占用降低40%,响应延迟减少62%,支持macOS/Windows跨平台使用... AI产品动态# AI性能优化# AI桌面应用# Anthropic 3个月前
昆仑万维发布SkyReels AI视频创作平台:整合全球顶尖模型,实现零门槛多模态创作 昆仑万维正式发布升级版SkyReels AI视频创作平台,集成Google Veo 3.1、Sora 2等全球顶尖模型与自研SkyReels V3技术,提供无限画布、Agent系统、数字人多轮对话等功... AI产品动态# AGI战略# AI视频创作# SkyReels 3个月前