阿里通义千问视觉模型登顶全球空间推理榜,超越GPT-5.1和Gemini 3 阿里云通义千问Qwen3-VL在权威空间推理测试SpatialBench中以13.5分登顶全球第一,超越GPT-5.1和Gemini 3等国际主流模型。该模型具备增强3D检测、视觉编程等创新功能,已在... AI产品动态# AI技术# SpatialBench# 人工智能 2个月前
谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流 谷歌实验室推出基于Gemini大模型的AI助手CC,深度融合Gmail、日历等核心服务,提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问,加速AI个人助手赛道竞争。 AI产品动态# AI助手# CC助手# Gemini大模型 2个月前
阿里通义万相Wan2.5发布:实现音画同步AI视频生成,10秒1080P影视级输出 阿里巴巴正式发布通义万相Wan2.5 Preview模型,突破多模态AI生成技术,实现音画同步的10秒1080P视频生成能力,支持文生视频、图生视频等核心功能,大幅降低影视内容制作成本。 AI产品动态# AI技术# AI视频生成# 云栖大会 4个月前
字节跳动推出AI办公应用AnyGen:语音驱动,重构办公信息整合全链路 字节跳动海外推出AI办公应用AnyGen,以语音驱动为核心,实现碎片信息到可交付文档的全链路重构。本文从SEO角度解读其功能亮点、技术融合、市场机遇及对AI办公行业竞争格局的影响,为关注AI生产力工具... AI产品动态# AI办公应用# AI工具# AnyGen 1个月前
谷歌发布Gemini Nano Banana 2 Flash轻量AI模型,图像生成成本降低30% 谷歌新一代轻量级AI模型Gemini Nano Banana 2 Flash正式推出,在图像生成与编辑领域实现显著突破,支持1M token上下文处理,运营成本降低30%,响应速度提升1.7倍。本文深... AI产品动态# AI图像生成# AI成本优化# AI技术突破 2个月前
字节跳动发布Vidi2多模态大模型:120亿参数突破时空定位,重塑视频创作生态 字节跳动2025年发布Vidi2多模态大模型,具备120亿参数与突破性时空定位技术,实现长视频智能解析、自动化编辑与对象追踪,在VUE-TR-V2基准测试中性能领先。模型已集成至TikTok,提供Sm... AI产品动态# AI大模型# TikTok# Vidi2 2个月前
MiniMax Agent全新升级,新增智能图像搜索等四大功能提AI协作效率 MiniMax Agent是MiniMax官方推出的AI生产力工具,主要说明该工具通过新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出四大核心功能,进一步提升多模态能力与长任务处理效率。 AI产品动态# AI工具# MiniMax# 图像生成技术 8个月前
阿里Qwen3-Omni-Flash-2025-12-01发布:原生全模态大模型实现音视频实时流式输出,支持个性化AI人设定制 阿里Qwen团队最新发布Qwen3-Omni-Flash-2025-12-01全模态大模型,实现文本、图像、音频和视频无缝输入与实时流式输出,技术升级包括原生统一编码器架构、音视频帧对齐及韵律预测网络... AI产品动态# AI交互# 人工智能# 多模态AI 2个月前
OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20% OpenAI于2025年12月17日推出GPT Image 1.5,新一代图像生成模型在生成质量、编辑功能和效率上实现突破,生成速度提升4倍,API费用降低20%。了解其核心性能提升、商业化应用及对行... AI产品动态# AI图像编辑# AI竞争# API成本优化 2个月前
谷歌Gemini 3正式集成全球搜索,AI Pro用户优先体验多模态智能搜索 2025年12月,谷歌正式将Gemini 3生成式AI模型部署至全球搜索引擎,支持文本、图像、音频多模态处理,响应速度提升40%。本文详解其技术架构、订阅政策及对搜索交互的革命性影响。 AI产品动态# AI搜索# Gemini3# NanoBananaPro 2个月前