阿里Qwen3-Omni-Flash-2025-12-01发布:原生全模态大模型实现音视频实时流式输出,支持个性化AI人设定制 阿里Qwen团队最新发布Qwen3-Omni-Flash-2025-12-01全模态大模型,实现文本、图像、音频和视频无缝输入与实时流式输出,技术升级包括原生统一编码器架构、音视频帧对齐及韵律预测网络... AI产品动态# AI交互# 人工智能# 多模态AI 3天前
OpenAI GPT-5.2携Image-2系列图像模型即将发布:2K-4K画质、专业编辑功能,多模态能力再升级 OpenAI即将发布GPT-5.2中的Image-2系列图像生成模型,提供2K-4K高分辨率、专业级编辑功能与优化色彩还原。本文解读新模型在画质、提示词理解及多模态AI领域的升级,分析其与谷歌Nano... AI产品动态# AI技术# AI新闻# GPT-5.2 4天前
谷歌Doppl推出AI沉浸式购物模块:静态商品秒变动态视频,虚拟试穿技术重塑电商体验 谷歌Doppl推出基于AI的沉浸式购物模块,通过多模态算法将静态商品转为动态视频,结合虚拟试穿实现全链路消费闭环。本文解析其技术原理、用户数据提升效果及行业差异化策略,探讨生成式AI如何重塑电商未来。 AI产品动态# 人工智能# 动态视频展示# 多模态AI 5天前
谷歌发布Titans与MIRAS大模型架构:突破Transformer限制,推动AGI进程 谷歌发布全新大模型架构Titans和MIRAS,Titans支持超200万token上下文,突破Transformer记忆瓶颈;MIRAS解决多模态对齐问题。两大架构已应用于实际平台,预计2026年商... AI新闻资讯# AI突破# DeepMind# MIRAS架构 7天前
谷歌发布Gemini Nano Banana 2 Flash轻量AI模型,图像生成成本降低30% 谷歌新一代轻量级AI模型Gemini Nano Banana 2 Flash正式推出,在图像生成与编辑领域实现显著突破,支持1M token上下文处理,运营成本降低30%,响应速度提升1.7倍。本文深... AI产品动态# AI图像生成# AI成本优化# AI技术突破 7天前
谷歌Gemini 3深度思考模式正式开放:性能全面超越Pro版,AI推理能力再突破 2025年12月5日,谷歌正式开放Gemini 3的深度思考模式(Deep Think),在GPQA、AIME等测试中性能全面超越Pro版本。该模式提升多模态融合、代码生成及安全防护能力,已集成至Ge... AI产品动态# AI安全# AI模型# Gemini3 7天前
蚂蚁集团灵光AI助手推出闪游戏平台:30秒创作游戏,AI赋能全民创作新突破 蚂蚁集团灵光AI助手推出“闪游戏”创作平台,通过自然语言交互实现30秒即时游戏创作,无需编程基础。平台支持移动端流畅运行,已吸引超200万下载,用户创建应用超330万,娱乐类占比最高。本文深度解读灵光... AI产品动态# AI助手# 全民创作# 多模态AI 1周前
阿里千问AI办公升级:对话即生产力,免费生成专业文档与PPT 2025年阿里巴巴千问AI推出办公功能重大升级,支持文档生成、智能排版、PPT制作及多格式转换,用户通过对话即可免费完成专业级办公任务。本文详解其一站式操作、多模态输入及商业化前景,探索AI如何重塑办... AI产品动态# AI办公# PPT制作# 企业服务 1周前
英伟达支持的Luma AI完成9亿美元C轮融资,估值超40亿美元并启动欧洲扩张 英伟达支持的Luma AI完成9亿美元C轮融资,估值超40亿美元,启动以伦敦为核心的欧洲战略扩张。本文解析其融资细节、伦敦研发中心计划,以及在生成式视频领域与谷歌、Meta的竞争格局,探讨全球AI区域... AI新闻资讯# AI融资# LumaAI# 世界模型 2周前
阿里Qwen-Image重大升级:强化图像编辑一致性,突破多视角转换技术 阿里巴巴2025年发布Qwen-Image重大更新,强化图像编辑一致性与多视角转换技术,提升人物合照生成和工业设计功能,免费开放于千问APP,推动生成式AI在影视、广告等领域的应用。 AI产品动态# AIGC# Qwen-Image# 图像编辑 2周前