多模态AI

谷歌发布Titans与MIRAS大模型架构：突破Transformer限制，推动AGI进程

谷歌发布全新大模型架构Titans和MIRAS，Titans支持超200万token上下文，突破Transformer记忆瓶颈；MIRAS解决多模态对齐问题。两大架构已应用于实际平台，预计2026年商...

6个月前

谷歌发布Gemini Nano Banana 2 Flash轻量AI模型，图像生成成本降低30%

谷歌新一代轻量级AI模型Gemini Nano Banana 2 Flash正式推出，在图像生成与编辑领域实现显著突破，支持1M token上下文处理，运营成本降低30%，响应速度提升1.7倍。本文深...

AI产品动态 # AI图像生成 # AI成本优化 # AI技术突破

6个月前

谷歌Gemini 3深度思考模式正式开放：性能全面超越Pro版，AI推理能力再突破

2025年12月5日，谷歌正式开放Gemini 3的深度思考模式（Deep Think），在GPQA、AIME等测试中性能全面超越Pro版本。该模式提升多模态融合、代码生成及安全防护能力，已集成至Ge...

AI产品动态 # AI安全 # AI模型 # Gemini3

6个月前

蚂蚁集团灵光AI助手推出闪游戏平台：30秒创作游戏，AI赋能全民创作新突破

蚂蚁集团灵光AI助手推出“闪游戏”创作平台，通过自然语言交互实现30秒即时游戏创作，无需编程基础。平台支持移动端流畅运行，已吸引超200万下载，用户创建应用超330万，娱乐类占比最高。本文深度解读灵光...

AI产品动态 # AI助手 # 全民创作 # 多模态AI

6个月前

阿里千问AI办公升级：对话即生产力，免费生成专业文档与PPT

2025年阿里巴巴千问AI推出办公功能重大升级，支持文档生成、智能排版、PPT制作及多格式转换，用户通过对话即可免费完成专业级办公任务。本文详解其一站式操作、多模态输入及商业化前景，探索AI如何重塑办...

AI产品动态 # AI办公 # PPT制作 # 企业服务

6个月前

英伟达支持的Luma AI完成9亿美元C轮融资，估值超40亿美元并启动欧洲扩张

英伟达支持的Luma AI完成9亿美元C轮融资，估值超40亿美元，启动以伦敦为核心的欧洲战略扩张。本文解析其融资细节、伦敦研发中心计划，以及在生成式视频领域与谷歌、Meta的竞争格局，探讨全球AI区域...

AI新闻资讯 # AI融资 # LumaAI # 世界模型

6个月前

阿里Qwen-Image重大升级：强化图像编辑一致性，突破多视角转换技术

阿里巴巴2025年发布Qwen-Image重大更新，强化图像编辑一致性与多视角转换技术，提升人物合照生成和工业设计功能，免费开放于千问APP，推动生成式AI在影视、广告等领域的应用。

AI产品动态 # AIGC # Qwen-Image # 图像编辑

6个月前

谷歌Gemini 3正式集成全球搜索，AI Pro用户优先体验多模态智能搜索

2025年12月，谷歌正式将Gemini 3生成式AI模型部署至全球搜索引擎，支持文本、图像、音频多模态处理，响应速度提升40%。本文详解其技术架构、订阅政策及对搜索交互的革命性影响。

AI产品动态 # AI搜索 # Gemini3 # NanoBananaPro

6个月前

字节跳动发布Vidi2多模态大模型：120亿参数突破时空定位，重塑视频创作生态

字节跳动2025年发布Vidi2多模态大模型，具备120亿参数与突破性时空定位技术，实现长视频智能解析、自动化编辑与对象追踪，在VUE-TR-V2基准测试中性能领先。模型已集成至TikTok，提供Sm...

AI产品动态 # AI大模型 # TikTok # Vidi2

6个月前

生数科技Vidu Q2生图功能重磅升级：文生图与编辑模块上线，AI创作效率革命性提升

生数科技Vidu Q2生图功能完成重大升级，新增文生图与图像编辑模块，支持5秒快速生成、批量创作与跨模态工作流。该工具在权威评测中超越GPT-5，尤其适用于电商、短剧等工业化内容生产场景，实现创作效率...

AI产品动态 # AIGC # AI图像生成 # ViduQ2

6个月前

谷歌发布Titans与MIRAS大模型架构：突破Transformer限制，推动AGI进程

谷歌发布Gemini Nano Banana 2 Flash轻量AI模型，图像生成成本降低30%

谷歌Gemini 3深度思考模式正式开放：性能全面超越Pro版，AI推理能力再突破

蚂蚁集团灵光AI助手推出闪游戏平台：30秒创作游戏，AI赋能全民创作新突破

阿里千问AI办公升级：对话即生产力，免费生成专业文档与PPT

英伟达支持的Luma AI完成9亿美元C轮融资，估值超40亿美元并启动欧洲扩张

阿里Qwen-Image重大升级：强化图像编辑一致性，突破多视角转换技术

谷歌Gemini 3正式集成全球搜索，AI Pro用户优先体验多模态智能搜索

字节跳动发布Vidi2多模态大模型：120亿参数突破时空定位，重塑视频创作生态

生数科技Vidu Q2生图功能重磅升级：文生图与编辑模块上线，AI创作效率革命性提升

热门AI工具

最新资讯