多模态AI

MiniMax发布海螺2.3视频生成模型：肢体动作与微表情实现技术突破

MiniMax发布新一代海螺2.3视频生成模型，在肢体动作、微表情和风格化处理实现技术突破，配合Media Agent工具实现全流程自动化创作，生成速度提升50%，为专业创作者提供高效视频生成解决方案...

7个月前

谷歌开源AI Agent框架Gemini CLI：命令行终端集成大模型能力

谷歌2025年重磅开源Gemini CLI框架，详解其命令行终端集成Veo视频模型、Imagen图像模型的技术优势，免费政策及与Claude Code的竞争格局，揭示AI编程工具链新趋势。

AI产品动态 # AI开源 # GeminiCLI # 命令行工具

11个月前

谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

谷歌发布Gemini大模型能耗报告：文本生成单次仅耗电0.24瓦时，同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术，及在移动端多模态处理场景的...

AI产品动态 # AI能耗 # Gemma3 # Transformer架构

9个月前

通义千问开源Qwen-Image-Edit图像编辑模型：实现语义与外观双重编辑突破

阿里巴巴通义千问推出开源Qwen-Image-Edit图像编辑模型，突破性实现语义与外观双重编辑能力，支持中英文文本像素级修改，适配消费级显卡，在多项国际基准测试中达到最先进水平。

AI产品动态 # AI图像编辑 # Qwen-Image-Edit # 多模态AI

9个月前

谷歌发布AI助手CC：基于Gemini大模型，整合Gmail、日历打造个性化工作流

谷歌实验室推出基于Gemini大模型的AI助手CC，深度融合Gmail、日历等核心服务，提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问，加速AI个人助手赛道竞争。

AI产品动态 # AI助手 # CC助手 # Gemini大模型

5个月前

OpenAI发布GPT Image 1.5：图像生成速度提升4倍，API成本降低20%

OpenAI于2025年12月17日推出GPT Image 1.5，新一代图像生成模型在生成质量、编辑功能和效率上实现突破，生成速度提升4倍，API费用降低20%。了解其核心性能提升、商业化应用及对行...

AI产品动态 # AI图像编辑 # AI竞争 # API成本优化

5个月前

生数科技完成数亿元A轮融资，加速多模态大模型Vidu全球商业化布局

生数科技完成数亿元A轮融资，领跑多模态AI赛道。Vidu模型覆盖200+国家，年收入超2000万美元。融资助力技术研发与全球商业化，对标Google Nano Banana。

AI新闻资讯 # AI融资 # A轮融资 # Vidu模型

8个月前

Thinking Machines Lab开放Tinker平台：集成万亿参数Kimi K2与Qwen3-VL多模态模型

由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式开放Tinker AI平台，集成万亿参数Kimi K2推理模型与Qwen3-VL视觉语言模型，支持多...

AI产品动态 # AI平台 # MiraMurati # OpenAI

5个月前

Claude桌面版正式发布：新增智能截图与语音交互，性能提升40%

2025年10月22日Anthropic正式发布Claude桌面版，新增智能截图识别和Caps Lock语音输入功能，内存占用降低40%，响应延迟减少62%，支持macOS/Windows跨平台使用...

AI产品动态 # AI性能优化 # AI桌面应用 # Anthropic

7个月前

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

苹果研究团队推出多模态AI模型UniGen 1.5，实现图像理解、生成与编辑一体化集成，通过创新编辑指令对齐和统一奖励系统提升任务准确度，在多项测试中表现优异，为AI视觉领域带来重要技术突破与应用前景...

AI产品动态 # AI模型突破 # UniGen1.5 # 人工智能技术

5个月前

MiniMax发布海螺2.3视频生成模型：肢体动作与微表情实现技术突破

谷歌开源AI Agent框架Gemini CLI：命令行终端集成大模型能力

谷歌Gemini大模型能耗报告发布：文本生成单次仅0.24瓦时，Gemma 3轻量版同步亮相

通义千问开源Qwen-Image-Edit图像编辑模型：实现语义与外观双重编辑突破

谷歌发布AI助手CC：基于Gemini大模型，整合Gmail、日历打造个性化工作流

OpenAI发布GPT Image 1.5：图像生成速度提升4倍，API成本降低20%

生数科技完成数亿元A轮融资，加速多模态大模型Vidu全球商业化布局

Thinking Machines Lab开放Tinker平台：集成万亿参数Kimi K2与Qwen3-VL多模态模型

Claude桌面版正式发布：新增智能截图与语音交互，性能提升40%

苹果发布UniGen 1.5多模态AI模型：统一架构实现图像理解、生成与编辑一体化

热门AI工具

最新资讯