MiniMax发布海螺2.3视频生成模型:肢体动作与微表情实现技术突破 MiniMax发布新一代海螺2.3视频生成模型,在肢体动作、微表情和风格化处理实现技术突破,配合Media Agent工具实现全流程自动化创作,生成速度提升50%,为专业创作者提供高效视频生成解决方案... AI产品动态# AI技术# MediaAgent# MiniMax 7个月前
谷歌开源AI Agent框架Gemini CLI:命令行终端集成大模型能力 谷歌2025年重磅开源Gemini CLI框架,详解其命令行终端集成Veo视频模型、Imagen图像模型的技术优势,免费政策及与Claude Code的竞争格局,揭示AI编程工具链新趋势。 AI产品动态# AI开源# GeminiCLI# 命令行工具 11个月前
谷歌Gemini大模型能耗报告发布:文本生成单次仅0.24瓦时,Gemma 3轻量版同步亮相 谷歌发布Gemini大模型能耗报告:文本生成单次仅耗电0.24瓦时,同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术,及在移动端多模态处理场景的... AI产品动态# AI能耗# Gemma3# Transformer架构 9个月前
通义千问开源Qwen-Image-Edit图像编辑模型:实现语义与外观双重编辑突破 阿里巴巴通义千问推出开源Qwen-Image-Edit图像编辑模型,突破性实现语义与外观双重编辑能力,支持中英文文本像素级修改,适配消费级显卡,在多项国际基准测试中达到最先进水平。 AI产品动态# AI图像编辑# Qwen-Image-Edit# 多模态AI 9个月前
谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流 谷歌实验室推出基于Gemini大模型的AI助手CC,深度融合Gmail、日历等核心服务,提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问,加速AI个人助手赛道竞争。 AI产品动态# AI助手# CC助手# Gemini大模型 5个月前
OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20% OpenAI于2025年12月17日推出GPT Image 1.5,新一代图像生成模型在生成质量、编辑功能和效率上实现突破,生成速度提升4倍,API费用降低20%。了解其核心性能提升、商业化应用及对行... AI产品动态# AI图像编辑# AI竞争# API成本优化 5个月前
生数科技完成数亿元A轮融资,加速多模态大模型Vidu全球商业化布局 生数科技完成数亿元A轮融资,领跑多模态AI赛道。Vidu模型覆盖200+国家,年收入超2000万美元。融资助力技术研发与全球商业化,对标Google Nano Banana。 AI新闻资讯# AI融资# A轮融资# Vidu模型 8个月前
Thinking Machines Lab开放Tinker平台:集成万亿参数Kimi K2与Qwen3-VL多模态模型 由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式开放Tinker AI平台,集成万亿参数Kimi K2推理模型与Qwen3-VL视觉语言模型,支持多... AI产品动态# AI平台# MiraMurati# OpenAI 5个月前
Claude桌面版正式发布:新增智能截图与语音交互,性能提升40% 2025年10月22日Anthropic正式发布Claude桌面版,新增智能截图识别和Caps Lock语音输入功能,内存占用降低40%,响应延迟减少62%,支持macOS/Windows跨平台使用... AI产品动态# AI性能优化# AI桌面应用# Anthropic 7个月前
苹果发布UniGen 1.5多模态AI模型:统一架构实现图像理解、生成与编辑一体化 苹果研究团队推出多模态AI模型UniGen 1.5,实现图像理解、生成与编辑一体化集成,通过创新编辑指令对齐和统一奖励系统提升任务准确度,在多项测试中表现优异,为AI视觉领域带来重要技术突破与应用前景... AI产品动态# AI模型突破# UniGen1.5# 人工智能技术 5个月前