谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 8个月前
苹果推出革命性AI图像生成系统STARFlow,挑战DALL-E与Midjourney市场地位 深度解析苹果STARFlow AI系统的技术突破:通过标准化流与Transformer融合实现高效图像生成,支持端到端训练与本地化部署,在医疗影像、电商视觉领域具颠覆性潜力。 AI产品动态# STARFlow# Transformer# 人工智能技术 9个月前
苹果发布UniGen 1.5多模态AI模型:统一架构实现图像理解、生成与编辑一体化 苹果研究团队推出多模态AI模型UniGen 1.5,实现图像理解、生成与编辑一体化集成,通过创新编辑指令对齐和统一奖励系统提升任务准确度,在多项测试中表现优异,为AI视觉领域带来重要技术突破与应用前景... AI产品动态# AI模型突破# UniGen1.5# 人工智能技术 5个月前
Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正 Luma AI推出全球首款多模态推理视频模型Ray3,支持16位HDR生成、4K输出与智能修正功能,深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。 AI产品动态# Adobe# AI视频生成# LumaAI 8个月前
即梦AI网页版全面升级,推出AI片场一站式创作解决方案,视频3.5 Pro模型实现音画同步突破 即梦AI网页版全面升级,正式推出AI片场一站式创作解决方案,核心亮点为全球首发视频3.5 Pro模型,实现音画同步生成技术,支持方言与复杂声画匹配。升级包括智能多帧2.0、图像生成矩阵及全流程画布系统... AI产品动态# AI创作工具# AI视频生成# AI设计 5个月前
快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率创代码智能新纪录 快手发布KAT系列Agentic Coding大模型,KAT-Coder以73.4%解决率刷新代码智能纪录,KAT-Dev-32B开源模型表现优异。了解国产AI代码大模型的技术突破与国际竞争力。 AI产品动态# AgenticCoding# AI大模型# 人工智能技术 8个月前
阶跃星辰开源图像生成模型NextStep-1.1:150亿参数自回归模型实现视觉伪影系统性优化 阶跃星辰于2025年12月开源NextStep-1.1图像生成模型,该150亿参数自回归模型通过基于流的强化学习技术,系统性解决视觉伪影问题,提升细节保真度与训练稳定性,现已托管于Hugging Fa... AI产品动态# AI开源# NextStep-1.1# 人工智能技术 5个月前
阿里巴巴开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,语音技术实现音色克隆与轻量化识别突破 阿里巴巴通义大模型团队开源Fun-CosyVoice3-0.5B与Fun-ASR-Nano模型,实现3秒音色克隆、多语言情感控制及轻量化高精度识别,降低延迟50%,支持实时场景与创意产业应用,加速语音... AI产品动态# AI开源# Fun-ASR-Nano# Fun-CosyVoice 5个月前
DeepSeek-V3.1重磅升级:128K上下文窗口震撼发布,长文本处理能力翻倍 DeepSeek-V3.1实现重大技术突破:上下文窗口扩展至128K,多步推理性能提升43%,幻觉概率降低38%。专为长文档分析、代码库理解和复杂计算场景优化,为企业级AI应用提供领先解决方案。 AI产品动态# AI模型升级# DeepSeek# MoE架构 9个月前
腾讯混元大模型开源翻译模型1.5版,覆盖33种语言与方言,轻量化部署实现突破 腾讯混元大模型团队开源翻译模型1.5版本,推出1.8B和7B两款模型,覆盖33种国际语言及5种民汉/方言翻译。1.8B模型专为移动端优化,内存仅1GB,响应速度提升55%;7B模型优化翻译准确性,解决... AI产品动态# AI翻译# WMT25# 人工智能技术 5个月前