谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 4周前
国内首个对话式音乐创作Agent Tunee公测:用自然语言生成完整音乐作品 趣丸科技正式推出国内首个对话式音乐创作Agent Tunee,支持自然语言交互生成完整音乐作品,包含AI作曲、编曲、人声合成及MV制作功能,公测期间免费使用。 AI产品动态# AI音乐创作# Tunee# 人工智能 1个月前
苹果秘密研发多模态AI模型Manzano,剑指OpenAI与谷歌图像编辑霸主地位 深度揭秘苹果秘密研发的Manzano多模态AI模型:具备图像理解与生成双重能力,技术指标接近行业领先的GPT-4o和谷歌Gemini 2.5 Flash Image。分析苹果如何挑战现有AI市场格局... AI产品动态# AI竞赛# Manzano模型# OpenAI 1个月前
苹果多模态AI模型Manzano技术细节首度曝光,35亿参数支持2048像素处理 深度解析苹果Manzano多模态AI模型的混合分词器架构、35亿参数性能表现及其在iOS系统中的战略意义,对比GPT-4o技术优势。 AI新闻资讯# AI技术# GPT-5# iOS26 1个月前
OpenAI秘密测试GPT-Alpha智能体:基于GPT-5的多模态AI或将重塑行业 OpenAI被曝正在测试基于GPT-5模型的全新AI智能体GPT-Alpha。该技术突破传统生成式AI边界,支持文本、代码、图像多模态协同处理,具备高级推理与工具使用能力。本文详解其核心功能、应用场景... AI新闻资讯# AI技术# GPT-5# GPT-Alpha 1个月前
谷歌Mixboard AI工具公测:生成式AI重塑创意设计流程 本文深度解析谷歌Mixboard AI工具的核心功能与技术优势,探讨其如何通过Gemini 2.5 Flash模型和自然语言交互,为家居设计、活动策划等场景提供高效可视化解决方案。 AI产品动态# Mixboard# NanoBanana# 公测 1个月前
阿里通义万相Wan2.5发布:实现音画同步AI视频生成,10秒1080P影视级输出 阿里巴巴正式发布通义万相Wan2.5 Preview模型,突破多模态AI生成技术,实现音画同步的10秒1080P视频生成能力,支持文生视频、图生视频等核心功能,大幅降低影视内容制作成本。 AI产品动态# AI技术# AI视频生成# 云栖大会 1个月前
谷歌Gemini AI助手正式登陆Google TV,开启家庭娱乐智能新纪元 谷歌Gemini AI助手正式登陆Google TV平台,支持自然语言交互的个性化影视推荐、剧情回溯及跨设备生态联动。本文详解Gemini在电视端的功能特性、支持机型及对智能家居生态的影响。 AI产品动态# AI助手# GoogleTV# TCL电视 1个月前
生数科技完成数亿元A轮融资,加速多模态大模型Vidu全球商业化布局 生数科技完成数亿元A轮融资,领跑多模态AI赛道。Vidu模型覆盖200+国家,年收入超2000万美元。融资助力技术研发与全球商业化,对标Google Nano Banana。 AI新闻资讯# AI融资# A轮融资# Vidu模型 1个月前
Luma AI发布全球首款多模态推理视频模型Ray3,支持4K HDR生成与智能修正 Luma AI推出全球首款多模态推理视频模型Ray3,支持16位HDR生成、4K输出与智能修正功能,深度集成Adobe工作流。了解其技术优势、商业应用及对AI视频行业的影响。 AI产品动态# Adobe# AI视频生成# LumaAI 1个月前