腾讯混元图像3.0登顶全球文生图榜首,元宝App可一键生成专业级图像 腾讯混元图像3.0登顶全球文生图榜单第一,正式登陆元宝App。这款800亿参数开源模型支持2048×2048超高分辨率,可实现表情包、人像写真等专业级图像生成,已助力电商、游戏行业提升80%开发效率。 AI产品动态# AI商业化# AI图像生成# 元宝App 4个月前
字节跳动豆包平台推出AI驱动3D模型生成工具,助力游戏开发与多模态AI生态 了解字节跳动豆包平台最新AI驱动的3D模型生成工具,支持图像和混合生成模式,专注于游戏开发和工业级应用,预计短期开放,助力多模态AI生态发展。 AI产品动态# AI3D生成# AIGC# 多模态AI 5个月前
谷歌开源AI Agent框架Gemini CLI:命令行终端集成大模型能力 谷歌2025年重磅开源Gemini CLI框架,详解其命令行终端集成Veo视频模型、Imagen图像模型的技术优势,免费政策及与Claude Code的竞争格局,揭示AI编程工具链新趋势。 AI产品动态# AI开源# GeminiCLI# 命令行工具 7个月前
蚂蚁数科发布多语种多模态大模型训练框架,突破小语种AI理解瓶颈 蚂蚁数科在香港金融科技节发布创新多语种多模态大模型训练框架,通过语言感知优化机制提升小语种理解能力,在主流多语言VQA基准测试中准确率提升9.5%,评测总分超越GPT-4o、Gemini等国际主流模型... AI产品动态# 人工智能技术# 多模态AI# 多语种大模型 3个月前
谷歌Mixboard AI工具公测:生成式AI重塑创意设计流程 本文深度解析谷歌Mixboard AI工具的核心功能与技术优势,探讨其如何通过Gemini 2.5 Flash模型和自然语言交互,为家居设计、活动策划等场景提供高效可视化解决方案。 AI产品动态# Mixboard# NanoBanana# 公测 4个月前
谷歌相册AI图生视频重磅升级:新增自定义提示词功能,视频生成精准度提升40% 谷歌相册6.48版本推出AI图生视频自定义提示词功能,用户可通过自然语言指令精准控制视频生成方向,基于Veo 3模型的技术升级使生成准确率提升40%,实现从随机创作到精准定制的跨越。 AI产品动态# AI视频生成# Veo模型# 人工智能技术 4个月前
谷歌Gemini大模型能耗报告发布:文本生成单次仅0.24瓦时,Gemma 3轻量版同步亮相 谷歌发布Gemini大模型能耗报告:文本生成单次仅耗电0.24瓦时,同步推出轻量级Gemma 3 270M模型。深度解析其Transformer架构优化、40%能耗降低技术,及在移动端多模态处理场景的... AI产品动态# AI能耗# Gemma3# Transformer架构 5个月前
谷歌Gemini API全面上线URL Context功能,革新AI文档处理与多模态理解 谷歌Gemini API全面集成URL Context功能,支持直接处理URL内容(网页、PDF、图像),实现34MB大文档解析和多模态理解。本文解析其技术优势、对RAG架构的革新及在数据分析领域的S... AI产品动态# AIAPI# RAG架构# URLContext 5个月前
阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元 阿里巴巴通义万相2.6模型正式发布,作为国内首个支持角色扮演的AI视频生成技术,可实现基于人物外观与音色的定制化视频生成,提升至15秒时长,适用于影视、广告及短剧制作,现已上线阿里云百炼平台,助力企业... AI产品动态# AI商业化# AI视频生成# 人工智能技术 2个月前
MiniMax发布海螺2.3视频生成模型:肢体动作与微表情实现技术突破 MiniMax发布新一代海螺2.3视频生成模型,在肢体动作、微表情和风格化处理实现技术突破,配合Media Agent工具实现全流程自动化创作,生成速度提升50%,为专业创作者提供高效视频生成解决方案... AI产品动态# AI技术# MediaAgent# MiniMax 3个月前