智源研究院发布OmniGen2:新一代开源统一图像生成模型,多模态能力全面升级 深度解析智源研究院OmniGen2图像生成模型技术亮点:40亿参数开源架构,支持文本到图像无缝切换,在GenEval测试中评分0.86。了解其反思机制、多模态生成能力及FlagScale推理加速方案。 AI产品动态# AI生成模型# 多模态AI# 开源项目 1个月前
谷歌开源端侧多模态大模型Gemma 3n发布,2GB内存即可流畅运行 谷歌发布开源端侧多模态大模型Gemma 3n,支持2GB内存设备流畅运行,采用创新MatFormer架构与PLE技术,大幅降低内存占用,推动生成式AI在边缘设备的普及。 AI产品动态# AI技术# Gemma3n# 多模态AI 1个月前
Meta高薪挖角OpenAI三员大将,1亿美元签约奖金引爆AI人才争夺战 深度解析Meta以1亿美元高薪从OpenAI挖走三位核心AI研究员的战略意图,揭秘科技巨头在通用人工智能(AGI)领域的军备竞赛现状与未来行业影响。 AI新闻资讯# AGI# Meta# OpenAI 1个月前
AI虚拟走秀《名作艺术秀》全球热议:梵高、达利跨时空亮相T台 深度解析全球首个AI艺术虚拟走秀《名作艺术秀》的技术突破与行业价值:通过2000万组色彩数据算法还原名画细节,探索AI在艺术创作、文物修复及商业应用中的前沿实践,获卢浮宫等顶级机构关注。 AI新闻资讯# AI艺术# 人机共创# 多模态AI 2个月前
谷歌开源AI Agent框架Gemini CLI:命令行终端集成大模型能力 谷歌2025年重磅开源Gemini CLI框架,详解其命令行终端集成Veo视频模型、Imagen图像模型的技术优势,免费政策及与Claude Code的竞争格局,揭示AI编程工具链新趋势。 AI产品动态# AI开源# GeminiCLI# 命令行工具 2个月前
MiniMax海螺AI会员定价调整引争议:至臻版年费10788元值不值? 深度解析MiniMax海螺AI会员调价事件:新一代Hailuo 02模型技术参数曝光,10788元年费是否物有所值?对比Runway、可灵AI等竞品,探讨AI视频生成工具的商业化困境与用户接受度平衡。 AI新闻资讯# AI视频生成# MiniMax# Runway 2个月前
百度推出多模态数字人互动直播间 文心4.5T技术实现声音形象协调 百度在“AI Day”开放日上正式发布业界首个双数字人互动直播间,标志着多模态数字人技术进入商业化应用新阶段。该技术基于文心大模型4.5T驱动,实现了语言、声音、形象的深度协同,为电商、教育、娱乐等领... AI产品动态# AI技术# 多模态AI# 数字人直播 2个月前
MiniMax Agent全新升级,新增智能图像搜索等四大功能提AI协作效率 MiniMax Agent是MiniMax官方推出的AI生产力工具,主要说明该工具通过新增智能图像搜索、稳定的图像生成、多语言支持及多样化文档导出四大核心功能,进一步提升多模态能力与长任务处理效率。 AI产品动态# AI工具# MiniMax# 图像生成技术 2个月前