谷歌开源端侧多模态大模型Gemma 3n发布,2GB内存即可流畅运行 谷歌发布开源端侧多模态大模型Gemma 3n,支持2GB内存设备流畅运行,采用创新MatFormer架构与PLE技术,大幅降低内存占用,推动生成式AI在边缘设备的普及。 AI产品动态# AI技术# Gemma3n# 多模态AI 4个月前
蚂蚁集团推出AGI多模态应用“灵光”,开启视觉交互新纪元 蚂蚁集团发布AGI多模态应用“灵光”,核心功能AGI相机实现认知级场景理解与生成,依托支付宝生态优势布局多模态AI赛道,开启视觉交互技术新篇章。 AI产品动态# AGI# AGI相机# AI应用 1周前
Elastic收购Jina AI:开启多模态AI搜索新纪元,向量搜索技术迎来重大突破 Elastic完成对Jina AI战略收购,深度整合向量搜索与多模态AI技术。Jina AI核心模型将融入Elastic搜索平台,提升多语言文档和视觉文档检索效率,为企业提供更智能的搜索解决方案。 AI新闻资讯# AI搜索# Elastic# JinaAI 4周前
苹果秘密研发多模态AI模型Manzano,剑指OpenAI与谷歌图像编辑霸主地位 深度揭秘苹果秘密研发的Manzano多模态AI模型:具备图像理解与生成双重能力,技术指标接近行业领先的GPT-4o和谷歌Gemini 2.5 Flash Image。分析苹果如何挑战现有AI市场格局... AI产品动态# AI竞赛# Manzano模型# OpenAI 1个月前
Claude桌面版正式发布:新增智能截图与语音交互,性能提升40% 2025年10月22日Anthropic正式发布Claude桌面版,新增智能截图识别和Caps Lock语音输入功能,内存占用降低40%,响应延迟减少62%,支持macOS/Windows跨平台使用... AI产品动态# AI性能优化# AI桌面应用# Anthropic 2周前
字节跳动即梦AI 4.0发布:多模态图像生成技术实现三大功能整合 字节跳动即梦AI 4.0版本实现多模态技术突破,整合文生图/编辑/组图三大功能,支持2K图像1.8秒生成与4K输出,精准响应自然语言指令,显著降低AI图像创作门槛。 AI产品动态# AI技术突破# 人工智能# 即梦AI 2个月前
马斯克xAI加速研发世界模型,瞄准游戏与机器人领域新突破 深度解析马斯克xAI公司世界模型技术研发进展:从人才挖角到商业化布局,探讨其在游戏生成与机器人控制领域的应用前景,分析行业竞争格局与技术挑战。 AI新闻资讯# AGI# xAI# 世界模型 3周前
腾讯混元发布新一代图像生成模型HunyuanImage 2.1,支持2K高清与多语言生成 腾讯混元发布新一代开源图像生成模型HunyuanImage 2.1,支持原生2K分辨率输出、1000token超长文本解析与中英文混合嵌入,配套PromptEnhancer提示词优化工具,适用于商业设... AI产品动态# AI图像生成# AI设计工具# 多模态AI 2个月前
字节跳动发布OmniHuman-1.5视频生成模型:语音驱动多角色动画技术突破 深度解析字节跳动OmniHuman-1.5视频生成模型的技术特性:支持语音驱动、多角色互动与情感感知,突破分钟级动画生成限制,适用于影视、虚拟主播等商业化场景,推动AI内容创作技术发展。 AI产品动态# AI技术突破# OmniHuman# 人工智能 2个月前
Rokid Glasses完成Kickstarter众筹40万美元,多模态AR眼镜实现消费级突破 深度解析Rokid Glasses AR眼镜的众筹成果与技术优势:49克轻量化设计、多模态AI协同、支付宝声纹支付及高德全场景导航功能,涵盖产品特性、生态合作及全球市场订单数据,为AR行业提供消费级落... AI产品动态# AR眼镜# Kickstarter# Rokid 2个月前