腾讯混元开源全球首个800亿参数工业级多模态生图模型,开启AI图像生成新纪元 腾讯混元团队开源全球首个800亿参数工业级多模态生图模型混元图像3.0,支持1000+字符文本理解和多语言文字渲染,在Github和Hugging Face可免费下载使用,推动AI图像技术普及。 AI产品动态# AI图像生成# 人工智能# 多模态模型 8个月前
阿里巴巴开源多模态智能体WebWatcher,性能超越GPT-4o 阿里巴巴开源多模态智能体WebWatcher在HLE-VL等基准测试中表现超越GPT-4o,提供图文融合的深度研究能力。了解这款革命性AI工具如何改变多模态信息处理格局。 AI产品动态# GPT-4o# WebWatcher# 多模态智能体 9个月前
腾讯推出智能问答框架WeKnora,助力企业级文档问答场景 腾讯推出智能问答框架WeKnora,集成OCR与跨模态建模技术,支持多模态文档解析与语义检索。提供私有化部署方案,适用于金融、法律等高敏感场景,助力企业知识管理智能化。 AI产品动态# WeKnora# 企业级应用# 大语言模型 10个月前
谷歌NotebookLM推出视频概览功能:AI笔记应用再升级 谷歌NotebookLM推出全新视频概览功能,通过AI将笔记、PDF等自动转化为幻灯片式视频,适用于教育、科研及企业培训。了解这一AI笔记应用的重大升级及其应用场景。 AI产品动态# AI功能# AI笔记# NotebookLM 10个月前
荣耀发布开源多模态感知大模型MagicGUI,引领手机AI交互新阶段 荣耀在WAIC2025重磅发布70亿参数开源多模态大模型MagicGUI,通过强化学习算法实现91.5%场景操控准确率,推动手机跨应用智能体协同交互,加速消费电子AI自动化普及。 AI产品动态# AI交互# MagicGUI# WAIC 10个月前
谷歌Gemini嵌入模型登顶MTEB排行榜:性能与成本双突破 深度解析谷歌Gemini嵌入模型以68.37分登顶MTEB的技术突破:32层Transformer架构、93.3%存储优化及0.15美元/百万token的商业化策略,揭示其在搜索推荐、多语言处理等场景... AI产品动态# Gemini嵌入模型# MTEB排行榜# 文本嵌入技术 11个月前
美图公司推出AI影像Agent产品RoboNeo,革新影像处理与品牌设计 美图公司2025年推出的AI影像Agent产品RoboNeo,通过自然语言指令实现专业级图片精修和品牌设计,显著提升效率,特别适合电商和中小品牌使用。 AI产品动态# AI影像处理# RoboNeo# 品牌设计 11个月前
迈富时推出AI-Agentforce 2.0平台,助力企业AI规模化落地 迈富时推出的AI-Agentforce 2.0平台,集成Agentic工作流引擎、RAG知识中枢及DevOps运维体系,为企业提供从智能体设计、开发、部署到运营的全生命周期管理,降低AI技术门槛,推动... AI产品动态# AI# AI-Agentforce# 企业级AI 11个月前
智谱AI发布GLM-ASR系列语音识别模型与AI输入法,支持多语种与隐私保护 2025年12月,智谱AI发布GLM-ASR系列语音识别模型及AI输入法。云端模型CER低至0.0717,支持多语种实时转写;端侧模型仅15亿参数,实现隐私保护与低延迟。输入法集成翻译、文本改写及语音... AI产品动态# AI输入法# GLM-ASR# VibeCoding 6个月前
谷歌与XREAL联合发布智能眼镜Project Aura,搭载Android XR系统与Gemini AI,2026年上市 谷歌与XREAL联合发布智能眼镜Project Aura,搭载Android XR操作系统与Gemini多模态AI,实现空间语义交互。设备采用分体式设计、70度视场角光学透视技术,计划2026年上市... AI产品动态# 2026上市# AndroidXR# AR眼镜 6个月前