美的医疗发布国产医学影像多模态智能诊断大模型,实现基层医疗AI关键技术突破 美的医疗正式发布国产自主知识产权的医学影像多模态智能诊断大模型,实现肺结核、肺炎等胸部疾病自动检测与报告生成。该模型采用轻量化设备端与高精度云端双架构,适配不同医疗机构需求,已进入临床验证,计划202... AI产品动态# DR影像# 人工智能# 医学影像 2个月前
阿里Qwen-Image重大升级:强化图像编辑一致性,突破多视角转换技术 阿里巴巴2025年发布Qwen-Image重大更新,强化图像编辑一致性与多视角转换技术,提升人物合照生成和工业设计功能,免费开放于千问APP,推动生成式AI在影视、广告等领域的应用。 AI产品动态# AIGC# Qwen-Image# 图像编辑 2个月前
英伟达支持的Luma AI完成9亿美元C轮融资,估值超40亿美元并启动欧洲扩张 英伟达支持的Luma AI完成9亿美元C轮融资,估值超40亿美元,启动以伦敦为核心的欧洲战略扩张。本文解析其融资细节、伦敦研发中心计划,以及在生成式视频领域与谷歌、Meta的竞争格局,探讨全球AI区域... AI新闻资讯# AI融资# LumaAI# 世界模型 2个月前
ChatGPT语音交互重大升级!语音模式全面整合至主界面,多模态体验再进化 OpenAI对ChatGPT语音功能进行重大升级,将语音模式全面整合至主界面,实现语音、文本、视觉内容实时同步显示,显著提升多模态人机交互体验,适用于教育、导航等多种场景。 AI产品动态# ChatGPT# OpenAI# 人工智能升级 2个月前
Anthropic发布Claude Opus 4.5:编程能力首超人类,API价格大幅下调三分之二 Anthropic于2025年发布Claude Opus 4.5 AI模型,在编程测试中首次超越人类表现,SWE-bench准确率达80.9%领先行业,同时API价格大幅下调三分之二,支持30小时连续... AI产品动态# AI模型# Anthropic# API定价 2个月前
谷歌Gemini 3 Pro将于2025年11月推出:百万token上下文窗口重塑AI处理能力 谷歌下一代旗舰AI模型Gemini 3 Pro确认2025年11月发布,具备革命性100万token上下文处理能力,可完整分析300页书籍内容。多模态升级与Agent技术结合,将重塑企业AI服务竞争格... AI产品动态# AI模型# Gemini3Pro# GPT-5竞争 3个月前
谷歌开源端侧多模态大模型Gemma 3n发布,2GB内存即可流畅运行 谷歌发布开源端侧多模态大模型Gemma 3n,支持2GB内存设备流畅运行,采用创新MatFormer架构与PLE技术,大幅降低内存占用,推动生成式AI在边缘设备的普及。 AI产品动态# AI技术# Gemma3n# 多模态AI 7个月前
Thinking Machines Lab开放Tinker平台:集成万亿参数Kimi K2与Qwen3-VL多模态模型 由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式开放Tinker AI平台,集成万亿参数Kimi K2推理模型与Qwen3-VL视觉语言模型,支持多... AI产品动态# AI平台# MiraMurati# OpenAI 2个月前
OpenAI Evals重大更新:原生音频评估功能上线,语音模型测试效率提升40% OpenAI Evals推出原生音频评估功能,支持直接上传音频文件进行端到端测试,消除转录失真,提升40%评估可信度。适用于语音助手、语音识别及AI语音生成的质量监控,加速语音AI产品迭代。 AI产品动态# AI测试工具# OpenAI# 多模态AI 5个月前
苹果发布UniGen 1.5多模态AI模型:统一架构实现图像理解、生成与编辑一体化 苹果研究团队推出多模态AI模型UniGen 1.5,实现图像理解、生成与编辑一体化集成,通过创新编辑指令对齐和统一奖励系统提升任务准确度,在多项测试中表现优异,为AI视觉领域带来重要技术突破与应用前景... AI产品动态# AI模型突破# UniGen1.5# 人工智能技术 1个月前