谷歌发布AI助手CC:基于Gemini大模型,整合Gmail、日历打造个性化工作流 谷歌实验室推出基于Gemini大模型的AI助手CC,深度融合Gmail、日历等核心服务,提供自动化晨间简报、邮件预起草等功能。目前面向美加用户开放早期访问,加速AI个人助手赛道竞争。 AI产品动态# AI助手# CC助手# Gemini大模型 1天前
Meta开源SAM Audio音频分离模型:多模态提示技术重塑音频编辑行业 Meta最新开源的SAM Audio多模态音频分离模型,通过文本、视觉和时间段提示实现精准声音分离,适用于音乐制作、播客降噪等场景。本文解析其PE-AV核心技术、应用优势及开源资源,探讨AI音频处理的... AI产品动态# AI工具# Meta# SAMAudio 2天前
美的医疗发布国产医学影像多模态智能诊断大模型,实现基层医疗AI关键技术突破 美的医疗正式发布国产自主知识产权的医学影像多模态智能诊断大模型,实现肺结核、肺炎等胸部疾病自动检测与报告生成。该模型采用轻量化设备端与高精度云端双架构,适配不同医疗机构需求,已进入临床验证,计划202... AI产品动态# DR影像# 人工智能# 医学影像 2天前
盛数科技Vidu视频大模型全球内测:一键生成产品广告成片,AI视频商业化加速 盛数科技Vidu视频大模型全球内测上线,核心功能一键生成可直接投放的产品广告成片,基于Vidu Q2模型实现多主体一致性控制与高清音画同步,平均生成时间3分钟内,助力电商、美妆等行业降低70%制作成本... AI产品动态# AI视频生成# MaaS# Vidu大模型 2天前
谷歌发布Gemini 3 Flash模型:成本仅Pro版1/4,速度提升3倍,成AI市场新标杆 谷歌推出Gemini 3 Flash模型,以Pro版1/4的成本实现3倍运行速度,在MMMU-Pro基准测试中超越GPT-5.2。该模型已集成至Gemini应用与谷歌搜索,标志AI竞赛进入白热化阶段... AI产品动态# AI模型# Gemini3Flash# OpenAI 2天前
多模态AI为何数不清六根手指?揭秘模型在空间认知与逻辑推理的结构性缺陷 本文深入探讨多模态AI模型在六指手识别中暴露的系统性错误,分析数据偏差、Transformer架构局限导致的逻辑割裂,并提出未来需融合神经符号系统的解决路径。了解AI在简单任务中犯错的深层原因。 AI新闻资讯# AI缺陷# AI训练# Transformer架构 3天前
阿里巴巴发布通义万相2.6:国内首个支持角色扮演的AI视频生成模型,开启影视创作新纪元 阿里巴巴通义万相2.6模型正式发布,作为国内首个支持角色扮演的AI视频生成技术,可实现基于人物外观与音色的定制化视频生成,提升至15秒时长,适用于影视、广告及短剧制作,现已上线阿里云百炼平台,助力企业... AI产品动态# AI商业化# AI视频生成# 人工智能技术 3天前
OpenAI发布GPT Image 1.5:图像生成速度提升4倍,API成本降低20% OpenAI于2025年12月17日推出GPT Image 1.5,新一代图像生成模型在生成质量、编辑功能和效率上实现突破,生成速度提升4倍,API费用降低20%。了解其核心性能提升、商业化应用及对行... AI产品动态# AI图像编辑# AI竞争# API成本优化 3天前
Thinking Machines Lab开放Tinker平台:集成万亿参数Kimi K2与Qwen3-VL多模态模型 由前OpenAI CTO Mira Murati创立的Thinking Machines Lab正式开放Tinker AI平台,集成万亿参数Kimi K2推理模型与Qwen3-VL视觉语言模型,支持多... AI产品动态# AI平台# MiraMurati# OpenAI 4天前
谷歌发布AI浏览器Disco:用Gemini 3将网页变成智能应用 谷歌推出基于Gemini 3 Pro的Disco实验浏览器,可将任意网页动态重构为定制化Web应用,支持价格追踪、内容摘要等功能。了解Gemini 3的1501 Elo评分、多模态处理能力及浏览器技术... AI产品动态# AI浏览器# Disco浏览器# Gemini3 5天前