港科大等开源Robust-R1多模态大模型:创新“退化感知推理”技术,解决真实场景视觉退化难题 香港科技大学与西北工业大学研究团队开源Robust-R1多模态大模型,创新提出“退化感知推理”技术,有效解决图像模糊、噪声、遮挡等真实场景退化问题,在ImageNet-C等基准测试中鲁棒性提升47... AI新闻资讯# AI鲁棒性# Robust-R1# 医疗影像分析 1个月前
腾讯优图开源Youtu-Embedding文本表示模型,20亿参数登顶CMTEB评测榜首 腾讯优图实验室开源Youtu-Embedding通用文本表示模型,20亿参数专为企业级NLP场景设计。该模型在CMTEB评测中以77.46分夺冠,支持文本检索、语义相似度计算等核心任务,提供完整的模型... AI产品动态# RAG系统# Youtu-Embedding# 开源AI模型 4个月前
小红书发布FireRedTTS-2:新一代多语言对话合成模型,实现零样本声音克隆与实时流式生成 小红书FireRedTTS-2模型突破语音合成技术瓶颈,支持实时流式多语言对话生成与单句声音克隆,自然度媲美真实录音。开源代码覆盖中英日韩法等语言,适用于语音识别和交互数据构建。 AI产品动态# AI语音合成# FireRedTTS-2# 声音克隆 5个月前
OpenAI无限期推迟开源AI模型发布,安全测试成首要任务 OpenAI宣布无限期推迟首个开源权重AI模型的发布,以进行更深入的安全测试和风险审查。首席执行官山姆·奥尔特曼强调安全性和可靠性是首要任务,尽管模型性能已达标。了解OpenAI的最新动态及其对AI安... AI新闻资讯# AI安全# AI风险审查# OpenAI 7个月前
英伟达联合顶尖学府推出NitroGen开源模型,AI通过游戏视频实时生成操作信号实现动作控制突破 英伟达与斯坦福大学、加州理工学院等顶尖研究机构推出NitroGen开源基础模型,通过分析游戏视频帧实时生成手柄操作信号,在AI动作控制领域实现重大突破。模型基于GROOT N1.5架构,训练超4万小时... AI产品动态# GROOT架构# NitroGen# 人工智能研究 1个月前
英伟达发布Nemotron 3开源模型系列,革新多智能体AI系统开发 英伟达发布Nemotron 3开源模型系列,包含Nano、Super和Ultra版本,采用混合架构提升AI系统性能,降低60%生成成本。支持百万级上下文窗口,适用于制造业、医疗等领域,助力企业实现高效... AI产品动态# AI优化# Mamba-Transformer# Nemotron3 2个月前
DeepSeekMath-V2发布:首个IMO金牌水平开源数学推理模型,自验证框架突破技术瓶颈 DeepSeekMath-V2成为首个达到国际数学奥林匹克竞赛金牌水平的开源AI模型,采用创新的自验证训练框架,在IMO、CMO等顶级数学竞赛中表现卓越。该技术突破将推动金融、航空等领域的自动化验证发... AI产品动态# AI数学推理# DeepSeekMath-V2# 人工智能突破 2个月前
Mistral AI发布新一代Mistral 3系列开源模型,挑战科技巨头推动企业级AI应用 法国AI初创公司Mistral AI发布新一代Mistral 3系列开源模型,包含密集模型与旗舰Mistral Large 3。该系列基于Apache 2.0协议开源,采用细粒度混合专家架构,支持多模... AI产品动态# AI初创公司# MistralAI# 人工智能 2个月前
英伟达推出Nemotron 3开源AI模型系列,以MoE与Mamba-Transformer混合架构提升多智能体协作效率 英伟达推出Nemotron 3开源AI模型系列,涵盖Nano、Super和Ultra规格,采用混合潜在专家(MoE)与Mamba-Transformer混合架构,提升多智能体跨行业协作效率。该系列支持... AI产品动态# AI基础设施# Mamba-Transformer# MoE架构 2个月前
美团开源LongCat-Video视频生成模型:统一架构实现文生视频、图生视频与视频续写 美团发布开源视频生成模型LongCat-Video,基于Diffusion Transformer架构统一实现文生视频、图生视频和视频续写三大功能,支持720p高清5分钟长视频生成,推理速度提升10... AI产品动态# AI视频生成# DiT架构# 图生视频 3个月前