OpenAI开源Circuit-Sparsity模型:400M参数轻量级方案,突破AI黑箱可解释性难题 OpenAI于2025年开源Circuit-Sparsity模型,以400M参数通过结构化稀疏技术提升AI可解释性,支持PyTorch/TensorFlow框架,提供可视化工具CircuitExpla... AI新闻资讯# AI可解释性# Circuit-Sparsity模型# OpenAI 4个月前
阿里国际开源多模态大模型Ovis2.5:视觉推理突破,中小企业AI应用门槛大降 阿里国际发布并开源多模态大模型Ovis2.5,9B与2B版本在OpenCompass评测领先,支持动态分辨率与跨模态推理。适用于电商、翻译及终端设备,助力企业低成本AI转型,技术全面开源。 AI产品动态# Ovis2.5# 人工智能技术# 多模态大模型 8个月前
百度智能云开源Qianfan-VL多模态大模型,3B/8B/70B三版本覆盖全场景需求 百度智能云9月22日开源Qianfan-VL视觉理解大模型系列,提供3B/8B/70B三种参数版本,专为OCR、教育等场景优化,基于昆仑芯P800芯片支撑,现可通过千帆平台免费体验8B和70B模型。 AI产品动态# OCR识别# Qianfan-VL# 千帆平台 7个月前
英伟达发布开源物理AI模型Cosmos Reason,推动机器人自主决策能力革命 英伟达发布革命性开源物理AI模型Cosmos Reason,70亿参数设计实现机器可理解的物理常识编码,推理速度超GPT-4o 11倍。覆盖工业机械臂、人形机器人及自动驾驶三大场景,结合Omniver... AI产品动态# AI模型# CosmosReason# SIGGRAPH 8个月前
DeepSeek推出V3.2-Exp实验模型:自研DSA稀疏注意力机制大幅提升长文本处理效率 DeepSeek推出实验性V3.2-Exp模型,采用自研DSA稀疏注意力机制显著提升长文本训练推理效率,API调用成本降低超50%,支持160K长上下文,已在HuggingFace等平台开源。 AI产品动态# AI模型# API降价# DeepSeek 7个月前
面壁智能发布VoxCPM 0.5B语音生成模型:支持中英双语与实时流式输出,开源可商用 面壁智能发布VoxCPM 0.5B参数语音生成基座模型,支持中英双语流式输出与高精度音色克隆,在自然度和韵律表现达SOTA水平。模型已开源,适用于智能语音交互与数字内容创作。 AI产品动态# TTS技术# VoxCPM# 人工智能 7个月前
DeepSeek-V3.1-Terminus正式发布:语言一致性大幅提升,智能体能力全面优化 深度求索DeepSeek-V3.1-Terminus正式发布,解决中英文混杂问题,智能体性能提升36.5%,支持128K长文本处理,适配UE8M0 FP8国产芯片,开源模型已上线Hugging Fac... AI产品动态# AI大模型# DeepSeek# 人工智能 7个月前
Mistral AI发布企业级平台Mistral Medium 3.1:多模态性能超越GPT-4o,成本降低80% 深度解析Mistral Medium 3.1模型在MT-Bench 8.6分、32K上下文长度及80+编程语言支持方面的技术优势,揭示其相比GPT-4o降低80%企业成本的部署方案与微软Azure生态... AI产品动态# Azure云服务# GPT-4o# MistralAI 7个月前
微软开源rStar2-Agent数学推理模型:140亿参数超越6710亿大模型,主动式强化学习突破 微软研究院开源rStar2-Agent数学推理模型,仅140亿参数超越6710亿参数大模型。基于主动式强化学习架构,实现高效训练和卓越泛化能力,降低计算成本,推动AI推理技术发展。 AI产品动态# AI模型# 主动式强化学习# 小参数模型 7个月前
DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型 DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。 AI产品动态# DeepSeek# 人工智能# 大语言模型 7个月前