阿里开源通义千问AI编程大模型Qwen3-Coder,性能对标国际顶尖水平 阿里巴巴开源通义千问Qwen3-Coder AI编程大模型,采用MoE架构,性能超越GPT-4.1等闭源模型,支持256K上下文窗口,显著提升编程效率,免费获取使用。 AI产品动态# AI编程# Qwen3-Coder# 开源模型 2周前
Meta开源AU-Net架构:突破语言模型分词限制,实现多尺度学习 深度解析Meta最新开源的AU-Net语言模型架构:采用自回归U-Net技术实现原始字节级学习,在DCLM数据集测试中准确率达73.7%,显著提升多语言处理与复杂文本理解能力,为AI语言技术发展带来全... AI新闻资讯# AI技术# AU-Net架构# Meta 3周前
英伟达CEO盛赞DeepSeek-R1模型:中国AI技术的全球突破与开源革命 英伟达CEO黄仁勋公开称赞中国DeepSeek-R1模型的技术突破与开源价值,该模型通过混合专家架构和思维链技术实现高效推理,正在重塑全球AI产业生态。 AI新闻资讯# AI推理# DeepSeek# 人工智能 3周前
通义千问Qwen3-235B-A22B重大升级:国产大模型技术路线变革,全面超越主流AI模型 阿里巴巴通义千问发布革命性Qwen3-235B-A22B升级版本,在GQPA、AIME25等七大基准测试中全面领先,采用分离训练架构实现2350亿参数规模,支持256K上下文窗口,现已在ModelSc... AI产品动态# AI技术# 人工智能# 大语言模型 3周前
香港城大与华为联合开源低成本视频生成模型Pusa V1.0,训练成本仅500美元 香港城市大学与华为联合发布的Pusa V1.0视频生成模型以500美元超低训练成本实现行业突破,创新VTA机制解决运动失真问题,支持文生视频/图生视频等八类任务,代码及数据集已全面开源。 AI产品动态# AI# VTA机制# 低成本训练 3周前
新一代开源数学定理证明模型Goedel-Prover-V2发布,性能超越前代SOTA 普林斯顿大学牵头研发的Goedel-Prover-V2开源数学定理证明模型在多个基准测试中超越前代SOTA,32B参数版本性能提升显著,为数学教育及科研验证提供新工具。 AI新闻资讯# AI# Goedel-Prover-V2# 开源模型 3周前
Mistral推出开源音频模型Voxtral:企业级语音处理新选择 欧洲AI公司Mistral推出开源音频模型Voxtral系列,支持8种语言转录与语义分析,提供低成本企业级语音处理解决方案,适用于医疗、工业等多个垂直领域。 AI产品动态# AI# Mistral# Voxtral 4周前
月之暗面Kimi K2万亿参数模型引爆AI行业,多家科技巨头争相接入 深度解读月之暗面Kimi K2万亿参数AI模型的技术突破:MoE架构、128K长文本处理及开源策略如何重塑行业格局,同步分析英伟达访华背后的AI芯片协同趋势。 AI新闻资讯# AI芯片# KimiK2# MoE架构 4周前
MiniMax完成近3亿美元融资,估值超40亿美元,加速大模型与AI应用布局 国内大模型头部企业MiniMax完成近3亿美元融资,估值突破40亿美元,获上海国资及上市公司注资。其AI应用Talkie全球下载量超千万,并发布开源推理模型M1及视频生成技术,加速AI商业化进程。 AI新闻资讯# AI融资# MiniMax# 人工智能 4周前
Perplexity采用月之暗面Kimi K2大模型优化AI搜索性能 Perplexity宣布采用月之暗面Kimi K2大模型优化AI搜索性能。K2模型在复杂任务和代码生成方面表现卓越,为AI搜索领域提供强大技术支持。了解最新AI技术动态。 AI产品动态# AI# AI搜索# KimiK2 4周前