xAI发布Grok 4 Fast:推理速度提升10倍,重塑AI实时交互新标准 xAI于2025年9月发布Grok 4 Fast版本,推理速度较标准版提升10倍,支持256K上下文窗口和多模态输入。了解其技术突破、性能测试及在金融、科研领域的应用前景。 AI产品动态# AI应用# Grok4Fast# xAI 2周前
面壁智能发布MiniCPM 4.1基座模型:稀疏架构突破AI推理效率瓶颈 面壁智能MiniCPM 4.1基座模型采用稀疏化架构,实现8B参数高效推理,兼容Ollama/vLLM等框架,准确率提升18%,显存占用降30%,推动AI终端部署与算力优化解决方案。 AI产品动态# AI推理# MiniCPM# 大模型优化 3周前
百度AI助手极速模型全量上线:生成速度提升5倍,成本降低30% 百度搜索AI助手完成重大技术升级,极速模型全量上线,生成速度提升5倍,调用成本降低30%,首token时间缩短39%。覆盖全部用户,日均处理亿级请求,推动AI普惠化战略落地。 AI产品动态# AI助手# AI普惠化# 国产AI 1个月前
OpenAI革命性MXFP4技术:大模型推理成本直降75%,效率飙升4倍 深度解读OpenAI突破性MXFP4技术:4位浮点格式使AI大模型显存占用减少75%,token生成速度提升4倍,揭秘1200亿参数模型80GB显存运行的黑科技。 AI产品动态# AI技术# MXFP4# OpenAI 2个月前
DeepSeek论文获ACL2025最佳论文奖:原生稀疏注意力技术突破长文本处理瓶颈 DeepSeek联合北大研发的原生稀疏注意力(NSA)获ACL2025最佳论文,该技术实现64k文本11.6倍加速,计算复杂度降至线性,支持百万tokens上下文窗口,将彻底改变法律金融等领域的长文本... AI新闻资讯# ACL2025# AI论文# DeepSeek 2个月前
三所高校与中经传媒智库联合成立人工智能产学研商业协同联盟 三所高校与中经传媒智库联合成立人工智能产学研商业协同联盟,旨在整合资源推动AI技术研发与商业化应用。联盟将聚焦大模型优化、多模态技术开发及国际化合作,加速技术从论文到产品的转化。 AI新闻资讯# 产学研联盟# 人工智能# 商业化应用 3个月前