哈佛大学开源近百万册图书数据集助力全球AI研究发展 | AI训练资源开放 哈佛大学法学院图书馆发布首个AI训练开放数据集“Institutional Books 1.0”,涵盖98.3万本图书,支持245种语言,旨在推动学术资源的开放共享。 AI新闻资讯# AI研究# 哈佛大学# 学术资源 8个月前
阿里通义千问NeurIPS 2025获最佳论文奖,注意力门控机制突破大模型技术瓶颈 阿里巴巴通义千问团队在NeurIPS 2025获最佳论文奖,研究成果揭示注意力门控机制可提升大模型性能,仅增加1%参数即降低困惑度0.2,已在Qwen3-Next模型应用并开源。 AI新闻资讯# AI研究# NeurIPS# 人工智能 2个月前
苹果将携八篇前沿论文亮相ICCV 2025,多模态模型与视频生成技术成焦点 深度解析苹果在ICCV 2025大会发布的八篇前沿论文,涵盖MM-Spatial三维空间应用、STIV视频生成等突破性技术,揭秘这些研究如何推动AR设备和iPhone创作功能的未来发展。 AI新闻资讯# AI研究# AppleVisionPro# ICCV2025 4个月前
OpenAI前CTO团队发布《模块流形》研究,大模型训练效率提升40% OpenAI前CTO团队发布《模块流形》研究成果,提出通过流形约束优化神经网络训练的新方法,实现大模型训练效率提升40%,为解决Transformer权重矩阵高维失控问题提供创新方案。 AI新闻资讯# AI研究# OpenAI# Transformer架构 4个月前
斯坦福联合团队发布ACE技术:动态优化上下文输入,大模型性能提升17.1% 斯坦福大学联合团队发布革命性ACE技术,通过动态优化上下文输入实现大语言模型性能显著提升,在AppWorld基准上性能提升17.1%,金融推理准确率提高8.6%,适应延迟降低86.9%,为企业AI部署... AI新闻资讯# ACE技术# AI研究# 上下文优化 4个月前
DeepSeek发布mHC架构突破大模型训练稳定性难题,信号放大降至1.6倍 DeepSeek在2026年元旦发布mHC流形约束超连接架构,通过几何约束机制解决大规模模型训练稳定性问题,信号放大倍数从3000倍大幅降至1.6倍,梯度波动减少83%,性能提升2.2%,为大模型研发... AI产品动态# AI研究# DeepSeek# 人工智能 4周前