英伟达发布Nemotron 3开源模型系列,革新多智能体AI系统开发 英伟达发布Nemotron 3开源模型系列,包含Nano、Super和Ultra版本,采用混合架构提升AI系统性能,降低60%生成成本。支持百万级上下文窗口,适用于制造业、医疗等领域,助力企业实现高效... AI产品动态# AI优化# Mamba-Transformer# Nemotron3 3天前
Meta发布REFRAG技术:RAG推理效率提升30倍,AI处理速度实现重大突破 Meta超级智能实验室突破性REFRAG技术实现RAG任务推理效率30倍提升,通过轻量级模型压缩上下文,大幅降低计算负载,在金融医疗法律等领域具有广泛应用前景。 AI产品动态# AI优化# MetaAI# RAG技术 2个月前
蚂蚁百灵开源Ring-mini-2.0:轻量级AI推理模型,16B参数激活1.4B实现高效性能 蚂蚁百灵开源Ring-mini-2.0 AI推理模型,采用高效MoE设计,仅激活1.4B参数实现强大推理性能,支持128K长文本处理,吞吐量超500 token/s,助力企业降低AI应用成本。 AI产品动态# AI优化# AI开源# MoE架构 3个月前
BentoML发布llm-optimizer开源框架:一键自动化优化大型语言模型性能 BentoML最新发布llm-optimizer开源框架,专为大型语言模型提供自动化基准测试与性能优化解决方案。支持多推理引擎和硬件配置,可将调优时间从数天缩短至数小时,助力开发者快速部署高性能LLM... AI产品动态# AI优化# AI部署# BentoML 3个月前
Meta REFRAG框架突破:LLM长上下文处理效率提升16倍,推理速度与精度兼得 探索Meta REFRAG框架如何通过创新解码流程将LLM长上下文处理效率提升16倍,首token生成加速30.8倍的同时保持精度。了解这项AI技术突破在数学推理、多轮对话等场景的应用优势与开源实现。 AI新闻资讯# AI优化# Meta研究院# RAG技术 3个月前
iOS 26 Beta 4重新启用智能通知摘要功能,AI优化新闻娱乐通知管理 苹果iOS 26 Beta 4重新启用智能通知摘要功能,通过AI技术优化新闻和娱乐类应用的通知管理,提供简洁摘要并标注AI生成内容,提升用户体验。 AI产品动态# AI优化# iOS26# 新闻娱乐 5个月前