蚂蚁百灵开源Ring-mini-2.0:轻量级AI推理模型,16B参数激活1.4B实现高效性能 蚂蚁百灵开源Ring-mini-2.0 AI推理模型,采用高效MoE设计,仅激活1.4B参数实现强大推理性能,支持128K长文本处理,吞吐量超500 token/s,助力企业降低AI应用成本。 AI产品动态# AI优化# AI开源# MoE架构 3天前
BentoML发布llm-optimizer开源框架:一键自动化优化大型语言模型性能 BentoML最新发布llm-optimizer开源框架,专为大型语言模型提供自动化基准测试与性能优化解决方案。支持多推理引擎和硬件配置,可将调优时间从数天缩短至数小时,助力开发者快速部署高性能LLM... AI产品动态# AI优化# AI部署# BentoML 3天前
Meta REFRAG框架突破:LLM长上下文处理效率提升16倍,推理速度与精度兼得 探索Meta REFRAG框架如何通过创新解码流程将LLM长上下文处理效率提升16倍,首token生成加速30.8倍的同时保持精度。了解这项AI技术突破在数学推理、多轮对话等场景的应用优势与开源实现。 AI新闻资讯# AI优化# Meta研究院# RAG技术 2周前
iOS 26 Beta 4重新启用智能通知摘要功能,AI优化新闻娱乐通知管理 苹果iOS 26 Beta 4重新启用智能通知摘要功能,通过AI技术优化新闻和娱乐类应用的通知管理,提供简洁摘要并标注AI生成内容,提升用户体验。 AI产品动态# AI优化# iOS26# 新闻娱乐 2个月前