蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,推理速度提升10.7倍 蚂蚁集团开源业界首个高性能扩散语言模型推理框架dInfer,实现10.7倍推理速度提升,支持LLaDA等主流dLLM,在HumanEval代码生成任务中达1011 tokens/秒,推动AI推理效率新... AI产品动态# AI开源# dInfer# 人工智能技术 3周前
腾讯混元再推四款轻量化开源模型,边缘计算与消费级硬件迎来AI普惠新突破 腾讯混元发布四款轻量化开源大模型,覆盖0.5B-7B参数规模,支持消费级硬件与边缘计算场景,具备256K长文本处理与多Agent决策能力,已应用于腾讯会议、智能座舱等产品,推动AI技术低成本普惠化落地... AI产品动态# AI开源# 多Agent框架# 大模型应用 2个月前
Pokee AI开源7B深度研究代理,模块化架构助力科研效率突破 Pokee AI正式开源PokeeResearch-7B深度研究代理,采用MoE架构支持多领域科研任务分解,提供标准化API接口,单张A100即可实现高效科研推理,助力中小团队专业级研究。 AI产品动态# AI开源# API接口# PokeeResearch-7B 2周前
Dexmal开源VLA代码库Dexbotic:统一框架解决具身智能碎片化难题 Dexmal原力灵机开源Dexbotic VLA代码库,提供标准化模块化开发框架,解决具身智能领域碎片化问题,支持多算法快速复现与性能优化,助力AI研究者提升研发效率。 AI产品动态# AI开源# Dexbotic# VLA框架 2周前
美团开源5600亿参数多模态大模型LongCat-Flash-Omni,实现全模态实时交互突破 美团发布开源多模态大模型LongCat-Flash-Omni,具备5600亿参数并集成多模态感知能力,支持离线理解与实时音视频交互,已在电商直播、远程协作等领域实现商业化应用,助力降低多模态AI开发门... AI产品动态# AI开源# LongCat-Flash-Omni# 人工智能 2天前
月之暗面开源Kimi Linear混合注意力架构:KV缓存降75%,解码吞吐量提升6倍 月之暗面开源Kimi Linear混合注意力架构,通过KDA模块实现KV缓存降低75%、解码吞吐量提升6倍,在1M tokens长上下文任务中性能提升6.3倍,现已集成至阿里云PAI平台,加速AI在智... AI产品动态# AI开源# AI架构# KimiLinear 2天前