清华大学联合团队突破搜索智能体训练瓶颈:自搜索强化学习(SSRL)实现高效Sim2Real迁移 清华大学与上海AI实验室联合发布自搜索强化学习(SSRL)技术,解决搜索智能体训练成本高与模拟环境差距问题,实现LLM知识高效提取与真实场景迁移,代码已开源。 AI新闻资讯# Sim2Real# 人工智能# 大语言模型 3周前
德国TNG发布DeepSeek-TNG R1T2 Chimera大模型,性能提升200% 德国TNG公司发布升级版大语言模型DeepSeek-TNG R1T2 Chimera,性能提升200%,采用创新集合专家方法优化效率,模型已在Hugging Face平台开源。 AI产品动态# AI# DeepSeek# TNG 3个月前
DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型 DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。 AI产品动态# DeepSeek# 人工智能# 大语言模型 1周前
DeepL推出企业级AI智能体,正式进军通用人工智能市场挑战科技巨头 深度解析DeepL企业级AI智能体的技术架构与市场定位:基于自研大语言模型的混合系统,专注企业跨系统数据迁移和多部门自动化任务处理,挑战微软Copilot和Anthropic Claude的市场地位... AI产品动态# AI智能体# DeepL# 人工智能 3周前
微软发布自研AI模型MAI-Voice-1与MAI-1-preview,构建独立技术体系 微软2025年发布自研语音模型MAI-Voice-1与大语言模型MAI-1-preview,实现40种语体风格与实时音频生成,采用MoE架构降低对OpenAI依赖,推动AI技术自主化与行业格局变革。 AI产品动态# AI技术突破# OpenAI竞争# 大语言模型 4周前
360智脑发布Light-IF系列AI模型,突破复杂指令遵循性能瓶颈 360智脑发布革命性Light-IF系列AI模型,采用创新框架解决大语言模型指令遵循难题。全系模型32B至1.7B参数规格即将开源,性能超越同类产品,提供完整技术路线图与评估工具,推动AI行业发展。 AI产品动态# 360智脑# AI# Light-IF 1个月前
腾讯推出智能问答框架WeKnora,助力企业级文档问答场景 腾讯推出智能问答框架WeKnora,集成OCR与跨模态建模技术,支持多模态文档解析与语义检索。提供私有化部署方案,适用于金融、法律等高敏感场景,助力企业知识管理智能化。 AI产品动态# WeKnora# 企业级应用# 大语言模型 2个月前
硅基流动发布DeepSeek-V3.1大模型:混合推理架构与160K上下文窗口实现突破 硅基流动DeepSeek-V3.1大模型正式上线:6710亿参数、160K超长上下文支持,混合推理架构显著提升效率,在SWE编程基准和复杂推理任务中突破性能纪录,API服务性价比领先。 AI产品动态# AI技术# DeepSeek-V3.1# 人工智能 1个月前
谷歌发布Gemini 2.5 Flash-Lite模型:速度提升1.5倍,成本效益显著 谷歌推出Gemini 2.5 Flash-Lite模型,速度提升1.5倍,延迟最低200毫秒,成本效益显著,适合高吞吐量应用场景。 AI产品动态# AI模型# Gemini2.5Flash-Lite# 人工智能 3个月前
苹果突破性MTP技术:大语言模型响应速度提升5倍 苹果最新MTP技术通过并行token预测使大语言模型响应速度提升5倍,采用动态验证机制保障输出质量,为移动端AI交互提供突破性解决方案。 AI新闻资讯# AI加速# MTP技术# 大语言模型 2个月前