DeepSeek公开大模型训练技术细节:预训练与优化训练双阶段突破,能耗降低30% DeepSeek公司公开大模型训练技术细节,涵盖预训练与优化训练双阶段,采用MoE架构和FP8混合精度,降低能耗30%,在数学推理和代码生成任务中表现突出,为AI行业提供技术参考与工程实践样本。 AI新闻资讯# AI技术# DeepSeek# MoE架构 5个月前
腾讯云CodeBuddy IDE国内版公测启动:AI全栈开发平台助力效率飞跃 腾讯云正式启动CodeBuddy IDE国内公测,集成自研混元与DeepSeek模型,支持自然语言生成代码、Plan任务拆解及微信小程序开发,代码准确率提升15%,助力开发者高效完成全栈工程任务。 AI产品动态# AI编程# CodeBuddyIDE# DeepSeek 5个月前
DeepSeek论文获ACL2025最佳论文奖:原生稀疏注意力技术突破长文本处理瓶颈 DeepSeek联合北大研发的原生稀疏注意力(NSA)获ACL2025最佳论文,该技术实现64k文本11.6倍加速,计算复杂度降至线性,支持百万tokens上下文窗口,将彻底改变法律金融等领域的长文本... AI新闻资讯# ACL2025# AI论文# DeepSeek 6个月前
DeepSeek-V3.1重磅升级:128K上下文窗口震撼发布,长文本处理能力翻倍 DeepSeek-V3.1实现重大技术突破:上下文窗口扩展至128K,多步推理性能提升43%,幻觉概率降低38%。专为长文档分析、代码库理解和复杂计算场景优化,为企业级AI应用提供领先解决方案。 AI产品动态# AI模型升级# DeepSeek# MoE架构 6个月前
特斯拉Model Y L接入豆包与DeepSeek AI大模型,智能座舱语音交互全面升级 特斯拉Model Y L全新接入豆包与DeepSeek双AI大模型,通过火山引擎实现中文语音交互升级,提升响应速度40%,支持车辆控制、闲聊服务与多场景指令识别,彻底解决方言识别与连续对话痛点。 AI产品动态# AI大模型# DeepSeek# 新能源汽车 5个月前
DeepSeek否认R2大模型8月发布传闻,AI概念股异动背后现隐忧 深度解析DeepSeek否认R2大模型发布传闻事件,涵盖市场反应、技术瓶颈及行业竞争态势,揭示国产AI发展现状与挑战。 AI新闻资讯# AI大模型# DeepSeek# 人工智能 6个月前
智谱AI即将发布GLM-4.6大模型:上下文能力大幅提升,已开放部分测试 智谱AI即将发布新一代GLM-4.6大模型,提供更广泛上下文支持能力,目前已向部分用户开放API测试。了解GLM-4.6技术特点、与GLM-4.5对比及行业竞争态势,获取最新AI模型发展动态。 AI产品动态# AI技术# DeepSeek# GLM-4.6 4个月前
2025全球AI百强榜发布:中国企业32款产品入围,豆包、DeepSeek表现亮眼 a16z发布2025全球消费级AI百强榜:ChatGPT双榜第一,中国32款产品上榜。豆包网页/移动双榜前12,DeepSeek网页全球第三。分析AI生态分化与中国企业商业化挑战。 AI新闻资讯# a16z# AI商业化# AI榜单 5个月前
2025年6月国内AI应用市场竞争格局分析:垂直领域深耕与新兴工具崛起 深度解析2025年6月国内AI应用市场竞争格局,涵盖技术类工具、办公场景、C端娱乐化应用的最新动态。了解DeepSeek、Kimi、夸克AI等头部产品的市场表现及新兴工具的崛起趋势。 AI新闻资讯# AI应用# DeepSeek# Kimi 7个月前
DeepSeek App 1.3.0版本更新:一键生成AI对话分享图,助力社交传播 深度求索发布DeepSeek App 1.3.0版本,新增对话内容生成分享图功能,实现AI对话内容一键可视化分享至社交平台,适用于多领域场景,提升AIGC社交传播效率。 AI产品动态# AI# AIGC# DeepSeek 6个月前