大语言模型

苹果发布RL4HS技术：强化学习精准定位大模型幻觉片段，AI可靠性迎突破

苹果发布RL4HS突破性AI技术，利用强化学习精准定位大模型幻觉片段，支持片段级错误检测。涵盖技术原理、实验数据及在医疗、法律等领域的应用价值，为LLM可靠性提供全新解决方案。

6个月前

OpenAI前科学家发布nanochat开源项目：8000行代码实现全栈LLM训练，100美元复现ChatGPT级模型

OpenAI前科学家Andrej Karpathy发布nanochat开源项目，通过8000行代码实现大语言模型全栈训练与推理，仅需100美元成本即可复现ChatGPT级模型。了解如何用极简代码降低A...

AI产品动态 # AI开发 # AndrejKarpathy # ChatGPT复现

6个月前

斯坦福联合团队发布ACE技术：动态优化上下文输入，大模型性能提升17.1%

斯坦福大学联合团队发布革命性ACE技术，通过动态优化上下文输入实现大语言模型性能显著提升，在AppWorld基准上性能提升17.1%，金融推理准确率提高8.6%，适应延迟降低86.9%，为企业AI部署...

AI新闻资讯 # ACE技术 # AI研究 # 上下文优化

6个月前

GPT-5 Pro权限全面开放！Perplexity向Max用户推出AI浏览器Comet免费服务

Perplexity公司正式向Max用户开放GPT-5 Pro权限，AI浏览器Comet全球免费使用。GPT-5模型上下文处理达40万词元，输出token减少50%-80%，在编程辅助、视觉推理等领域...

AI产品动态 # AI浏览器 # Comet # GPT-5Pro

6个月前

苹果内部测试Veritas AI助手，为Siri重大升级铺路

苹果内部正在测试代号Veritas的AI助手，采用自研大模型+第三方技术双轨策略，支持长上下文对话与屏幕内容响应。本文详解Siri明年3月重大升级的核心功能及对AI竞争格局的影响。

AI新闻资讯 # AI竞争 # ChatGPT # Siri升级

7个月前

谷歌AI新框架颠覆科研模式：先打草稿后修正，数小时完成数月工作

谷歌最新AI框架采用先打草稿后迭代的创新方法，通过实时整合arXiv等平台论文，将科研流程压缩至数小时，在单细胞数据分析等任务中准确率提升14%，现已开源供学术界验证使用。

AI新闻资讯 # 人工智能框架 # 动态知识管道 # 大语言模型

7个月前

美团发布LongCat-Flash-Thinking大模型：国内首款双轨推理AI，数学代码能力全面升级

美团发布国内首款兼具深度思考与工具调用的双轨推理大模型LongCat-Flash-Thinking。详解其领域并行强化学习架构、万卡集群DORA系统性能，以及在ARC-AGI基准测试中超越国际闭源模型...

AI产品动态 # AI推理模型 # LongCat-Flash-Thinking # 代码生成

7个月前

DeepSeek-R1登《自然》封面：全球首个获同行评审认证的开源大模型

DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型，通过纯强化学习框架降低算力消耗与数据依赖，技术细节经同行评审认证，推动AI研发开源化发展。

AI产品动态 # DeepSeek # 人工智能 # 大语言模型

7个月前

GPT-5研发争议升级：DeepMind与OpenAI高管隔空交锋，百倍模型架构或将问世

深度解析GPT-5研发争议：OpenAI否认训练计划，DeepMind质疑认知能力上限，Inflection AI预测百倍模型突破。探讨AI技术路径分歧与行业影响，权威分析大模型未来发展趋势。

AI新闻资讯 # AI研发 # DeepMind # GPT-5

7个月前

AI幻觉危机：ChatGPT集体误判海马emoji事件揭示技术缺陷

针对AI模型集体误判海马emoji事件的技术解读，揭示ChatGPT等系统产生幻觉的激励机制缺陷，分析GPT-5时代AI认知偏差解决方案及3-5年技术演进路径

AI新闻资讯 # AI幻觉 # ChatGPT # emoji编码

7个月前

苹果发布RL4HS技术：强化学习精准定位大模型幻觉片段，AI可靠性迎突破

OpenAI前科学家发布nanochat开源项目：8000行代码实现全栈LLM训练，100美元复现ChatGPT级模型

斯坦福联合团队发布ACE技术：动态优化上下文输入，大模型性能提升17.1%

GPT-5 Pro权限全面开放！Perplexity向Max用户推出AI浏览器Comet免费服务

苹果内部测试Veritas AI助手，为Siri重大升级铺路

谷歌AI新框架颠覆科研模式：先打草稿后修正，数小时完成数月工作

美团发布LongCat-Flash-Thinking大模型：国内首款双轨推理AI，数学代码能力全面升级

DeepSeek-R1登《自然》封面：全球首个获同行评审认证的开源大模型

GPT-5研发争议升级：DeepMind与OpenAI高管隔空交锋，百倍模型架构或将问世

AI幻觉危机：ChatGPT集体误判海马emoji事件揭示技术缺陷

热门AI工具

最新资讯