苹果发布RL4HS技术:强化学习精准定位大模型幻觉片段,AI可靠性迎突破 苹果发布RL4HS突破性AI技术,利用强化学习精准定位大模型幻觉片段,支持片段级错误检测。涵盖技术原理、实验数据及在医疗、法律等领域的应用价值,为LLM可靠性提供全新解决方案。 AI新闻资讯# AI技术# 人工智能可靠性# 大语言模型 4个月前
OpenAI前科学家发布nanochat开源项目:8000行代码实现全栈LLM训练,100美元复现ChatGPT级模型 OpenAI前科学家Andrej Karpathy发布nanochat开源项目,通过8000行代码实现大语言模型全栈训练与推理,仅需100美元成本即可复现ChatGPT级模型。了解如何用极简代码降低A... AI产品动态# AI开发# AndrejKarpathy# ChatGPT复现 4个月前
斯坦福联合团队发布ACE技术:动态优化上下文输入,大模型性能提升17.1% 斯坦福大学联合团队发布革命性ACE技术,通过动态优化上下文输入实现大语言模型性能显著提升,在AppWorld基准上性能提升17.1%,金融推理准确率提高8.6%,适应延迟降低86.9%,为企业AI部署... AI新闻资讯# ACE技术# AI研究# 上下文优化 4个月前
GPT-5 Pro权限全面开放!Perplexity向Max用户推出AI浏览器Comet免费服务 Perplexity公司正式向Max用户开放GPT-5 Pro权限,AI浏览器Comet全球免费使用。GPT-5模型上下文处理达40万词元,输出token减少50%-80%,在编程辅助、视觉推理等领域... AI产品动态# AI浏览器# Comet# GPT-5Pro 4个月前
苹果内部测试Veritas AI助手,为Siri重大升级铺路 苹果内部正在测试代号Veritas的AI助手,采用自研大模型+第三方技术双轨策略,支持长上下文对话与屏幕内容响应。本文详解Siri明年3月重大升级的核心功能及对AI竞争格局的影响。 AI新闻资讯# AI竞争# ChatGPT# Siri升级 4个月前
谷歌AI新框架颠覆科研模式:先打草稿后修正,数小时完成数月工作 谷歌最新AI框架采用先打草稿后迭代的创新方法,通过实时整合arXiv等平台论文,将科研流程压缩至数小时,在单细胞数据分析等任务中准确率提升14%,现已开源供学术界验证使用。 AI新闻资讯# 人工智能框架# 动态知识管道# 大语言模型 4个月前
美团发布LongCat-Flash-Thinking大模型:国内首款双轨推理AI,数学代码能力全面升级 美团发布国内首款兼具深度思考与工具调用的双轨推理大模型LongCat-Flash-Thinking。详解其领域并行强化学习架构、万卡集群DORA系统性能,以及在ARC-AGI基准测试中超越国际闭源模型... AI产品动态# AI推理模型# LongCat-Flash-Thinking# 代码生成 4个月前
DeepSeek-R1登《自然》封面:全球首个获同行评审认证的开源大模型 DeepSeek-R1成为全球首个登上《自然》封面的主流大语言模型,通过纯强化学习框架降低算力消耗与数据依赖,技术细节经同行评审认证,推动AI研发开源化发展。 AI产品动态# DeepSeek# 人工智能# 大语言模型 5个月前
GPT-5研发争议升级:DeepMind与OpenAI高管隔空交锋,百倍模型架构或将问世 深度解析GPT-5研发争议:OpenAI否认训练计划,DeepMind质疑认知能力上限,Inflection AI预测百倍模型突破。探讨AI技术路径分歧与行业影响,权威分析大模型未来发展趋势。 AI新闻资讯# AI研发# DeepMind# GPT-5 5个月前
AI幻觉危机:ChatGPT集体误判海马emoji事件揭示技术缺陷 针对AI模型集体误判海马emoji事件的技术解读,揭示ChatGPT等系统产生幻觉的激励机制缺陷,分析GPT-5时代AI认知偏差解决方案及3-5年技术演进路径 AI新闻资讯# AI幻觉# ChatGPT# emoji编码 5个月前