字节跳动联合全球顶尖高校发布FutureX动态评测基准,AI未来预测能力评估迎来突破 字节跳动与斯坦福大学等全球顶尖团队联合推出FutureX动态评测基准,专为大语言模型智能体的未来预测能力设计,提供实时、多样化的评估框架。覆盖金融、体育等多领域,测试显示Grok-4表现最优,推动AI... AI新闻资讯# AI评测# Gemini# GPT-4o 3个月前
英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力 英特尔正式发布代号Crescent Island的新一代数据中心GPU,配备160GB内存,基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化,支持风冷服务器,预计2026年交付样品,剑指英伟达... AI产品动态# AI推理# Xe3P架构# 人工智能硬件 2个月前
谷歌AI新框架颠覆科研模式:先打草稿后修正,数小时完成数月工作 谷歌最新AI框架采用先打草稿后迭代的创新方法,通过实时整合arXiv等平台论文,将科研流程压缩至数小时,在单细胞数据分析等任务中准确率提升14%,现已开源供学术界验证使用。 AI新闻资讯# 人工智能框架# 动态知识管道# 大语言模型 2个月前
Meta突破性ExIt方法发布:单步训练实现LLM多步自我改进,性能提升22% Meta超级智能实验室最新ExIt方法实现大语言模型单步多步自我改进,性能提升22%,训练效率提高25%。了解突破性强化学习框架如何降低AI算力门槛,推动自动编程与实时应用商业化部署。 AI新闻资讯# AI商业化# AI训练技术# Meta研究院 3个月前
上海交大发布MAS-GPT突破性成果:单轮生成实现多智能体系统普惠化应用 深度解析上海交通大学MAS-GPT系统技术突破:通过单轮生成机制实现多智能体工作流自动构建,在准确率提升3.89%的同时降低50%计算成本,开源生态MASLab助力金融、医疗等场景快速落地。 AI产品动态# ICML2025# MAS-GPT# 上海交通大学 5个月前
Cognition推出SWE-1.5大模型:推理速度达950令牌/秒,重塑AI编程效率标准 Cognition公司最新推出的SWE-1.5大语言模型在推理速度上实现重大突破,达到每秒950令牌,较行业水平提升40%。该模型优化了长代码序列处理能力,在Python代码补全任务中响应时间缩短53... AI产品动态# AI编程# Cognition# SWE-1.5 1个月前
NewtonBench:港科大与英伟达推出AI科学发现评估新基准,模拟平行宇宙测试大模型推理能力 香港科技大学与英伟达联合研发的NewtonBench基准测试,通过模拟平行宇宙环境动态调整物理参数,系统性评估大语言模型的科学发现能力,解决训练数据泄漏问题,为下一代AI科研系统开发提供新范式。 AI新闻资讯# AI科学发现# NewtonBench# 基准测试 2个月前
GPT-5研发争议升级:DeepMind与OpenAI高管隔空交锋,百倍模型架构或将问世 深度解析GPT-5研发争议:OpenAI否认训练计划,DeepMind质疑认知能力上限,Inflection AI预测百倍模型突破。探讨AI技术路径分歧与行业影响,权威分析大模型未来发展趋势。 AI新闻资讯# AI研发# DeepMind# GPT-5 3个月前
FuriosaAI与LG达成战略合作,挑战英伟达AI芯片霸主地位 FuriosaAI与LG达成战略合作,成为Exaone大语言模型的芯片供应商。这一合作挑战英伟达市场地位,推动本土AI芯片发展,并在性能、能效及成本方面展现优势,可能重塑全球AI芯片竞争格局。 AI新闻资讯# AI芯片# Exaone# FuriosaAI 4个月前
OpenAI前科学家发布nanochat开源项目:8000行代码实现全栈LLM训练,100美元复现ChatGPT级模型 OpenAI前科学家Andrej Karpathy发布nanochat开源项目,通过8000行代码实现大语言模型全栈训练与推理,仅需100美元成本即可复现ChatGPT级模型。了解如何用极简代码降低A... AI产品动态# AI开发# AndrejKarpathy# ChatGPT复现 2个月前