xAI发布Grok 4.1大语言模型:情商测试刷新纪录,24小时登顶LMArena排行榜 2025年11月xAI发布Grok 4.1大语言模型,24小时内登顶LMArena文本能力排行榜,情商测试达1586分刷新纪录,事实性错误率降低65%,支持128K上下文,全球免费开放使用。 AI产品动态# Grok4.1# LMArena排行榜# xAI 3个月前
Moonshot AI开源Kosong框架:Python智能体开发迎来革命性突破 深度解析Moonshot AI开源的Kosong框架:支持多模型自由切换的Python智能体开发工具,具备插件化设计和标准化工具集成,5分钟快速部署体验,助力开发者高效构建AI应用。 AI产品动态# AI开发框架# Kosong# MoonshotAI 3个月前
Majestic Labs获1亿美元融资,推出128TB内存AI服务器突破大语言模型算力瓶颈 Majestic Labs完成1亿美元A轮融资,推出专为大语言模型设计的高容量AI服务器,单设备支持128TB内存,采用定制加速器芯片和HBM技术,有效解决AI算力部署痛点,预计2027年面向超大规模... AI新闻资讯# AI服务器# AI芯片# AI融资 3个月前
AI初创Inception获5000万美元融资,扩散模型Mercury代码生成速度提升20倍 AI初创公司Inception完成5000万美元种子轮融资,其新型扩散模型Mercury在代码生成任务中实现每秒超1000标记处理速度,较传统模型提升20倍,为AI商业化提供高效解决方案。 AI新闻资讯# AI初创# Inception# 代码生成 3个月前
阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代 阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX,支持自然语言指令编辑,30亿参数实现高性能低门槛部署,在方言表现力和情感传递准确率方面领先行业,推动... AI产品动态# AI语音技术# Step-Audio-EditX# 大语言模型 3个月前
通义千问Qwen3-Max上线深度思考功能,AI推理能力实现重大突破 阿里巴巴通义千问Qwen3-Max旗舰模型正式上线深度思考功能,具备万亿参数规模,在复杂推理任务中实现100%准确率。该功能强化多步骤问题拆解能力,为科研、金融、软件开发等领域带来效率提升。 AI产品动态# AI模型# Qwen3-Max# 人工智能 3个月前
Cognition推出SWE-1.5大模型:推理速度达950令牌/秒,重塑AI编程效率标准 Cognition公司最新推出的SWE-1.5大语言模型在推理速度上实现重大突破,达到每秒950令牌,较行业水平提升40%。该模型优化了长代码序列处理能力,在Python代码补全任务中响应时间缩短53... AI产品动态# AI编程# Cognition# SWE-1.5 3个月前
全球首个视频转网页评测基准IWR-Bench发布,GPT-5综合得分仅36.35分暴露AI交互逻辑短板 上海AI实验室与浙江大学发布全球首个视频转网页评测基准IWR-Bench,系统性评估28款主流AI模型动态网页生成能力。研究显示GPT-5交互功能得分仅24.39%,深度解析五大技术瓶颈与行业应用前景... AI新闻资讯# 人工智能# 人机交互# 前端开发 3个月前
NewtonBench:港科大与英伟达推出AI科学发现评估新基准,模拟平行宇宙测试大模型推理能力 香港科技大学与英伟达联合研发的NewtonBench基准测试,通过模拟平行宇宙环境动态调整物理参数,系统性评估大语言模型的科学发现能力,解决训练数据泄漏问题,为下一代AI科研系统开发提供新范式。 AI新闻资讯# AI科学发现# NewtonBench# 基准测试 4个月前
英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力 英特尔正式发布代号Crescent Island的新一代数据中心GPU,配备160GB内存,基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化,支持风冷服务器,预计2026年交付样品,剑指英伟达... AI产品动态# AI推理# Xe3P架构# 人工智能硬件 4个月前