大语言模型

xAI发布Grok 4.1大语言模型：情商测试刷新纪录，24小时登顶LMArena排行榜

2025年11月xAI发布Grok 4.1大语言模型，24小时内登顶LMArena文本能力排行榜，情商测试达1586分刷新纪录，事实性错误率降低65%，支持128K上下文，全球免费开放使用。

6个月前

Moonshot AI开源Kosong框架：Python智能体开发迎来革命性突破

深度解析Moonshot AI开源的Kosong框架：支持多模型自由切换的Python智能体开发工具，具备插件化设计和标准化工具集成，5分钟快速部署体验，助力开发者高效构建AI应用。

AI产品动态 # AI开发框架 # Kosong # MoonshotAI

7个月前

Majestic Labs获1亿美元融资，推出128TB内存AI服务器突破大语言模型算力瓶颈

Majestic Labs完成1亿美元A轮融资，推出专为大语言模型设计的高容量AI服务器，单设备支持128TB内存，采用定制加速器芯片和HBM技术，有效解决AI算力部署痛点，预计2027年面向超大规模...

AI新闻资讯 # AI服务器 # AI芯片 # AI融资

7个月前

AI初创Inception获5000万美元融资，扩散模型Mercury代码生成速度提升20倍

AI初创公司Inception完成5000万美元种子轮融资，其新型扩散模型Mercury在代码生成任务中实现每秒超1000标记处理速度，较传统模型提升20倍，为AI商业化提供高效解决方案。

AI新闻资讯 # AI初创 # Inception # 代码生成

7个月前

阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX，语音编辑进入自然语言指令时代

阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX，支持自然语言指令编辑，30亿参数实现高性能低门槛部署，在方言表现力和情感传递准确率方面领先行业，推动...

AI产品动态 # AI语音技术 # Step-Audio-EditX # 大语言模型

7个月前

通义千问Qwen3-Max上线深度思考功能，AI推理能力实现重大突破

阿里巴巴通义千问Qwen3-Max旗舰模型正式上线深度思考功能，具备万亿参数规模，在复杂推理任务中实现100%准确率。该功能强化多步骤问题拆解能力，为科研、金融、软件开发等领域带来效率提升。

AI产品动态 # AI模型 # Qwen3-Max # 人工智能

7个月前

Cognition推出SWE-1.5大模型：推理速度达950令牌/秒，重塑AI编程效率标准

Cognition公司最新推出的SWE-1.5大语言模型在推理速度上实现重大突破，达到每秒950令牌，较行业水平提升40%。该模型优化了长代码序列处理能力，在Python代码补全任务中响应时间缩短53...

AI产品动态 # AI编程 # Cognition # SWE-1.5

7个月前

全球首个视频转网页评测基准IWR-Bench发布，GPT-5综合得分仅36.35分暴露AI交互逻辑短板

上海AI实验室与浙江大学发布全球首个视频转网页评测基准IWR-Bench，系统性评估28款主流AI模型动态网页生成能力。研究显示GPT-5交互功能得分仅24.39%，深度解析五大技术瓶颈与行业应用前景...

AI新闻资讯 # 人工智能 # 人机交互 # 前端开发

7个月前

NewtonBench：港科大与英伟达推出AI科学发现评估新基准，模拟平行宇宙测试大模型推理能力

香港科技大学与英伟达联合研发的NewtonBench基准测试，通过模拟平行宇宙环境动态调整物理参数，系统性评估大语言模型的科学发现能力，解决训练数据泄漏问题，为下一代AI科研系统开发提供新范式。

AI新闻资讯 # AI科学发现 # NewtonBench # 基准测试

8个月前

英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力

英特尔正式发布代号Crescent Island的新一代数据中心GPU，配备160GB内存，基于Xe3P架构专攻AI推理市场。产品针对大语言模型优化，支持风冷服务器，预计2026年交付样品，剑指英伟达...

AI产品动态 # AI推理 # Xe3P架构 # 人工智能硬件

8个月前

xAI发布Grok 4.1大语言模型：情商测试刷新纪录，24小时登顶LMArena排行榜

Moonshot AI开源Kosong框架：Python智能体开发迎来革命性突破

Majestic Labs获1亿美元融资，推出128TB内存AI服务器突破大语言模型算力瓶颈

AI初创Inception获5000万美元融资，扩散模型Mercury代码生成速度提升20倍

阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX，语音编辑进入自然语言指令时代

通义千问Qwen3-Max上线深度思考功能，AI推理能力实现重大突破

Cognition推出SWE-1.5大模型：推理速度达950令牌/秒，重塑AI编程效率标准

全球首个视频转网页评测基准IWR-Bench发布，GPT-5综合得分仅36.35分暴露AI交互逻辑短板

NewtonBench：港科大与英伟达推出AI科学发现评估新基准，模拟平行宇宙测试大模型推理能力

英特尔发布Crescent Island数据中心GPU 强化AI推理市场竞争力

热门AI工具

最新资讯