美团发布LongCat-Flash-Thinking大模型:国内首款双轨推理AI,数学代码能力全面升级 美团发布国内首款兼具深度思考与工具调用的双轨推理大模型LongCat-Flash-Thinking。详解其领域并行强化学习架构、万卡集群DORA系统性能,以及在ARC-AGI基准测试中超越国际闭源模型... AI产品动态# AI推理模型# LongCat-Flash-Thinking# 代码生成 2个月前
苹果AI重大突破:RLCF方法重塑大模型训练,复杂指令执行能力提升达8.2% 苹果发布革命性RLCF人工智能训练方法,通过结构化清单反馈机制显著提升大模型复杂指令执行能力,在FollowBench等测试中实现最高8.2%性能优化。了解AI如何通过WildChecklists数据... AI新闻资讯# AI训练技术# RLCF# 人工智能 3个月前
Majestic Labs获1亿美元融资,推出128TB内存AI服务器突破大语言模型算力瓶颈 Majestic Labs完成1亿美元A轮融资,推出专为大语言模型设计的高容量AI服务器,单设备支持128TB内存,采用定制加速器芯片和HBM技术,有效解决AI算力部署痛点,预计2027年面向超大规模... AI新闻资讯# AI服务器# AI芯片# AI融资 3周前
谷歌Gemini 3正式发布:全面超越GPT-5.1,AI竞赛进入”执行力”新时代 深度解析谷歌Gemini 3大模型:在LMArena以1501分超越GPT-5.1,GPQA Diamond测试达91.9%,配备生成式界面和Vibe Coding技术,重新定义AI执行力标准。了解G... AI产品动态# AI大模型# GPT-5.1# 人工智能竞赛 2周前
Moonshot AI开源Kosong框架:Python智能体开发迎来革命性突破 深度解析Moonshot AI开源的Kosong框架:支持多模型自由切换的Python智能体开发工具,具备插件化设计和标准化工具集成,5分钟快速部署体验,助力开发者高效构建AI应用。 AI产品动态# AI开发框架# Kosong# MoonshotAI 3周前
AI初创Inception获5000万美元融资,扩散模型Mercury代码生成速度提升20倍 AI初创公司Inception完成5000万美元种子轮融资,其新型扩散模型Mercury在代码生成任务中实现每秒超1000标记处理速度,较传统模型提升20倍,为AI商业化提供高效解决方案。 AI新闻资讯# AI初创# Inception# 代码生成 3周前
微软英伟达联手投资150亿美元!Anthropic估值跃升至3500亿美元创纪录 微软与英伟达向Anthropic投资150亿美元,创AI初创企业3500亿美元估值纪录。深度解析三方在云服务、算力硬件与大语言模型的战略布局,以及对生成式AI市场竞争格局的影响。 AI新闻资讯# AI投资# Anthropic# 云计算 2周前
xAI发布Grok 4.1大语言模型:情商测试刷新纪录,24小时登顶LMArena排行榜 2025年11月xAI发布Grok 4.1大语言模型,24小时内登顶LMArena文本能力排行榜,情商测试达1586分刷新纪录,事实性错误率降低65%,支持128K上下文,全球免费开放使用。 AI产品动态# Grok4.1# LMArena排行榜# xAI 2周前
阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代 阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX,支持自然语言指令编辑,30亿参数实现高性能低门槛部署,在方言表现力和情感传递准确率方面领先行业,推动... AI产品动态# AI语音技术# Step-Audio-EditX# 大语言模型 3周前
通义千问Qwen3-Max上线深度思考功能,AI推理能力实现重大突破 阿里巴巴通义千问Qwen3-Max旗舰模型正式上线深度思考功能,具备万亿参数规模,在复杂推理任务中实现100%准确率。该功能强化多步骤问题拆解能力,为科研、金融、软件开发等领域带来效率提升。 AI产品动态# AI模型# Qwen3-Max# 人工智能 4周前