通义千问Qwen3-Max上线深度思考功能,AI推理能力实现重大突破 阿里巴巴通义千问Qwen3-Max旗舰模型正式上线深度思考功能,具备万亿参数规模,在复杂推理任务中实现100%准确率。该功能强化多步骤问题拆解能力,为科研、金融、软件开发等领域带来效率提升。 AI产品动态# AI模型# Qwen3-Max# 人工智能 5个月前
美团发布LongCat-Flash-Thinking大模型:国内首款双轨推理AI,数学代码能力全面升级 美团发布国内首款兼具深度思考与工具调用的双轨推理大模型LongCat-Flash-Thinking。详解其领域并行强化学习架构、万卡集群DORA系统性能,以及在ARC-AGI基准测试中超越国际闭源模型... AI产品动态# AI推理模型# LongCat-Flash-Thinking# 代码生成 7个月前
滑铁卢大学发布SubTrack++技术:大模型训练效率提升3倍,碳排放降低42% 加拿大滑铁卢大学SubTrack++技术实现大语言模型训练革命性突破:预训练耗时减少67%,70亿参数模型性能对标千亿模型,算力消耗降低30%,碳排放减少42%,2026年将开源。 AI产品动态# AI节能技术# SubTrack++# 人工智能 4个月前
谷歌Gemini 3 Flash轻量模型性能反超旗舰版!成本骤降80%引爆AI效率革命 谷歌Gemini 3 Flash在SWE-bench编程测试获78%高分,超越旗舰Pro版1.8个百分点!响应速度提升3倍,Token消耗降30%,定价仅为同类1/4。博士级推理GPQA达90.4... AI产品动态# AI成本优化# AI模型# GPT-5.2 4个月前
苹果AI重大突破:RLCF方法重塑大模型训练,复杂指令执行能力提升达8.2% 苹果发布革命性RLCF人工智能训练方法,通过结构化清单反馈机制显著提升大模型复杂指令执行能力,在FollowBench等测试中实现最高8.2%性能优化。了解AI如何通过WildChecklists数据... AI新闻资讯# AI训练技术# RLCF# 人工智能 8个月前
阶跃星辰开源全球首个LLM架构音频编辑模型Step-Audio-EditX,语音编辑进入自然语言指令时代 阶跃星辰于2025年11月开源全球首个基于LLM架构的音频编辑模型Step-Audio-EditX,支持自然语言指令编辑,30亿参数实现高性能低门槛部署,在方言表现力和情感传递准确率方面领先行业,推动... AI产品动态# AI语音技术# Step-Audio-EditX# 大语言模型 5个月前
谷歌发布Gemini 2.5 Flash-Lite模型:速度提升1.5倍,成本效益显著 谷歌推出Gemini 2.5 Flash-Lite模型,速度提升1.5倍,延迟最低200毫秒,成本效益显著,适合高吞吐量应用场景。 AI产品动态# AI模型# Gemini2.5Flash-Lite# 人工智能 9个月前
智谱AI发布开源旗舰模型GLM-4.7:编程能力全球领先,性能超越GPT-5.2 智谱AI开源新一代旗舰模型GLM-4.7,在Code Arena盲测中位列开源与国产模型双第一,编程与数学推理能力超越GPT-5.2,支持API调用与国产算力部署,助力开发者高效实现AI应用。 AI产品动态# AI编程# GLM-4.7# 人工智能 4个月前