近日,夸克正式发布《QuarkMed Technical Report》健康大模型技术报告,首次系统披露其实现“主任医师级”AI能力的技术路径与核心成果。该模型已通过中国12门核心学科的主任医师笔试评测,成为国内首个达成该里程碑的大模型,标志着AI在复杂医疗推理领域取得实质性突破。
技术报告显示,夸克健康大模型在训练过程中整合了约1万亿Token的高质量医疗数据,涵盖医学资料、专业知识和临床记录三大类。通过分阶段强化学习策略,模型在复杂场景中的推理能力显著提升:第一阶段侧重医学专业能力强化,第二阶段通过奖励模型从诚实性、有用性及合规性维度优化输出质量。测试数据显示,该模型在MedQA等国际权威数据集上的表现优于同尺寸通用模型,且在医师资格考试中呈现“难度越高、领先优势越显著”的特点。例如案例分析题场景下,其正确率达71%,较通用模型提升超10个百分点。
值得注意的是,该模型在肿瘤内科、精神病学等4个学科已达到主任医师合格标准。夸克算法负责人徐健强调,模型通过构建“医疗慢思考”机制实现从表象判断到深度分析的跨越,其核心在于“训练AI掌握医学思维而非简单问答”。为保障应用安全,团队建立了由400余名三甲医院副主任医师以上专家组成的审核体系,对训练数据及输出结果进行多层级校验。目前模型在疑难疾病诊断中的准确率已达85.51%,接近专科医生水平。
据悉,夸克将公开医师考试测试集以推动行业研究。该技术已集成至夸克搜索平台,用户可通过深度搜索功能调用“主任级AI医生”服务。业内专家指出,此类突破将有效优化医疗资源分配,助力早期病因筛查,但现阶段仍定位于辅助诊疗决策而非替代医生角色。
© 版权声明
文章版权归作者所有,未经允许请勿转载。