谷歌与加州大学圣克鲁兹分校联合研发的DeepSomatic模型近期取得突破性进展,该AI工具在识别小儿白血病未检出基因变异方面展现出卓越能力。研究团队通过分析8例已测序的小儿白血病样本,不仅验证了模型对已知致病突变的检出可靠性,更首次发现10个此前未报告的潜在治疗靶点突变,相关成果已发表于《Nature Biotechnology》。
DeepSomatic采用卷积神经网络架构,创新性地将测序数据转化为图像进行深度学习,显著提升了对低频复杂变异的识别精度。测试数据显示,该模型在PacBio测序平台上的突变识别准确率超过80%,远超现有方法不足50%的表现。其技术优势还体现在跨平台兼容性上,可适配Illumina短读长、PacBio HiFi长读长和Oxford Nanopore长读长三种主流测序技术。
值得注意的是,模型在福尔马林固定石蜡包埋(FFPE)样本和全外显子测序(WES)等临床常见场景中仍保持高效性能。尽管主要基于乳腺癌和肺癌数据训练,DeepSomatic在胶质母细胞瘤等突变数量较少的肿瘤类型中同样成功识别出关键驱动突变,展现出强大的跨癌种泛化能力。
谷歌研究团队已将该模型及配套的癌症标准长读评估数据集(CASTLE)开源,包含6种癌症细胞样本的三平台全基因组测序数据。项目负责人Yossi Matias强调,该成果标志着体细胞变异检测领域的重大进展,但需通过本地验证流程方可进入临床应用。目前相关代码及数据已发布于GitHub平台供科研界进一步验证与优化。
© 版权声明
文章版权归作者所有,未经允许请勿转载。