AI工具ShortStop革新基因组研究:高效识别功能性微蛋白开辟精准医学新路径

美国索尔克研究所近日发布一项突破性研究成果,其开发的AI工具ShortStop通过机器学习框架系统性地探索基因组中长期被忽视的非编码区域,为微蛋白研究开辟了新路径。这项发表于《BMC方法学》的研究显示,该技术能高效识别可能编码功能性微蛋白的小开放阅读框(smORF),解决了传统研究方法成本高、效率低的瓶颈问题。

传统基因组研究主要聚焦于编码大型蛋白质的DNA区域,而占基因组99%的非编码区域曾被视作”垃圾DNA”。随着科学界发现这些区域可能蕴含关键生物学信息,特别是长度小于150个氨基酸的微蛋白,研究手段的局限性逐渐凸显。ShortStop通过双类别排序系统创新性地解决了这一难题:将真实smORF序列与计算机生成的随机”诱饵”序列进行比对,可快速评估潜在功能性,筛选出最具研究价值的候选对象。

在技术验证阶段,研究团队对现有smORF数据集的分析显示约8%的序列可能编码功能性微蛋白。更值得注意的是,该工具成功识别出传统方法遗漏的微蛋白表达,其中在肺癌遗传数据中发现的210种新型微蛋白候选者中,已证实有一种在肿瘤组织中特异性高表达,具备成为生物标志物或治疗靶点的潜力。

“这项技术让我们能系统性挖掘基因组’暗物质’中的宝藏,”研究负责人指出。随着基因组数据的持续积累,ShortStop有望加速从阿尔茨海默病到代谢性疾病等多个领域的靶点发现进程。该工具的另一优势在于使普通实验室无需复杂实验设备即可开展微蛋白研究,显著降低了科研门槛。

这项突破不仅重新定义了科学界对基因组功能边界的认知,也为精准医学提供了新的分子探索工具。研究团队表示,下一步将扩大ShortStop在各类疾病模型中的应用规模,并持续优化算法以提升预测准确性。

© 版权声明

相关文章