Tahoe Bio发布30亿参数AI模型Tx1:癌症研究迎来生命系统建模新纪元

美国生命科学公司Tahoe Bio近日发布其30亿参数AI基础模型Tahoe-x1(Tx1),标志着人工智能在癌症研究领域实现从辅助工具到生命系统建模引擎的跨越式升级。该模型通过解码基因、细胞与药物的复杂关系,为靶点发现个性化治疗带来突破性进展。

核心技术突破
Tahoe-x1基于Transformer编码器架构,采用掩码语言建模预训练,其训练数据涵盖2.66亿单细胞转录组谱,包括公司自建的Tahoe-100M扰动数据集(记录上千种分子对癌细胞的扰动响应)。通过FlashAttention v2等优化技术,模型在普通GPU上可实现较同类细胞模型高3至30倍的计算效率,显著降低科研门槛。

三大核心能力验证
1. 基因必需性预测:在权威DepMap数据集中,Tx1能精准识别不同癌症亚型的核心驱动基因,尤其适用于异质性强的难治性癌症,将靶点发现至验证周期大幅缩短。
2. 癌变通路还原:模型在MSigDB测试中对“癌变标志通路”(如细胞周期失控、DNA修复缺陷)的解析准确率居首,为多靶点联合疗法提供系统性分子网络洞见。
3. 零样本药效预测:即使面对未见过的细胞类型或患者样本,Tx1可通过类比推理预测药物反应,使虚拟临床试验成为可能。研究人员可在计算机中模拟上万种治疗方案,显著降低试错成本。

行业影响与开源计划
目前Tx1模型家族已提供多尺寸版本(如Tx1-70M),代码及工作流通过GitHub和Huggingface开源。其开源策略与近期谷歌、耶鲁团队发布的C2S-Scale模型形成呼应,后者曾通过AI原创假设发现silmitasertib药物可增强冷肿瘤抗原呈递能力。业界认为,Tx1的推出将进一步加速生物AI从单点突破向通用智能演进,推动抗癌研究进入高效计算时代。

© 版权声明

相关文章