一项名为 SEQUOIA 的新型 AI 程序可以分析肿瘤活检的显微镜图像(左图,紫色),并快速确定其中所含细胞中可能开启和关闭的基因(右侧以红色和蓝色阴影显示基因表达)。图片来源:Emily Moskal/斯坦福医学
人工智能工具分析活检图像。为了确定癌症的类型和严重程度,病理学家通常在显微镜下检查肿瘤活检的薄片。然而,识别驱动肿瘤生长的基因组变化——指导治疗的关键信息——需要对从肿瘤中分离出的RNA进行基因测序。这个过程可能需要数周时间,花费数千美元。
现在,斯坦福医学院的研究人员开发了一种人工智能计算程序,该程序可以仅根据活检的标准显微镜图像预测肿瘤细胞内数千种基因的活动。该工具最近发表在《自然通讯》上,是使用来自 7,000 多个不同肿瘤样本的数据创建的。该团队表明,它可以使用常规收集的活检图像来预测乳腺癌的基因变异并预测患者的预后。
“这种软件可以用来快速识别患者肿瘤中的基因特征,加快临床决策并为医疗保健系统节省数千美元。”生物医学数据科学教授兼论文资深作者 Olivier Gevaert 博士说。
这项工作还由斯坦福大学研究生 Marija Pizuria 和博士后研究员 Yuanning Zheng 博士和 Francisco Perez 博士领导。
基因组学驱动临床医生越来越多地指导选择癌症治疗方法(包括化疗、免疫疗法和激素疗法),推荐给患者,不仅基于患者的癌症影响哪个器官,还基于肿瘤利用哪些基因来促进其生长和扩散。开启或关闭某些基因可能会使肿瘤更具侵袭性、更容易转移,或对某些药物产生反应的可能性更大或更小。
然而,获取这些信息通常需要昂贵且耗时的基因组测序。
Gevaert 和他的同事知道,单个细胞内的基因活动可以改变这些细胞的外观,而这种改变往往是人眼无法察觉的。他们求助于人工智能来寻找这些模式。
研究人员首先从 16 种不同癌症类型的 7,584 例癌症活检样本开始。每例活检样本都被切成薄片,并使用一种称为苏木精和伊红染色的方法进行准备,这种方法是观察癌细胞整体外观的标准方法。研究人员还提供了有关癌症转录组(即细胞正在积极使用的基因)的信息。
工作模型在研究人员整合了新的癌症活检样本以及其他数据集(包括来自数千个健康细胞的转录组数据和图像)后,该 AI 程序(他们将其命名为 SEQUOIA(使用线性注意的基于幻灯片的表达量化))能够从染色图像中预测超过 15,000 种不同基因的表达模式。对于某些癌症类型,AI 预测的基因活动与真实基因活动数据的相关性超过 80%。一般来说,初始数据中包含的任何特定癌症类型的样本越多,模型对该癌症类型的表现就越好。
Gevaert 表示:“我们经过多次迭代,才对模型的性能感到满意。但最终,对于某些类型的肿瘤,模型的性能已经达到了临床应用的水平。”
Gevaert 指出,医生在做出临床决策时,通常不会一次查看一个基因,而是查看包含数百个不同基因的基因特征。例如,许多癌细胞会激活与炎症相关的数百个基因,或与细胞生长相关的数百个基因。与其预测单个基因表达的表现相比,SEQUOIA 在预测如此大的基因组程序是否被激活方面的表现更为准确。
为了使数据易于获取和解释,研究人员对 SEQUOIA 进行了编程,将基因发现显示为肿瘤活检的可视图,让科学家和临床医生看到肿瘤不同区域的基因变异有何不同。
预测患者治疗结果为了测试 SEQUOIA 在临床决策中的实用性,Gevaert 和他的同事确定了乳腺癌基因,该模型可以准确预测这些基因的表达,这些基因已用于商业乳腺癌基因组测试。(例如,美国食品和药物管理局批准的 MammaPrint 测试分析了 70 种乳腺癌相关基因的水平,为患者提供癌症复发风险的评分。)
Gevaert 表示:“乳腺癌具有许多经过深入研究的基因特征,这些特征在过去十年中已被证明与治疗反应和患者结果高度相关。这使其成为我们模型的理想测试案例。”
研究团队认为,SEQUOIA 仅使用肿瘤活检染色图像即可提供与 MammaPrint 相同类型的基因组风险评分。研究人员在多组不同的乳腺癌患者身上重复了这一结果。在每例中,被 SEQUOIA 确定为高风险的患者预后较差,癌症复发率较高,且癌症复发时间较短。
该人工智能模型目前还不能在临床环境中使用——它需要在临床试验中进行测试并获得 FDA 批准,然后才能用于指导治疗决策——但 Gevaert 指出,他的团队正在改进该算法并研究其潜在应用,未来 SEQUOIA 可以减少对昂贵的基因表达测试的需求。
“我们已经证明了这种方法对乳腺癌的实用性,现在我们可以将它用于所有癌症,并查看任何基因特征,”Gevaert 强调:“这是我们以前没有的全新数据来源。”
这项研究的资金由美国国家癌症研究所(拨款 R01 CA260271)、比利时美国教育基金会的奖学金、Fonds Wetenschappelijk Onderzoek-Vlaanderen 的资助、富布赖特西班牙委员会和根特大学提供。
参考文献:“通过线性化关注对组织学图像中的基因表达进行数字分析”作者:Marija Pizurica、Yuanning Cheng、Francisco Carrillo-Perez、Humaira Noor、Wei Yao、Christian Wohlfart、Antoaneta Vladimirova、Kathleen Marchal 和 Olivier Gevaert,2024 年 11 月 14 日,《自然》通讯。DOI:10.1038/s41467-024-54182-5
来源:斯坦福大学
免责声明:康加号致力于健康常识分享,内容根据公开资料编辑,版权归原作者;如有侵权请在线留言删除。文章旨在介绍健康科学进展,不能作为治疗方案;如需精准健康指导,请至正规医院诊疗。