Nat Commun: 基于机器学习的血清代谢组筛选早期肺腺癌标志物

2020-8-13 10:51

xmorient

早期诊断可提高许多类型癌症的生存率,肺腺癌占所有肺癌一半且死亡率高达80%,早期诊断可将5年生存率提高到52%,并降低管理该疾病的成本。对大规模临床应用,理想的早期肺腺癌诊断需要解决快速检测,低侵入性和高性能的问题。

2020年7月,上海交通大学生物医学工程学院钱昆教授研究团队在《Nature Communications》发表了题为:Machine learning of serum metabolic patterns encodes early-stage lung adenocarcinoma 的研究文章,采用铁粒子辅助激光解吸电离质谱(Laser Desorption/Ionization Mass Spectrometry, LDI-MS)对人血清样本进行代谢组学分析,并通过机器学习算法筛选早期肺腺癌(LA)诊断代谢生物标志物组合。

1597287003531137.png

研究材料:人血清样本

技术方法:代谢组学(铁粒子辅助激光解吸电离质谱)

实验路线图:

1597287003533822.png

研究结论

01 实验设计

首先研究人员对铁粒子辅助激光解吸电离质谱(Laser Desorption/Ionization Mass Spectrometry, LDI-MS)方法进行了优化,以铁粒子作为LDI MS理想的基质。

为了计算机器学习分析最佳的样本量,首先选择12个样本(6/6,早期肺腺癌LA/对照组control,)进行分析。结果显示,FDR为0.1情况下,实验设计的最低的样本数为200(100/100, LA/control)。

02 代谢组分析

随后对征集的200名早期LA患者,200名健康对照,36名其他肺癌患者,45名良性肺癌患者的共481份的人血清样本进行代谢组学分析,检测到 810个离子峰,其中160个离子峰可以有效区分LA患者和健康对照组。

1597287004415510.png

03 机器学习算法筛选最优生物标志物

研究人员对人血清代谢模型建立机器学习模型以进行早期LA诊断。通过调整训练集样本数从20(10/10, LA/control)到280(140/140, LA/control)增加诊断模型性能。最终筛选到了7种代谢生物标志物(尿嘧啶(Ura)、组胺(His)、半胱氨酸(Cys)、3-羟基吡啶甲酸(HPA)、尿酸(UA)、吲哚丙烯酸(IA)和脂肪酸(FA,18:2))组合,该组合AUC为0.894。丙氨酸代谢、嘧啶代谢、泛酸和CoA生物合成,甘氨酸、丝氨酸和苏氨酸代谢等通路为早期LA和其他肺癌中共有的代谢途径。

1597287005316415.png

小编小结

本研究应用优化的铁粒子辅助激光解吸/电离质谱(LDI MS)方法对来自早期肺腺癌患者(n=200)、健康对照(n=200)、其他肺癌(n=36)以及肺良性疾病(n=45)的481份人血清样本进行代谢组学分析,通过机器学习模型算法,确定了可以区分早期LA和健康对照(p<0.05)的7个代谢物的生物标志物组合及相关的代谢物途径。该研究促进了早期癌症检测代谢分析的设计,并有望作为一种可推广到临床的低成本测试方法。

文章延伸

临床生物标志物的筛选、及诊断panel优化构建是临床应用转化前期基础,如何高效从海量的组学数据中获得高灵敏、高稳定、高准确率的潜在生物标志物,是标志物筛选所面临的主要挑战之一。近2年来,先进的机器学习广泛应用于医学生物标志物的筛选,很大程度的解决了上述的这些问题,可谓是标志物筛选的一大必备利器。

1. Shen Bo,Yi Xiao,Sun Yaoting et al. Proteomic and Metabolomic Characterization of COVID-19 Patient Sera.[J] .Cell, 2020, 182: 59-72.e15.

蛋白组+代谢组+机器学习筛选新冠重症患者生物标志物

2. Poss A M, Maschek J A, Cox J E, et al. Machine learning reveals serum sphingolipids as cholesterol-independent biomarkers of coronary artery disease[J]. Journal of Clinical Investigation, 2020, 130(3): 1363-1376.

脂质组++机器学习筛选冠心病生物标志物

3. Gerl M J, Klose C, Surma M A, et al. Machine learning of human plasma lipidomes for obesity estimation in a large population cohort[J]. PLOS Biology, 2019, 17(10).

脂质组++机器学习预测肥胖指数

中科新生命代谢组学平台提供高分辨非靶代谢组、高分辨脂质组和靶向代谢服务,拥有2700+极性代谢物的自建标准品数据库,170万+的脂质代谢物库,及临检级别的靶向代谢物检测平台;同时借助于集成机器学习算法,提供更有效的关关键功能代谢物及标志物的挖掘与筛选。合作单位1000+,客户文章150+,平均影响因子5分+,连续3年通过临检中心室间质评,是您值得信赖的合作伙伴!

1597287006903791.png

1597287006111917.png


领域:蛋白/抗体/蛋白质组,基因/基因组/测序,多组学/蛋白质组/代谢组/脂质组

标签:蛋白组 代谢组 多组学 中科新生命 肺腺癌