背景介绍
上皮性卵巢癌(EOC)至少可分为五种不同的类型:高级别浆液性癌(HGSC)、子宫内膜样癌、透明细胞癌、粘液性癌和低级别浆液性癌(LGSC)。尽管需要组织类型特异性和/或阶段依赖性治疗方案,但大多数EOC患者仍采用传统的“一刀切”手术干预和化疗方法。为了选择更有效的治疗复杂表型EOC的方法,在初始干预前确定能够准确定义患者特征的分层因素是非常重要的。
一些研究表明,结合生物标志物和多种临床指标可以提高诊断的准确性。但是临床医生熟悉的常用统计方法并不适合处理复杂的信息。那么,怎么才能从具有多个输入变量的大型数据集中提取有意义的信息呢?
这项研究收集了334名上皮性卵巢癌(EOC)患者和101名良性卵巢肿瘤患者的外周血实验和年龄数据,一共32个参数。研究队列被随机分为“训练”和“测试”两组,并使用了7个监督式学习分类器,包括梯度提升机(GBM)、支持向量机(Support Vector machine)、随机森林(RF)、条件随机森林 (CRF)、朴素贝叶斯(Naive Bayes)、神经网络(Neural Network)和弹性网络(Elastic Net)。
No.1 EOC与良性肿瘤的鉴别诊断
为了探讨多变量作为卵巢肿瘤特征预测因子的实用性,研究人员比较基于32个外周血指标的多因素逻辑回归分析和使用每个标志物的单因素逻辑回归分析。结果显示,这些监督机器学习分析比传统的多元逻辑回归分析更准确地预测。值得注意的是,GBM、RF和CRF表现出了最好的性能。
No.2 预测卵巢临床分期和分型
接下来,研究人员使用随机森林和32个外周血标记物来预测EOC的临床分期 [早期(i/ii期)和晚期(iii/iv期)]。结果显示,CRP和LDH是预测EOC临床分期的重要参数,除了众所周知的肿瘤标志物如CA125和CA19-9外,还可以通过基尼指数的平均下降作为可变重要性的衡量指标。
应注意的是,随着临床阶段的进展,CA125、CRP、LDH、FBG和血小板(PLT)增加,包括GCA19-9和ALB在内的标志物减少。同时,研究人员也评估了组织学类型EOC的可预测性。结果显示,高级血清型、透明细胞型、子宫内膜样组织型和粘液组织型的预测准确率最高,分别为75.8%、67.7%、55.6%和96.0%。而CA125和CA19-9是高级血清型EOC最重要的预测因子。
No.3 术前血液标志物预测肿瘤残留
术后残留肿瘤的存在是一个强有力的预后指标,它同时影响进展自由生存期(pfs)和总体生存期。研究人员的下一步工作就是利用术前血液标志物和序贯分类法预测残余肿瘤,并尝试预测残余肿瘤大小。结果显示,最重要的预测变量是CA19-9、淋巴细胞和CA125。
小编总结
在预测EOC的多个临床参数方面,机器学习技术优于传统的回归分析。而集成了多个若决策树(如GBM、RF和CRF)的机器学习方法在EOC预测中表现最好:准确度和ROC曲线下面积(AUC)分别为92.4%和0.968。
不!要!慌!中科新生命给大家带来了更加便于使用的解决方案!在昨天下午的发布会上,我们重磅推出了集成机器学习分析,筛选标志物再也不用发愁,一步到位,最佳选择!