分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

利用弹性网正则化或卷积神经网络构建评估扁豆丝囊菌...

2021.2.23
头像

王辉

致力于为分析测试行业奉献终身

利用弹性网正则化或卷积神经网络构建评估扁豆丝囊菌根腐病模型


丝囊菌根腐病是限制扁豆和豌豆产量的主要疾病,能够导致严重的经济损失。目前商业化推广种植的品种大都缺乏根腐病抗性,因此,研究者致力于通过遗传育种方法开发出抗病性更好的扁豆品种。

 

作物表型由于与植物表达性状(受基因和环境因素间的相互作用影响)的评估息息相关,所以成为了作物改良工作中的一个关键过程。传统表型方法通量较低且易受主观因素影响,往往费时费力,因此有必要开发新的表型组学技术,在细胞、器官、植株或群体层面辅助获取多维表型数据。可以预见的是,与传统方法相比,表型组学的进步将能够实现对大规模育种试验进行无损、自动化以及高时空分辨率的评估。

 

数据驱动的方法解释特定的生物学模式(如抗病性和农艺表现等)能够帮助植物育种专家、病理学家和生理学家等做出决策。传感器技术的发展推动了许多性状的大规模筛选,这种大规模筛选的方法会生成大量的数据,需要进行数据分析来提取出有意义的数据性状,因此新的数据分析方法也亟待开发。已有研究表明,统计学方法和机器学习方法都可以从收集到的表型数据中有效地提取性状。与统计学方法相比,机器学习方法的优点之一是其能够评估多个性状的组合,而不是针对某些性状一个一个地进行评估。

 

近日,Plant Phenomics在线发表了华盛顿州立大学Afef Marzougui等人的题为Generalized Linear Model with Elastic Net Regularization and Convolutional Neural Network for Evaluating Aphanomyces Root Rot Severity in Lentil的研究论文。

 

论文作者使用可见光图像评估了扁豆的丝囊菌根腐病抗性。为了辅助表型过程,在论文作者先前的研究工作中,已评估了从可见光或高光谱图像中提取扁豆根芽的可能性,并结合使用了用于疾病分类预测的弹性网回归模型。考虑到深度学习方法的潜在优点,该文章建立了一个扁豆根图像数据集(Fig. 1 (a)),并由育种专家根据发病的严重程度进行了标注,之后基于数据集开发并比较了两种深度学习方法,具有弹性网正则化或卷积神经网络的广义线性模型(Fig. 1),能够将疾病抗性分为三类:抗性、部分抗性、易感性。


Fig.1: Data analysis approaches: training and optimization. (a) Imagery datasets, (b) distribution of ARR visual disease scores and ARR disease classes within experiments, (c) distribution of ARR visual disease scores and ARR disease classes within root_1 dataset (n = 6,460 images) and root_2 dataset (n = 3,275 images), (d) CNN architecture, and (e) generalized mixed model with EN regularization optimization and feature selection.

 

结果表明,使用弹性网正则化的模型提取出的图像特征能够以较高准确度对三种疾病类别进行分类(Fig. 4),且两种方法均能准确地检测出抗病等级(Fig. 5)。然而,由于部分抗性的特征和数据通常与抗性和易感性的数据有所重叠,因此很难检测出部分抗性。总体来说,该文使用表型技术和机器学习方法为扁豆丝囊菌根腐病抗性的定量分析提供了新的见解。



Fig.4: Spearman correlation analysis of the model-selected final RGB features—selected using EN—and visual disease scores (n = 6,460 and 3,275, for root_1 and root_2, respectively).

Fig.5: nMDS ordinations of test set (random run = 7): (a) RGB features selected using EN for root_1 dataset, (b) RGB features selected using EN for root_2 dataset, (c) FC features extracted from CNN for root_1 dataset, and (d) FC features extracted from CNN for root_2 dataset. (e) Venn diagram of resistant class classification averaged across the 10 random runs.



互联网
文章推荐