分析测试百科网

搜索

喜欢作者

微信支付微信支付
×

基因组研究的“98K”——人工智能算法

2019.12.02
头像

烘干机

致力于为分析测试行业奉献终身

  每个分子遗传学家都希望找到一个易于使用的程序,可以比较来自不同细胞条件的数据集,识别增强子区域,然后将其分配给目标基因。

  如今,柏林马克斯·普朗克分子遗传学研究所的马丁·温格隆(Martin Vingron)领导的研究小组现已开发出一个掌握所有这些内容的程序。 “ DNA非常无聊,因为它在每个细胞中几乎都一样。如果将基因组比作生命之书,那么我对旁注则更感兴趣。”这些“旁注”是指附着在DNA分子上的小化学标记,它们不会改变遗传信息本身,但会影响相应位点上DNA发生的变化。换句话说,这些标记具有表观遗传作用。它们充当负责启动子和增强子等基因激活和失活的基因组区域的调节剂。

  在许多复杂的疾病中,基因的表观遗传控制无法正常工作,这对科学家非常感兴趣。然而,在实验室中对这些区域的分析通常是麻烦,费时且复杂的。这就是为什么Vingron和他的团队决定开发一个新的程序包的过程。

  该程序包称为条件特定的调节单元预测(CRUP),它可以简化分析并解决一些实际问题。开发该软件包的生物信息学家Verena Heinrich说:“我们希望通过一个简单的通用程序将增强子预测过程中的常见步骤结合在一起。” CRUP在许多方面简化了分析。机器学习算法不限于特定的细胞或组织类型。无需在每次分析数据集之前重新校准它,并且可以对多个数据系列进行比较研究。该工具由Heinrich和博士生Anna Ramisch开发,仍然易于使用。

  CRUP专门鉴定和表征增强子-刺激或“增强”基因转录的DNA片段。这些区域吸引附着在启动子序列上的蛋白质,该启动子序列充当每个基因的开关。然而,哪种增强子在正确的时间控制正确的基因通常仍然是一个谜。

  基因组包含成千上万个增强子,它们在细胞生命的不同阶段(如生长,维持或疾病期间)具有活性。当DNA像羊毛线一样紧密地堆积在称为组蛋白的载体蛋白线轴上时,调节序列处于“静止”状态。它们仅通过对组蛋白的化学修饰而产生影响。

  这些ChIP数据是新开发程序的初始输入值。 CRUP首先检查所有序列,然后判断它是否是增强子。分类算法基于使用小鼠胚胎干细胞的信息进行训练的人工智能产生。正如Heinrich和她的同事在德国表观基因组计划(DEEP)提供的一系列数据中所展示的那样,它可以检测许多其他动物物种或组织中的增强子区域。

图片.png

(图片来源:Www.pixabay.com)

  在第二步中,可以向CRUP导入多个数据集,程序会找到它们之间的区别。这使得可以解释一系列的测量结果或查明组织之间的差异。随着时间的流逝,或者在比较健康和患病的组织时,增强子的表观遗传变化变得显而易见。分析的第三步也是最后一步是将基因映射到它们各自的增强子。为了实现这一目标,CRUP将增强子分析与转录数据联系起来,转录数据揭示了哪些基因是活跃的,而实验则表明了DNA链的哪些部分彼此靠近。

  最后,研究人员在实际环境中测试了他们的程序。他们分析了患有免疫性类风湿关节炎的小鼠的组织,并将其与健康动物的数据进行了比较。 CRUP确定了增强子区域中的200多个差异,其中一些在其他研究中已经与该疾病相关。 CRUP分配给这些增强子的基因也已显示在疾病中起作用。

  Vingron说:“我们的程序可靠地识别出与疾病相关的增强子的候选物,并将其与靶基因联系起来。”他的团队希望该新工具将使该领域更容易使用,并加快研究速度,以帮助确定复杂的人类疾病的原因。


生物谷
文章推荐