分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

重磅综述:代谢组学如何影响系统生物学的其他组学

迈维代谢
2022.6.28

de4eed5c9b83d32df5cc260f7e854b2b.jpeg

7月1号开播,识别注册码报名预约


摘要

代谢组是代谢过程中涉及的小分子化合物的集合,传统的研究目的是识别诊断和预测疾病的生物标志物。然而,代谢组学的价值已经从一个简单的生物标志物识别工具重新定义为发现生物过程的主动驱动因素的技术。现在已经清楚的是,代谢组通过调节其他组学水平(包括基因组、表观基因组、转录组和蛋白质组)来影响细胞生理机能。这篇综述将重点介绍代谢组学如何影响其他组学,进而揭示代谢物在生理和疾病中的积极作用。利用代谢组学进行活性筛选以识别具有生物学活性的代谢物(称之为活性代谢组学)的概念已经对生物学产生了广泛的影响。


代谢组是组学中一个相对较新的概念,以代谢物为研究对象,这些小分子化学实体与基因组和蛋白质组相连,是系统生物学的最下游阶段。系统生物学通过对这些不同组学水平的生化组织的信息流的描述即为分子生物学的中心法则(图1)。代谢物组代表了整个动态系统中最下游的阶段(即代谢),在基因-蛋白-代谢物-表型框架内,代谢物作为在分子水平上可对表型进行动态和敏感的测量手段已被广泛接受,使代谢组学成为与病理生理过程相关生物标志物和机制探索研究的最前沿。


以往人们认为代谢物主要是基因和蛋白质活性的下游产物生物标志物,这使得人们对代谢物的调控作用认识不足。事实上,代谢物相互作用并积极调节所有其他组学水平(图1)。通过这种交互作用,代谢物可作为调节剂直接调控生理过程和表型。过去数十年内对代谢物的调控功能进行大量研究,并取得了一些开创性的成果,如细菌中乳糖操纵子学说;葡萄糖、脂肪酸和其他脂质可作为胰岛素分泌和敏感性的调节器;mTOR激酶作为营养和能量传感器。代谢组学技术的发展加快了对具有生理活性代谢物的发现,如NAD+促进去乙酰化酶活性,对抗年龄相关的改变;乳酸调节神经兴奋性和可塑性;α-酮戊二酸调节巨噬细胞活化和免疫;丙二酰辅酶A控制成人神经再生;牛磺酸诱导髓鞘碱性蛋白表达。癌细胞代谢研究发现富马酸、2-羟基戊二酸和琥珀酸等致癌代谢物的累积导致信号调节异常,形成致癌的环境。因此,代谢物对细胞生理有很大影响,支撑了它们作为生物活性物质的重要角色。


80d4ba1149debe6448ae281052f907db.png

    

图1 代谢物作为基因和蛋白质活性调节剂


代谢物活性原理

最近的机制研究发现,活性代谢物强烈影响组学的各个层面,从基因组、表观基因组、转录组到蛋白质组。在这个框架下,代谢组有两个主要的机制来控制DNA、RNA和蛋白质的功能:化学修饰和代谢物-大分子相互作用


大分子的代谢化学修饰代谢物驱动DNA和RNA(如甲基化)以及蛋白质(翻译后修饰)的关键共价化学修饰过程,这些化学修饰的动态特征已被证明对细胞功能有相当大的影响。


蛋白质的翻译后修饰涉及到至少几十个不同的小分子,它们可以在酶促反应中与不同的氨基酸共价结合,例如,赖氨酸乙酰化(源自乙酰辅酶a),半胱氨酸棕榈酰化(源自棕榈酰辅酶a)或酰化(源自其他酰基辅酶a)。需要注意的是,乙酰化过程也以非酶的方式发生。其他负责翻译后修饰的代谢物包括琥珀酰辅酶a(精氨酸琥珀酰化),以及用于糖基化和GlcNAcylation的活性糖分子(例如udp-葡萄糖)(图2a)。其他生物活性代谢物已被证明可以控制抗炎反应(通过半胱氨酸残基烷基化)(图2b),以及蛋白质稳态(通过蛋白酶体成分的聚ADP-核糖基化)(图2c)或酶活性(通过赖氨酸戊二酰化)(图2d)。这些过程的生物活性代谢物分别是衣康酸、ATP核糖和戊二酰辅酶a。各种蛋白质也可以通过s-腺苷甲硫氨酸(SAM)上的甲基转移在赖氨酸残基上进行甲基化(图2e)。值得注意的是,许多这些代谢物诱导的蛋白质修饰的丰度直接依赖于细胞的代谢状态,因此它们代表了表型调节的一个强有力的手段。


DNA最关键的修饰是甲基化,包括甲基从SAM转移到胞嘧啶(图2e)。DNA甲基化是基因表达的重要调控因子。这种修饰首先在胚胎发育过程中建立,并贯穿整个生命周期,它在不同细胞类型、组织和发育阶段以及衰老过程中表现出高度的动态性。SAM和其他代谢物,如甘氨酸、丙酮酸、半乳糖和苏氨酸,可作为参与转录后RNA修饰酶的辅助因子。这些RNA修饰作为信息的传感器和转导器来控制代谢速率(例如,耗氧量)和蛋白质合成;然而,它们的作用仍未被完全揭示。此外,酶促组蛋白修饰,如赖氨酸乙酰化(源自乙酰辅酶a)、赖氨酸和精氨酸甲基化(同样源自SAM)(图2e)和丝氨酸磷酸化(源自ATP)(图2a)是表观基因组的关键控制因素,直接影响基因表达、染色体包装和DNA修复。


967fc23fa0cc79ff38f8eff69cf495e6.png

    

图2 活性代谢组修饰大分子的例子



代谢物-大分子相互作用代谢物-大分子非共价相互作用代表了细胞活性调节的第二种模式。典型例子是代谢物与酶活性位点的竞争性结合(抑制作用),以及以及代谢产物与活性中心以外的位点结合(变构作用)来改变酶活性。这些概念不仅适用于酶,也适用于多种调控rRNA(代谢控制的核糖体开关),蛋白质(如信号受体)和各种其他种类的分子。


G蛋白偶联受体(GPCRs)是代谢激活信号分子中研究得最好的例子,也是最早被确定为药物靶点的蛋白质之一。在众多受体中,小鼠G蛋白偶联受体91(GPR91;也被称为琥珀酸受体1)被琥珀酸激活以控制血压,而GPR40(也被称为游离脂肪酸受体1)被几种脂肪酸激活,包括棕榈酸羟基硬脂酸(PAHSA),它属于最近发现的内源性脂质(图3a)。代谢产物与这些受体的结合会引发高度特异性的信号反应,从而导致信号网络中特殊细胞活化。转录因子和基因表达的调控亦是如此,例如,从饮食中获得的植物雌激素导致雌激素受体的非典型激活,调节细胞代谢并负反馈影响乳腺癌细胞对治疗的反应(图3b)。在转录和翻译水平上,代谢物可以通过核糖体开关发挥作用,包括赖氨酸、谷氨酰胺、钴胺素、焦磷酸硫胺素(TPP)和嘌呤(图3c)。在这个过程中,代谢物结合到不同的mRNA区域,改变mRNA的构像并最终调节蛋白质翻译。代谢物还可以促进更高分子蛋白质的组装,如细菌葡萄糖-1-磷酸尿苷转移酶galF在ATP存在下组装成多聚体(五聚体或六聚体)(图3d)。此外,活性代谢物还可控制其他必需营养素的吸收和利用,如植物对铁的吸收依赖于根系局部还原剂的存在。


5c2e8238f2d6246bc4ffc327d78e14ed.png

    

图3 活性代谢组对大分子非共价修饰的机制


肿瘤代谢物作为生物活性代谢物的原型

生物活性代谢组如何驱动表型的改变?肿瘤代谢物是生物活性代谢物的最好例子之一,因为它们在癌细胞中发现得早,并建立了表型调节机制。这些肿瘤代谢物在不同类型的癌细胞中的积累是恶性转化的诱因。肿瘤中发现了包括D-2-羟基戊二酸、L-2-羟基戊二酸、琥珀酸和富马酸在内的共代谢产物,这些共代谢产物产生时对应的酶发生了突变。在异柠檬酸脱氢酶(IDH)中发现了功能获得突变导致D-2-羟基戊二酸的水平升高,而在富马酸酶(FH)和琥珀酸脱氢酶(SDH)中发现了功能丧失性突变,分别导致富马酸和琥珀酸的积累。这些突变引起的肿瘤细胞中肿瘤代谢物的积累导致了增生性表型。


重要的是这些肿瘤代谢物不仅是疾病的生物标记物,而且它们还可以像上述那样修饰蛋白质和DNA并与之相互作用。虽然肿瘤代谢物的全部生物学效应仍然是一个活跃的研究领域,但已证明它们调节蛋白质相互作用,改变酶活性,导致蛋白质翻译后修饰的变化和修饰表观基因组。


许多致癌代谢物的生物活性源于抑制α-酮戊二酸依赖的双加氧酶,包括脯氨酰羟化酶,其是缺氧诱导因子(HIF)关键的负调控因子。代谢物抑制脯氨酰羟化酶,导致正常氧含量下HIF增加,进而诱导癌细胞能量代谢从氧化磷酸化向糖酵解转变,即Warbug效应。此外,共代谢产物抑制α-酮戊二酸依赖的TET蛋白和赖氨酸去甲基化酶,导致组蛋白和DNA高度甲基化,阐明了肿瘤代谢物与表观基因组的关联。 


除了抑制酶活性,肿瘤代谢物还有其他不同的生理活性。富马酸可与半胱氨酸残基的巯基发生反应。该反应的一个例子是KEAP1蛋白,它是基于Cullin3的E3泛素连接酶复合物的适配器,可快速将转录因子NRF2泛素化并导致其降解。该反应导致半胱氨酸残基酰化(琥珀酰化),因此抑制了KEAP1的活性。因此,NRF2被激活,驱动抗氧化和抗炎基因表达(图2b)。这一机制已被证明是肾癌中囊肿大小增加的原因。富马酸还介导其他参与氧化还原代谢的蛋白质的琥珀酰化(半胱氨酸的化学修饰,产生S-(2-琥珀基)半胱氨酸),这通常在癌细胞中被强烈激活,以抵消代谢重塑后增加的活性氧和氮基团。富马酸也被认为可以修饰其他代谢物,如谷胱甘肽,从而增加氧化应激和加速衰老。最近,D-2-羟基戊二酸也被证明可以抑制支链氨基酸转氨酶1(BCAT1)和BCAT2的活性,这是两种α-酮戊二酸依赖的酶,它们参与支链氨基酸的生物合成。值得注意的是,一些其他的代谢物已被归类为肿瘤代谢产物,包括甘氨酸、葡萄糖和乳酸,其中大多数代谢物与有氧糖酵解、谷氨酰胺分解或一碳代谢有关。


代谢组学驱动其他组学变化

现在有证据表明,代谢组对其他组学有很大的系统性的影响。在小鼠模型中使用饮食限制来限制营养的可利用性和改变代谢,并发现与之相关的基因表达的显著变化和表型的改善。在过去的十年中,人们也发现表观基因组的控制是由代谢状态决定的。但目前系统分析代谢变化或代谢物补充对其他组学层面的影响的研究较少。在一项研究中,研究了巨噬细胞化过程中代谢组和转录组水平之间的大规模整合,揭示了与交替激活的巨噬细胞状态相关的代谢特征。此外,已经成功地在细菌中研究了系统代谢产物的蛋白质相互作用,这为代谢组在蛋白质全复合物形成(蛋白质相互作用)中的作用提供了证据。在这种情况下,ATP被证明可以促进细菌utp-葡萄糖-1-磷酸尿苷基转移酶galf复合物的形成(图3d)。蛋白质研究方法(蛋白芯片)也在酵母中探索了蛋白质与代谢物的相互作用,揭示了大部分未被探索的调控联系,包括酵母胆固醇当量麦角甾醇对哺乳动物AKT类似物YPK的改变。最后一个例子是,最近的一项研究分析了各种缺乏组氨酸、亮氨酸、蛋氨酸和尿嘧啶生物合成的酵母菌株的转录组、蛋白质组和代谢组,综合分析显示,尽管在培养基中添加了代谢物,基因表达和蛋白表达在很大程度上依然受这些代谢物生物合成能力的控制,这表明代谢背景对不同组学水平有系统范围的调节。


总之,活跃的代谢组在系统生物学中调节基本的生物过程,如信号转导、蛋白质平衡和基因表达调控。目前,多组学方法主要关注代谢组蛋白质组间的相互作用,并面临着一些挑战,需要进一步的技术发展以解开代谢产物诱导的大分子活性的复杂性,以最终控制表型。无论如何,从代谢组学研究中确定的代谢物可以调节生理机能,这一概念彻底改变了传统的组学技术思维:代谢组学是可以作为系统生物学的主要调节器。


发现生物活性代谢物

表型调节代谢物的鉴定是一个复杂的过程。首先,确定了在不同条件下具有不同丰度的代谢物,这提供了代谢组与表型的初始相关性。在这一阶段,可以通过生物信息学分析将确定的代谢物注释到已知的代谢途径。一旦确定了候选生物活性代谢物列表(包括受影响的代谢物本身以及可能涉及到共同通路里的代谢物),就可以通过代谢组使用基于同位素示踪技术(代谢流)来追踪它们的去向,从而确定相关酶和生化途径时间依赖的活性变化。最后,利用体外细胞、器官模型或动物模型对代谢物进行生物活性测试。这些测定提供了内源性代谢物补充(通过饮食、饮水或加入细胞培养基)如何影响或修饰表型的直接信息。代谢物的生物活性也可以用化学生物学方法来研究,或者利用先进的数学模型来预测。代谢组学数据也可以与其他组学数据交叉关联。这种多组学分析为代谢物生物学作用提供了一种机制上的理解。以上这些方法共同建立了一个生物活性代谢产物发现框架,可以称之为活性代谢组学


代谢物鉴定、定量和筛选

现在,代谢组学为发现活性代谢物提供了一个独特的框架,这种方法可以并且已经在多个层次上得以应用(图4)。鉴定过程是发现生物活性代谢物最重要方面之一。基于质谱的代谢组学数据获取和注释主要通过识别具有特定质荷比(m/z)的代谢物特征来定义。色谱峰的注释是数据处理的一个难点。大量的峰值检测和校准软件,包括XCMSOnline, MZmine2,OpenMS和MS-DIAL。第二是对代谢物特征的标注和鉴定,这需要借助代谢物数据库和光谱库,其中HumanMetabolome Database,METLIN,the Birmingham metaboliteLibrary Nuclear Magnetic Resonance database, BiGG, MassBank,LipidMaps, mzCloud, the Fiehn laboratory GC-MS database和GolmMetabolomicsDatabase。最近,基于云计算的技术和数据库的发展解决了数据分析和共享的挑战(框1)。一旦识别出代谢物,它们的丰度将根据信号强度或峰值丰度进行量化。然后,将基于代谢组学的策略与代谢组学数据集的统计分析相结合,以发现它们之间的显著差异(以检测不同调控的代谢物,例如,在实验样本和对照样本之间)。


3a0c4b4918c99313d6e010dfc01f3dd1.png

    

图4 阐明代谢产物生物活性的工作流程


生物信息学驱动的代谢通路和网络分析可以进一步降低数据的复杂性。这些方法的目的是对代谢网络中不同模块或局部富集部分所涉及的代谢物进行优先排序,从而反映真实的活性。总之,这些方法生成了一个代谢物列表,这些代谢物可以与特定的表型变化联系起来,然后可以对它们的生物活性进行筛选。


活性代谢物的筛选策略

从候选列表中识别生物活性代谢物可以通过多种策略实现。确定活性的主要步骤是使用适当的筛选策略,这包括基因表达、蛋白表达和蛋白活性(例如,酶活性)的筛选、所需细胞表型的调节以及直接在生物体上进行体内表型研究。表1列出了这些分析背后的原则。体内研究可以对代谢物的作用提供直接的表型评价,但通量很低。基于细胞的分析可以提供高通量,并能够分析细胞形态,生物物理细胞功能,化学和生理特性,并能够利用荧光或发光技术等多种分子生物学工具。在代谢物-表观基因组和代谢物-基因组相互作用领域,研究工具主要包括染色质免疫沉淀后测序(ChIP-seq)和亚硫酸盐测序检测甲基化DNA等核苷酸测序方法。近年来,化学蛋白质组学开始被用于在体外研究代谢物-蛋白质和小分子-蛋白质相互作用,如热蛋白组分析、有限蛋白水解分析(Lip)和基于氧化速率的蛋白稳定性评估方法(SPROX)。除了体内和体外的筛选策略,基于计算机的预测方法也被用来评价代谢物的生物活性。例如,神经网络可以通过ChEMBL数据库中提供的小分子的活性、物理化学性质和结构信息的大数据集来训练。活性代谢物的筛选还可以从认知计算中受益。例如,使用自然语言处理Medline中现有的文献摘要以识别新的有害分子,如有毒物质,有助于功能阐述。


表1 活性筛选策略的一般原则

30052d1b21ef1d5cd6b71ff5b8bf402e.png



在体内和体外筛选技术之外,先进的、基于计算机的预测方法也可以用于评估代谢物的生物活性。使用神经网络,这种网络可以通过ChEMBL数据库中提供的小分子的活动、物理化学性质和结构信息的大数据集进行训练。利用这些信息来训练神经网络,可能会产生一种算法,能够预测从探索性代谢组学演变而来的数百种代谢物的可能生物活性。反过来,代谢组学数据可能会叠加在由神经网络产生的物理化学性质或不同功能基团等活性约束上,从而限制了实际的化学空间,最终必须进行体外和/或体内生物活性测试。另一个限制活性筛选候选代谢物是来自药物代谢,在药物代谢中,易于代谢激活的不同分子位点可以通过专门的和高度进化的方法来预测。


多组学整合筛选代谢物活性

除了纯代谢组学,多组学数据的整合和相关性也可以提供更多其他信息以改善代谢物的活性筛选。例如,候选代谢物可以与转录组学和蛋白质组学数据结合,通过推断它们在所选的感兴趣的通路的重叠情况来判断是否作为后续研究的关键通路。在不同的研究领域,从癌症代谢、植物生理学到微生物学,已经产生了多种由蛋白质组、转录组和代谢组数据组成的整合数据集。多组学整合的目的是通过定量建模来确定不同代谢物的活性,从而对特定通路进行针对性干预。为此,降低大量数据的复杂性是非常重要的。这可以通过多种数学方法来实现,例如,将代谢物和其他组学数据注视到通路中,或通过数据对新的通路和表达量进行建模。


在大多数研究中,多组学整合是基于与代谢物相关的基因,并结合已有的通路信息,如KEGG、Reactome、小分子通路数据库(SMPDB)和Biocyc,和平台如Recon和ChemRICH,或通过代谢物富集产生(如MetaboAnalyst)。采用通路分析的优点是降低数据的复杂性和过滤噪声。最近引入的代谢组学指导系统生物学方法集成了多组学数据:其他组学数据层面(基因和蛋白表达)映射到代谢组学衍生的非靶向通路活性代谢物;此外,还有基于网络和机器学习的方法已有应用。 


整合代谢组和其他组学层可能是一项具有挑战性的工作。必须充分考虑数据采集的稳健性、样本获取所引入的批处理效应,以及不同组学数据集的不同特征。多组学数据整合面临最重要的挑战包括噪声去除、数据预过滤、各种分子的匹配鉴定、数据降维方法的选择,选择用于获得组学数据的计算方法和数学模型,最后模型验证和进一步集成到跨组学网络模块。挑战还包括,由于技术限制(例如分析偏差导致代谢物覆盖率有限),代谢网络无法得到充分验证。代谢组学方面的一个限制是缺乏数据共享策略,不过目前也注意改进这点,例如建立MetaboLights和metabolomicsWorkbench等基于云的公共代谢组学数据存储库。 


活性代谢组学的应用

生物活性代谢物非常丰富,可以改变多种生物的表型,从相对简单的原核生物到人类细胞。因此,生物活性代谢物具有广阔的应用前景(图5a)。例如,代谢物可以被用于生物技术产品如百日咳杆菌毒素或大肠杆菌蛋白生产。哺乳动物微生物组也可以被小分子代谢物调控,或者反过来微生物来源的代谢物(如丁酸)能够被用于影响宿主的生理机能,包括免疫细胞和饱腹感。在免疫代谢新兴领域,前列腺素E2已被证明可以调节免疫应答。调控前列腺素E2的合成、降解和/或细胞反应可以作为一种治疗手段来驱动特异性免疫应答。在器官水平上,代谢物可以控制病理生理反应,如通过白三烯控制哮喘。在复杂生物体中,营养干预,如补充ω-3脂肪酸被证明有多重好处。ω-3脂肪酸可改善类风湿性关节炎患者病情或显著降低高甘油三酯患者的心血管事件。除了食物补充外,生物活性代谢物还可用于药理学和毒理学领域,以减少化合物毒性(如用乙醇降低甲醇中毒毒害,使用2-巯基乙酸钠清除特定化疗或扑热息痛中毒的毒性代谢物),或利用药物与内源性代谢物类的协同作用来提高治疗效果。即使是非常简单和便宜的代谢物,如谷氨酰胺,也可以用来治疗复杂的疾病如镰状细胞贫血症,该物质已进入III期临床试验。这些示例表明,利用生物活性代谢物来调节生物过程、诱导细胞代谢状态的变化(如驱动细胞活化、分化或增殖)以及驱动复杂的组织功能具有广泛的适用性。


值得注意的是,代谢物的作用是由环境决定的,与之相关的表型可能在很大程度上随所应用的生物系统而变化。α-酮戊二酸就是一个突出的示例(图5b)。在细菌中,它调节葡萄糖的代谢和摄取;在秀丽线虫中,α-酮戊二酸负反馈调节线粒体呼吸、ATP生产和自噬来延长寿命;在胚胎干细胞中,α-酮戊二酸通过调节组蛋白和DNA甲基化来调控干细胞多能性;在免疫细胞中,它通过调节mTOR信号并促进TH1细胞相关转录因子T-BET的表达,支持初始T细胞向Thelper 1 (TH1)细胞分化,从而调控TH1与调节T细胞(Tregs)之间的平衡。α-酮戊二酸还可结合GPCROXGR1(主要在肾中),促进盐转运蛋白的合成增加,驱动盐重吸收和调节盐平衡及血压。临床上,α-酮戊二酸被报道可通过ERK激酶等诸多过程来促进伤口愈合。


d8d883650201000e7338b3761c03d7e0.png

    

图5 表型调节的代谢物活性


结语

随着代谢组学变得越来越主流,代谢物可以作为表型的调控者,而不仅仅是表型状态的生物标志物的概念正在获得新的关注。这里引入活性代谢组学一词是为了描述如何利用代谢组学技术来识别生物活性代谢物,并强调代谢组学作为一种技术已经超越了单纯的生物标志物驱动方法。活性代谢组学的目标是为阐明代谢物上下游依赖关系提供框架。不过,目前活性代谢组学面临的挑战是将代谢体与生物体的表型状态以系统和定量的方式进行关联。这一目标需要生成全面的代谢组学和表型数据集,并以稳健的方法来整合多组学数据。活性代谢组学还需进一步增强其稳健性,可以通过计算整合代谢组学、系统生物学和生物活性数据,使我们能够识别最有潜力调节生物过程和细胞生理学的代谢物。这些技术的最终目标是将活性代谢组学作为系统发现生物活性代谢物的主要工具,而不是使用过度集中的方法(即化学蛋白质组学)或繁琐的方法(即分馏)。一旦通过鉴定调节系统表型的活性分子框架实现这一目标,活性代谢组学就有可能影响多个生命学科。

dac074d4a7f5e05da96a6bd7f3b331e1.png
END

即日起我们可以为客户提供无菌小鼠验证服务了!欢迎前来咨询!暑气不散场,迈维代谢&深圳净拓肠道菌群联合直播火热上线,7月1号开播。限时免费,欢迎报名!


99da3016e1e6f3e88df7978286db9477.jpeg

039e74882c7f82143b53afcc89ee52d4.gif

99%的代谢组学研究者都在阅读下文:

火热开播 |《九曲回“肠”:肠道菌群多组学研究上下游策略 》限时免费

肠道菌群&微生物专题

干货|水产方向终极研究宝典

高光时刻 | 活动仅10天!全新4D蛋白质组检测数量翻2倍价格仅需1/2

迈维云2.0生信实操SCI作图系列课

996a75f323f9b291e084199f8a4c24aa.gif

客服微信:metware888

咨询电话:027-62433042

邮箱:support@metware.cn

网址:www.metware.cn

我就知道你“在看”

248cd138ef1f8b06443d5d745bbb25e9.gif

发布需求
作者
头像
仪器推荐
文章推荐