生物信息学分析 Bioinformatics analysis
生物信息学是一门随着生物学的发展特别是系统生物学的发展而发展的科学,为后基因组时代的研究提供了更快、更新、更准确的研究手段;为后续的深入研究提供了方向,同时也是取得有说服力的研究成果的关键因素之一。
统计分析
1、多元统计分析
PCA:主要用于质控,分析不同组样本的聚类情况是否吻合实验设计,并且QC样本聚类情况来揭示实验过程中的稳定性。
OPLS-DA:主要用于得到VIP值。主要运用再筛选差异代谢物。
2、火山图:对差异蛋白或代谢物做一个直观的展示,蓝色为显著下调,红色为显著上调
3、 热图:直观展示检测得到代谢物或蛋白的丰度在不同样本中的分布情况
4、相关性分析:揭示检测结果中的物质之间的相关性
5、随机森林分析:随机森林算法是机器学习、计算机视觉等领域内应用极为广泛的一个算法,它不仅可以用来做分类,也可用来做回归即预测,随机森林机由多个决策树构成,相比于单个决策树算法,它分类、预测效果更好,不容易出现过度拟合的情况、
6、 ROC分析:用于分析某个分子标志物的区分能力。
生信分析
1、GO富集分析
BP:Enriched Biological Process
CC:Enriched Cell Component
2、KEGG富集分析
kegg富集柱状图
个别通路图
3、 PPI互作分析:每个圈代表一个蛋白,方框代表通路
4、气泡图:取前20个富集效果最显著的通路做气泡图,每个圈代表一个通路
技术的优点
1、分析结果全面、美观,可用于论文发表
2、提供统计分析:PCA、PLS-DA、热图聚类等
3、提供生信分析:GO富集、Pathway通路筛选、蛋白互作等
4、全面的单组学及多层组学整合的生物信息学分析服务,同时提供中英文双语报告(仅实验部分),分析的图片及文字描述可用于论文的发表。
5、完善的售后服务,协助客户完善发文并及时解决客户的疑难杂症。
实例分析
肝脏线粒体功能的系统蛋白质组学研究
基本信息
材料:肝脏 主要技术:SWATH蛋白质组,LC-MS代谢组,基因芯片
期刊: Science 影响因子:37.205
文章摘要
过去的二十年中,在“组学”技术不断驱使下,确定遗传学,分子通路以及整体表型之间关系的分析能力越来越强大。然而尽管取得了上述进展,影响复杂性状的大多数遗传因素仍不清楚。文章以肝脏线粒体复杂分子复合物装配为例,作为电子传递链中的一个重要组成部分,目前对此的认识极为有限。为探究复杂性状下的分子机制,文章联合转录组,蛋白质组,代谢组以及各组学之间的数据综合分析。80组共386只不同性状的BXD小鼠的研究共检测到25136条转录本,2622种蛋白,981种代谢物。在检测到的2600中转录-蛋白对中,85%有定量信息的性状位点是由转录组学或蛋白质组学检测得到;基因型和性状之间的复杂关联通过多组学数据综合构建。
方法流程
小鹿推荐
最新的质谱技术扩大了蛋白质组学和代谢组学测量的范围和可靠性。这些工具现在能够识别成千上万不同的因素驱动的分子途径,机制,以及由此产生的表型,从而大大有助于理解复杂系统。另外通过多层面的组学研究更有利于揭示基因型和性状之间的复杂关系,单一组学研究具终有局限性。另外,文章中最突出部分在于数据整合与分析。分析结果完整,新颖,可信度高。以上是文章能够获得高分的主要因素。
文献来源
Evan G. Williams. et al., Systems proteomics of liver mitochondria function. 2016, Science.