上期我们介绍了为什么要在网络药理学中利用中药代谢组来对中药饮片、复方进行检测的原因,本期我们就具体来看一下,利用中药代谢组获得物质之后如何进行第一步的成分筛选。
本次使用的网站:
TCMSP(https://old.tcmsp-e.com/tcmsp.php)
该网站最后的更新时间为2014年,其中包含有中药物种502个,包含中药成分13729个,包含成分的靶标3339个,以及对应的疾病867种。
#1
数据库功能
1.通过物种名称查询相关物质、靶点、疾病
2.通过物质查询相关靶点、疾病
Tips:关于如何一键下载所有靶点
在浏览器中输入“josn转excel”选择“在线小工具:JOSN转Excel”;
点击进入网站后,点击网站上方的“进入”按钮,正式进入转换页面;
回到TCMSP网站查询页面,鼠标右键点击出现工具栏,点击“查看网页源代码(也可能显示的是查看源文件)”,点击进入;
向下拖动内容,查看到第一个data字样,这一部分的内容代表的是陈皮中所含有的成分列表,接下来第二个data字样,这一部分内容代表的是陈皮中成分所对应的靶点,选中该部分内容(从“[”开始到“]”结束),进行复制,粘贴到josn网站中,点击“导出Excel2003”,即可获得最终的所有内容。
#2
筛选成分靶点(结合uniprot进行target转symbol)
在TCMSP网站中利用OB和DL对成分进行筛选(一般筛选标准为OB≥30,DL≥0.18),将筛选得到的物质进行target汇总(可以利用从网页源代码中获取的某个物种所有的靶标进行筛选,也可以单个物质进行复制导出)【该部分的内容后续需要结合中药代谢组再进一步的分析】
①以中药材“三七”为例,经过OB≥30,DL≥0.18条件筛选之后,一共获得8个物质;
②对这8个物质的靶点进行筛选,可以得到如下结果,其中只有7个物质有对应的靶点;
③结合uniprot进行target转symbol
首先将uniprot上的target和symbol信息下载下来,下载格式选择为excel格式;
下载完成后首先对uniprot中的格式进行调整,去除protein和gene部分的补充名称(利用分列工具去除多余的描述,利用TRIM函数去除空格),以免影响后续的匹配;
处理前的数据:
处理后的数据:
最后利用VLOOKUP函数将由TCMSP中获得的靶点与uniprot进行匹配,转换target为symbol,
转换结果如下:
删除掉NA数据,得到最终的转换结果
从三七的预测结果中,我们会发现,单独只依赖于TCMSP数据库筛选得到的物质只剩下槲皮素,但是这个物质在很多植物物种中都存在,结果必然会导致中药研究的同质化。因此结合中药代谢组学的方式获取到更多的成分及含量差异,有利于得到更加准确的预测结果。
公众号对话框回复“TCMSP数据库信息”即可得到完整版本的TCMSP数据库包含的物质信息表格。
本期关于利用TCMSP数据库获取我们想要的信息到这边就结束了,下期我们一起来看下如何利用其他数据库获取成分靶点信息。
精彩合集,欢迎收藏
99%的代谢组学研究者都在阅读下文:
客服微信:metware888
咨询电话:027-62433042
邮箱:support@metware.cn
网址:www.metware.cn
我就知道你“在看”