分析测试百科网

搜索

分析测试百科网 > 行业资讯 > 微信文章

西湖欧米郭天南:AI赋能蛋白质组大数据,助力健康中国和疾病早诊

西湖欧米
2021.5.24

《癌症早筛KOL100》系列专访

第23期

                                                       

受访嘉宾简介:郭天南,博士、西湖大学特聘研究员、博士生导师、西湖大学蛋白质组大数据实验室负责人。于2006年获得华中科技大学同济医学院临床医学(七年制)和武汉大学生物科学双学位。2012年获得新加坡南洋理工大学博士学位。2012-2017年在瑞士苏黎世联邦理工大学Ruedi Aebersold教授实验室从事博士后研究。2017年初在澳大利亚悉尼大学儿童医学研究所ProCan任 Scientific Director,肿瘤蛋白质组Group Leader,悉尼大学医学院兼聘高级讲师。2017年8月加入西湖高等研究院任特聘研究员。长期从事蛋白质组学相关研究,并结合人工智能探索生物标志物(包括甲状腺癌、前列腺癌等)。

01

能否请您介绍一下西湖欧米的企业定位?

我们希望能做一个科技驱动的、基于组学的新技术公司,以蛋白质组为最初的核心技术,但是不限于蛋白质组,我们会逐步整合其他组学。目前来说所有的组学中蛋白质组学应该是最具有挑战性、技术难度最高的,成本也是最高的。我们希望能够通过优化技术、降低成本,产生出高性价比、解决实际问题的临床辅助诊断产品。

02

西湖欧米主要通过什么技术手段对蛋白质组学进行分析?AI和大数据能在其中发挥什么样的作用?

技术手段包括三个方面:第一,当拿到一个临床样本或者是一个生物样品,我们首先将它变成蛋白质组织,再变成多肽,这就是我们所谓的样本制备;第二,当有了多肽之后,我们用质谱把它变成数据,这就是电子化蛋白质组;第三就是蛋白质组的数据分析。

在这三个方面我们都会做两个层面的工作:第一个层面是做科学研究,即科研服务,比如药厂做新药研发时,提供降低新药研发成本,加快研发速度的建议;更重要的是,我们希望能够产生一个流程,一个低成本并且符合标准的、符合临床诊断要求的流程。这方面我们也有很多思考和布局,其中最关键的工具是质谱仪。

我们的目标是通过目前最好的技术切实解决临床问题,这个方案包含几个层面:一个是技术上的know how,我们所说的know how,是指通过很长时间的专业培训,知道设备如何去操作,如何产生高质量的数据,以及分享积累下来的经验,这个经验很难用一些指标去衡量。质谱分析很多人都想做,但大部分无法顺利完成,还有部分人可以做,主要是小分子质谱,相对来说技术门槛要低一些。实际上中国乃至全世界都有很多蛋白质谱,但不争的事实是,全世界大部分的蛋白质谱跟少数有经验的蛋白质质谱实验室相比,差距是比较大的。

大数据和AI主要用于数据优化、辅助建模和智能分析。临床样品的蛋白质组数据的积累至关重要,并且每一批数据具有独特性,对AI算法和模型的准确性具有决定性的影响。一般来说,高质量的数据积累越多,AI模型和算法的准确度也就越高。我们要做的是先积累足够的高质量蛋白质组大数据,然后去不断优化AI模型的准确性,为精准医学提供线索。

我们需要两条路线同时加强:一个是组学技术,另外一个就是AI。我相信有了足够大量的组学技术,就可以从中找到蛛丝马迹,通过AI来回答一些复杂的问题。生命的问题都是很复杂的,我们通常会人为地、片面地看待问题,比如只看一个基因,只看一个靶点,只看一个通路,或者只看一个器官。但实际上人体是个复杂的系统,所以我们需要主推大数据,然后加上AI技术智能地提供一些方案以辅助临床诊断。

03

公司在蛋白质组学临床应用方向上有哪些产品布局或研究探索?

目前进展最快的是甲状腺结节的良恶性诊断产品,我们已经做了三千多个样品,相关文章正在修订。同时我们收集了1000多个前瞻性的样品,并且计划做注册报证,一般正常的报证流程是3-4年,但是我们希望能够做得更快。

除了甲状腺结节的良恶性诊断产品之外,我们还有其他的临床转化在推进中,比如西湖大学蛋白质组大数据实验室和国内外多家医院和研究机构正在进行的针对卵巢癌、前列腺癌、大肠癌以及代谢综合征的合作等等。

上述合作目前都取得了不错的进展。同时,我们也有一些关于新冠疫苗和新冠的后遗症的研究正在进行。不同疾病的数据虽然不一样,但是它们的建模方法是相似的。西湖欧米希望建立工业化的流程促进临床质谱技术的转化推广。

西湖欧米还提出了一个青年医生支持计划,计划今年支持全世界在临床一线的50个青年医生,提供经费支持他们做一些研究,帮助他们一起寻找临床问题的解决方案。在一个多月内,已经有20多个青年医生联系我们,后续我们会进一步跟进完善。虽然我们是初创公司,但是我们希望建立一套蛋白质组学应用于临床的标准流程,并且鼓励更多的人参与到这个过程中来。

04

能否通过蛋白质组学分析实现肿瘤的早期发现?如果可以的话,会遇到什么挑战?

理论上是有可能的。血液、指甲、头发等都有可能用于早筛。目前的挑战主要是蛋白质组分析的成本太高,数据不够大,难以建立AI模型,这些都是相互制约的因素。我们现阶段的任务是先将技术做好,我们希望流程建好之后可以把筛查的成本降下来一个数量级,只要成本够低,我们就有可能用于大量人群样品,开发早筛模型。现在西湖实验室智能生物标记物实验室,正在计划参与到一些疾病的早筛中。

05

蛋白质组学相比其他组学有什么独特之处?为何发展落后于基因组学?

首先从生物学上来说,蛋白质比基因复杂很多。一个人从头到脚,从出生到死亡,基因组只有一个,30亿对碱基对。但是没有人可以回答,一个细胞中到底有几个蛋白质,比如皮肤细胞里面含有几个蛋白质,血红细胞里面含有几个蛋白质,没有人可以给出准确的答案。这完全是一个未知的领域,它不仅未知,同时高度复杂。蛋白质的复杂度要比基因要高出六个维度,在时间、空间、蛋白变体、蛋白质复合物、功能活性、生灭这些考量层面上都有着质的差别。

蛋白质本身的复杂性也让它的测量变得极其复杂,所以很多人认为蛋白质组测不准、测不了。但是我们现在在不断优化蛋白质组方法,希望实现每台质谱仪每天对数十个、甚至上百个样品进行蛋白质分析。当通量大幅提高后,我们就可以做很多我们之前想做而做不了的事情,尤其是在疾病早筛领域。

为了加快样本分析,西湖欧米在蛋白质质谱分析的稳定性和通量优化方面有大量的积累,做了很多工作。

06

在科研中,如何结合蛋白质组学与其他组学进行分析?

我们主要以蛋白质组学研究为主,我们的合作者有很多其他数据。比如图像数据,像甲状腺结节诊断就会有超声数据、病理切片的扫描照片,也有一些基因组的数据、转录组的数据和一些单细胞的数据。

怎么结合呢?我们是case by case,根据不同疾病的特征结合临床资料进行判断。遗传性疾病像唐氏综合征,可能基因测序就足以判断了,蛋白质只是看到下游的一些现象。但大部分的疾病是复杂的,我们很难通过基因测序准确做出诊断。比如甲状腺结节的良恶性诊断,科学家们已经做了十几年,目前FDA批准的最好的模型,也不太尽如人意。

根据这个情况,我相信再下一步我们就可以将蛋白质检测与基因测序、RNA测序、 B超的图像进行整合。

这都是我们的科研探索,如果要应用于临床诊疗,我们一定要做出病人可以负担得起的产品。一个产品非常好,但是很昂贵,那么受益面一定很小。当然它也会有自己的受众,但我们希望这个产品能够得到普及。

以甲状腺结节为例,每年有几十万人因此做手术,也有很多人因为结节而困扰。所以我们正在做一些基于蛋白质组大数据和AI的研究和产品开发工作,希望进一步推进甲状腺结节的精准诊断。

07

如何看待蛋白质组学的行业现状和未来?

就蛋白质组学而言,目前中国的研究做的很好;但是在底层还是相对弱势,因为蛋白质组学最核心的质谱仪主要依赖进口。目前国内没有非常成熟的质谱仪研发的生态链,有不少先驱们在研发生产质谱,但是目前,这些国产质谱同国外的质谱相比,在技术层面上仍有极大的差距。目前我国生产的质谱,还难以满足高通量、高精度、高灵敏度的蛋白质组检测的需求。

另一方面,中国也有很多优势,比如我们在现在在西湖大学开展的工作,还有北京、上海的一些实验室的前沿蛋白质组研究,在世界上其他地方就很难展开,尤其是临床应用方面,中国蛋白质组学有非常广阔的前景。

关于西湖欧米

西湖欧米创立于2020年7月,致力于将蛋白质组大数据与人工智能相结合,不断优化基于质谱的微量生物样本数字化技术,开发AI赋能的、基于组学大数据的临床辅助诊断新方法和新药开发,助力精准医学。

关于《癌症早筛KOL100》

《癌症早筛 KOL 100》访谈栏目由早筛网、基因谷、医世象联合出品、全网发布,本栏目旨在邀请国内外肿瘤领域的专家和企业领军人物从“产、学、研、医”的不同角度,分析癌症早筛的技术路径、临床转化和产业发展面临的机遇和挑战,为行业前行和百姓福祉指明方向。如果您(个人/机构)希望在《癌症早筛 KOL 100》访谈栏目分享精彩内容,请与我们联系:

早筛网 陈老师 13425578893

基因谷 张老师 15821074273

医世象 王老师 18701871600

为促进行业交流,早筛网建立了“癌症早筛行业交流群”,有意加入的读者可扫码添加管理员微信,请备注“姓名-单位-职位-城市”

发布需求
作者
头像
仪器推荐
文章推荐