“究竟什么是数据可靠性?
如何去评估数据可靠性?
我们要怎么做,才不会被认为"数据管理有风险?”
带着这些问题,请您跟随小林一起踏上数据可靠性之旅,探究数据可靠性的神奇奥秘。在本期,我们首先对数据可靠性的背景知识和相关术语进行简单介绍。
1995年 美国食品药品管理局(FDA)首次将数据可靠性(Data Integrity)定义为数据的全面性、一致性和准确性。 | |
2010年 前国家食品药品监督管理局发布了新版的药品生产质量管理规范。 |
2011年 前食药监局正式发文,明确要求新版 GMP 自2011年3月1日起开始实施。 | |
2015年 英国药物和保健产品监管机构(MHRA)发布制药行业数据可靠性方面的指南《GMP数据可靠性定义和行业指南》,明确阐述数据可靠性应贯穿数据的整个生命周期,同时提到了数据管理的ALCOA原则。 |
2016年4月 美国食品药品管理局(FDA)发布了《数据可靠性与cGMP合规行业指南(草案)》。 | |
2016年5月 WHO世界卫生组织正式发布《良好数据和记录管理实践指南》。 |
2016年9月 前国家食品药品监督管理总局发布《药品数据管理规范》(征求意见稿)。 | |
2017年8月 前国家食品药品监督管理总局发布第二版《药品数据管理规范》(征求意见稿)。 |
2018年1月 前国家食品药品监督管理总局(现国家药品监督管理局)发布第三版《药品数据管理规范》(征求意见稿)。 | |
图1 各国的数据可靠性指南
在回顾数据可靠性提出及完善的过程中,我们可以发现许多专业术语诸如 ALCOA 原则,元数据,计算机化系统确认和验证等,也有人会问我们平时都说的是数据完整性,为什么您一直提的是数据可靠性呢?有什么区别吗?
别急,且听小林一一道来。
什么是 ALCOA 原则?
首先,通俗的讲,ALCOA原则就是用来评估数据可靠性的基本原则,它包含Attributable(可归性)、Legible(清晰易读)、Contemporaneous(同步)、Original(原始性)、Accurate(准确性)五大原则。
同时根据GCP的要求,对ALCOA原则进行补充,又提出了CCEA原则,也称为ALCOA+ 原则,即Complete(全面性)、Consistent(一致性)、Enduring(持久性)、 Available(可用性)。
ALCOA+CCEA原则实际上就是对记录生成/录入、修改、存储、检索、备份、恢复和输出等数据生命周期内的所有操作的要求。如果数据的管理满足了以上原则,我们就可以认为该数据记录满足数据可靠性要求,这部分内容我们会在下期详细阐述。
图2 数据可靠性要素
什么是元数据?
元数据(Meta Data)和原始数据(Raw Data)的区别在哪里?
以下图为例,在一个阳光明媚的清晨,我们开心地驾着车,聊着天,哼着小曲,来一场说走就走的旅行,结果被判定超速了!当我们拿到罚单的时候,心中的郁闷可想而知。但是,心里又抱有一丝的幻想,万一摄像头出故障了呢?万一没超速呢?
图3 原始数据和元数据的区别
于是我们来到交警队要求调取监控录像进行复核,当交警调出左侧监控画面的时候,我们肯定是不服气的,凭什么你说68km/h 就一定是68km/h呢?我要更多的证据!当交警再调出右侧监控画面的时候,我想大部分人的反应就是得嘞,还说什么呢?乖乖交罚款呗!
为什么会有这么大的反差?关键在于第二幅监控画面上侧清晰的标明了当时的车速、时间、地点,上一次测速以及摄像设备的校验时间等,如果说左侧画面代表的是原始数据,右侧画面则代表的是元数据,也就是描述数据特性,并提供背景信息和含义的数据。
我们需要明确的一点是,GMP 审计追溯的是元数据,它要求可以再现该 GMP 活动的关键信息(例如对于 GMP 相关数据的修改和删除)。
数据完整性?数据可靠性?
也有人问为什么我们平常提的都是数据完整性,你这里怎么叫 数据可靠性?您这话问的也没错,2016年之前,国内一直将 Data Integrity 翻译为数据完整性。而在2015年底,前国家食品药品监督管理总局邀请各方专家开会讨论,一致认为数据可靠性相比数据完整性,更能体现出数据的真实性、可信任度、安全性、可追溯性,所以自2016年6月起,官方文献就统一称为数据可靠性了。
本期,我们主要就数据可靠性的背景知识和相关术语进行了简单的介绍,在下一期,我们就如何评估数据可靠性以及确保数据可靠进行详细论述。什么?还有人问 WHO 什么意思? 您还是百度去吧!
八年QC实验室摸爬滚打,长期研究数据可靠性相关法规,外表老干部实则热情奔放,欢迎留言~