Guideline丨真实世界研究指南2018年版(全文)
一.背景近年来,国内外对真实世界研究(Real World Study, RWS)的关注度日益增加。首先,从...
近年来,国内外对真实世界研究(Real World Study, RWS)的关注度日益增加。首先,从政策层面看,美国食品药品监督管理局(Food and Drug Administration,FDA)于 2016 年7 月 27 日发布《采用真实世界证据支持医疗器械的法规决策》草案,几经修订到 2017 年 8月 31 日发布最新版 [1] ,该指南表明了 FDA 对真实世界证据用于医疗器械法规决策中的态度。国家食品药品监督管理总局(China Food and Drug Administration, CFDA)也于 2017 年10 月 8 日出台了《关于深化审评审批制度改革鼓励药品医疗器械创新的意见 [2] ,提到为满足临床急需药品医疗器械使用需求,加快审评审批,允许可附带条件批准上市,上市后按要求开展补充研究,此类补充研究也可部分归属于 RWS 范畴。
其次,从医疗大环境看,医疗大数据的构建给 RWS 提供了前所未有的便利。各级医疗机构、医保部门、医药监管部门积累了大量的医疗数据,各级数据库的电子化,以及各种电子设备的普及,各级数据库平台的建立,极大地增加了利用高质量数据进行真实世界研究的可能性。另外,患者、医生、医疗保险提供方、监管者以及政策制定者都在努力寻求各种来自于特定人群药品使用的准确信息。而 RWS 则将成为药品临床应用、医保制定、决策制定等各方参考的重要依据。
虽然 RWS 越来越多受到各方的重视,但因目前大多医疗数据分布零散,没有进行系统性收集和结构化处理,RWS 所需样本量相对较大,数据异质性强,混杂和干扰因素多,对研设计和统计方法的要求比传统研究更高。更重要的是,我国目前尚没有系统性的指南对 RWS 提供建议和指导,故如何帮助中国研究者更好地开展 RWS 研究,提高 RWS 质量,是编写本指南的初衷。本指南为国家重点研发计划项目(项目编号: 2016YFC1303800)和国家公益性行业专项(项目编号:201402031)。
二.几个重要概念的关系
1. 真实世界证据与真实世界数据
真实世界数据不等同于真实世界证据。真实世界数据通过严格的数据收集、系统的处理、正确的统计分析以及多维度的结果解读,才能产生真实世界证据。美国 FDA 在评估真实世界数据能否成为真实世界证据时需要看其数据的质量,包括真实世界数据与其结果的相关性以及可靠性等 [1] 。2. 真实世界研究与随机对照临床试验
RWS 是对临床常规产生的真实世界数据进行系统性收集并进行分析的研究,与随机对照临床试验( Randomized Controlled Trial, RCT)是互补的关系,并不对立。RWS 和 RCT 一样,都需要科学合理的研究设计,研究方案以及统计计划。另外判断 RWS和 RCT的标准不是试验设计和研究方法,而是研究实施的场景 [3] 。RWS 数据源自医疗机构、家庭和社区等,而非存在诸多严格限制的理想环境。RWS 与 RCT 相比,各具特点,详见表 1:三.真实世界研究的思路与流程
RWS 的开展须从临床问题的确定、现有数据情况的评估切入(采用既往回顾性数据或是前瞻性采集数据,进一步到研究设计的选择以及统计分析方法的确定、数据的管理、统计分析、结果解读和评价、以及根据需求判断是否加入事后分析(Adhoc analysis)等步骤(见图1)。由于 RWS可能存在一些内在的偏倚 (Bias),这些偏倚可能限制了真实世界数据在因果关系上的推理和解读。因此,为了减少潜在的偏倚,需要谨慎而周密的研究设计,并且应该确定研究问题后尽早开始制定研究方案和统计分析计划。四.临床问题的确定和研究设计常见类型
RWS通常会围绕着病因,诊断,治疗,预后及临床预测 [4] 等相关的研究问题展开。病因研究主要是研究危险因素与疾病之间的关系,并研究引起人体发病的机制,如研究幽门螺杆菌感染与十二指肠溃疡的关系。诊断研究主要是研究某类新方法对特定疾病诊断的准确度研究,以判断新诊断方法的临床价值。治疗性研究主要是研究某类治疗方案对特定疾病的疗效及副作用研究。主要包括两方面:① 治疗方案对特定疾病的疗效研究;②治疗方案的不良反应研究。预后研究是对疾病发展的不同结局的可能性的预测以及与影响其预后的因素研究,主要包含三大类: ① 对疾病的预后状况进行客观描述;② 对影响预后的因素进行研究; ③ 对健康相关生活质量的研究。临床预测研究则是寻找出最佳的对疾病诊断或疾病转归的预测指标或症状等,主要包括诊断预测研究和预后预测研究 。除上述研究外,RWS 也会涉及药物经济学研究等其它研究类型。
RWS 包括观察性研究和试验性研究。其中观察性研究进一步分为描述性研究(病例个案报告、单纯病例、横断面研究)和分析性研究【(巢式)病例对照研究、队列研究】,试验性研究即实效性临床研究(Pragmatic randomized clinical trial,PRCT)。除此以外,一些新型的研究设计如病例交叉设计和序贯设计等也被用在基于现有数据的研究中。下表是常见研究类型对应的临床应用场景及优劣势比较,供参考。
五.基于不同数据源的研究要素
1. 基于现有数据
1.1 现有数据利用
现有数据主要包含电子病历(electronic medical record, EMR),电子健康档案(electronic health record, EHR),医保数据(claims data),出生死亡登记,公共健康监测数据以及区域化医疗数据等,这些数据数量非常庞大,但由于数据的采集并非为某特定研究目的而设计,数据分散,异质性高,数据的完整性及准确性也存在一些问题。另外医保数据一般由各级政府机构掌握,可及性较弱。
1.2 数据可行性评估
数据可行性评估首先基于待研究的临床问题,确定主要研究变量比如待研究的治疗措施,关键基线信息,主要研究结局包括患者主要人口统计学特征、患病史、并发症、合并症和实验室指标等关键数据是否存在;其次对缺失数据的数量和类型的影响进行全面评估,包括主要研究变量及其他相关研究变量,可以通过抽样或全数据集来检查关键变量的数据缺失程度和模式来实现。另外还需进行数据质量评估:包含数据的准确性,可靠性,完整性及可溯源性等评估。
1.3 研究设计的考量
- 研究人群和入排标准
- 暴露因素和研究终点
- 样本量
- 统计方法的考量
另外,利用已有数据库开展的预测研究也是常见的 RWS 类型之一,是对疾病各种结局发生概率及其影响因素的研究。传统的统计方法包括 Logistic 回归和 Cox 回归以及列线图(nomogram),可以用来预测疾病转归或者并发症的发生概率;另外,近年来发展出的基于真实世界大数据的机器学习(machine learning)的方法也是用于预测研究的常用工具。
- 处理缺失数据
使用电子 EHR、EMR 或者医疗保险等数据源会出现不同的问题。由于研究者往往无法采集额外的数据,因此研究前数据可行性评估是非常重要的环节。例如,对于临近死亡的患者,症状可能记录不完整,而这种缺失信息可能使这些患者的相关数据看上去比实际状况更健康而造成研究偏倚。有时数据的缺失并非随机的,如果忽略缺失数据的内在规律,那么会丢掉重要的信息。对于缺失数据,在能够溯源的情况下,则尽可能补全相应缺失数据;对于无法溯源的情况,则展开探索性分析,明确缺失值在各个研究因素中的分布情况,判断其分布是否随机,如有偏倚,则需考虑后期分层分析。
1.4 其他常见问题
- 不同数据库整合的问题
- 分子标记物相关研究的注意事项
基于已有数据库的回顾性研究需要考虑患者的基线特征和代表性的问题,由于缺失的生物样本而导致的数据缺失,多重检验导致的“假阳性”结果,数据分析和结果解释中的偏倚,以及研究结果是否具有可重复性等。
前瞻性的研究则需考虑,可能有生物样本但是没有详细的患者基本信息的情况;样本量小, 且患者人群缺乏代表性;实验检测方法是否经过验证;有分子标记物测量结果,没有或仅有有限临床结局数据(如总生存率, 无进展生存期等)的情况;临床数据或者研究终点数据的质量等。
- 用数据库开展研究,知情同意和伦理审批的相关事宜
知情同意是保证研究符合伦理要求的一个重要环节,它是一个持续的完整过程,保护受试者权益。因真实世界研究多不是预设方案,尤其是回顾性研究,收集的大量信息多属于历年数据,且涉及到对大规模病例或是生物样本数据进行研究,所以获得每一位受试者同意其数据用于临床的研究有很大的挑战。如果经伦理审查,认为课题研究不大于最小风险,且研究者使用受试者数据不会对患者造成不利的影响和受试者重要隐私信息的泄露,一般可考虑免除知情同意 [6,7] 。知情及伦理的相关具体要求需根据各伦理委员会的实际要求而定。
2. 基于前瞻性数据
2.1 前瞻性数据
前瞻性数据主要包括如临床试验的补充数据,PRCT,注册登记研究(Registry),健康调查,公共健康监测等,该类数据在收集之前已确定具体的研究目的,需要收集的数据也很明确,故数据比较规范比较标准,完整性准确性比较好。
2.2 研究设计的考量
基于前瞻性数据的 RWS 一般采用队列研究的设计,队列研究的展开首先起始于要研究的问题,基于健康结果的病因或者风险因素的假说,通过对研究对象的追踪,观察不同群组健康结局的发生情况,进而建立暴露因素和健康结局的联系。
临床研究中,往往有计划地招募患者参加,进而随访患者疾病的复发、好转、痊愈、死亡等,研究不同的治疗或者某些疾病特点是否和不同疾病结局的相关关系。前瞻性队列研究的样本量和随访时间同样重要,研究的样本量越大,随访的时间越长,观察到的健康结局数量越多。开展前瞻性队列研究的主要考虑因素有以下几点:
- 研究人群的选取
- 基线调查的研究内容的尽量丰富完整
- 样本量和研究深度的平衡
- 提高患者依从性,长期随访患者
- 充分知情:患者脱落或失访的两个常见原因分别是不良反应或频繁检查, 让患者充分了解研究流程,提前告知可能不良反应并进行相应预防措施可有效提高患者依从性。
- 人文关怀:研究过程中的医患互动,可以发放健康信息,更新研究结果等,争取患者的配合;可帮助患者及时解决研究中碰到的相关问题,增强医患间的相互了解,提高患者依从性。
- 定期提醒:定期系统或人工提醒可提高患者用药及访视的依从性。
- 多种沟通方式:保留患者及家属多个长期的联系方式,包括住址,手机,微信,电子邮箱,线上等,并及时更新,可有效避免患者换号后导致的失访。对于失访的患者,也应在不同时间段电话或者通过其它联系方式争取,减少失访。
- 失访及缺失数据考量
失访是前瞻性队列研究的一个重要问题。在研究随访期间,某些研究对象由于各种原因不能或不愿意,或者死亡等原因不能继续参与研究。在需要长期随访的研究中,失访发生的可能性更高,需要更加重视。一般来说,失访低于 5%的时候,引起的偏倚比较小,但是失访超过 20%的时候,就必须加以重视和分析。如果失访的原因与暴露因素和研究结局有关联,即便是
关注 中医药知识服务平台
微信扫一扫关注公众号