引入GRADE制定中医药国际标准的思考与实践

刘为民1刘保延2何丽云1孙涛3 姚乃礼2黄宝斌4 朱嵘3李丽慧3  文天才1

罗文舒  张艳宏1  王天芳5王佳佳宋丽娟李幼平7吴泰相7

(1中国中医科学院中医临床基础医学研究所 北京100700)

(2中国中医科学院 北京100700)

(3中华中医药学会亚健康分会 北京 )

(4世界卫生组织驻华代表处 北京100600)

(5北京中医药大学 北京100029)

(6国家中医药管理局国际合作司  北京100026)

(7中国循证医学中心 成都 610041)

 

摘要】:推荐等级的评估、制定与评价(GRADE)是国际统一的证据质量分级和推荐强度标准,它综合考虑研究设计、研究质量、研究结果的一致性和证据的直接性、利弊平衡、资源配置、结局指标的重要性,并认为观察性研究也是重要的证据来源,它是循证医学发展的里程碑。本文介绍了GRADE的来源及其理论框架、阐明了建立亚健康国际标准的必要性和步骤、方法,提倡采用GRADE制定亚健康的国际标准。同时,我们主张将GRADE引入中医药临床评价,进一步发展中医药临床评价体系,推动中医药的现代化、国际化。

关键词:证据质量,循证医学,标准

 

Thinking  And  Practice  On  Grading Of  Recommendations Assessment ,Development And Evaluation In Developing International Standard 

 

LIU Weimin1, LIU Baoyan2, HE Liyun1, SUN Tao3, YAO Naili2,HUANG Baobin4, ZHU Rong3, LI Lihui3, WEN Tiancai1, LUO Wenshu1,ZHANG Yanhong1, WANG Tianfang5, WANG Jiajia5, SONG Lijuan6, LI Youping7, WU Taixiang7

1 InstituteOf Basic Research In Clinical Medicine, China Academy Of Chinese Medical Sciences, Beijing 100700, China

2 ChinaAcademy Of Chinese Medical Sciences, Beijing 100700, China

3 Subhealth Branch, Chinese Association Of Chinese Medicine ,Beijing, China

4 World Health Organization  In China, Beijing100600

5 Beijing University  Of Chinese Medicine ,Beijing100029, China

6 Department Of International Cooperation, State Administration Of Traditional Chinese Medicine ,Beijing100026, China

7 Chinese  Evidence based Medicine Center, Chengdu 610041

 

Abstract: Grading of recommendations Assessment ,Development and Evaluation is a international standard  regarding to study  design,  study quality ,consistency ,directness, balance between desirable and undesirable effects, resource use , importance of outcomes. According to it , observational study is also important resource of evidence .  It becomes the milestone of  Evidence Based Medicine . Our article introduces  the origin and framework of GRADE , represents  the necessity , procedure, methods in developing  international sub-health  standard .Meanwhile ,we advocate to use  GRADE in TCM clinical evaluation ,thus  promote the modernization and internationalization of Traditional Chinese Medicine..

Keywords : Quality  of Evidence ,  Evidence based Medicine,Standard

 

循证医学意为“遵循证据的医学” ,著名临床流行病学家David Sackett教授将其定义为“慎重、准确和明智地应用所能获得的最好研究依据来确定患者的治疗措施”。一段时期以来,循证医学通过大规模、随机、对照研究来评价治疗方案的有效性和安全性,以及对患者长期预后的影响。它主要以证据强度最高的随机对照试验(RCT)为基础进行meta 分析。而中医药学强调辩证论治、个体诊疗。在RCT未大规模开展的情况下,引入循证医学系统评价的方法是否符合中国中医药国情一度是众多研究者激烈争论的话题。

中医药强调针对个体进行辨证论治,体现真实世界的个体化的辨证论治。它遵循“从临床中来,到临床中去”的规律。体现在研究的设计上,多归属于观察性研究等传统意义上的低质量研究。观察性研究又称非实验性研究或对比研究,确切地说应是非随机化对比研究。该研究的研究者不能人为设置处理因素,同时受试对象接受何种处理因素或同一处理因素的不同水平也不是由随机化而定的。如何针对该特点进行临床评价成了重要问题。

  • GRADE来源及其理论框架

随着循证医学的发展,2000 年包括WHO 在内19 个国家和国际组织共同成立了推荐等级的评估、制定与评价[1](The Grading of recommendations Assessment ,Development and Evaluation, GRADE)工作组,由67 名专家通力协作,制定出国际统一的证据质量分级和推荐强度标准,2004年颁布。主要内容见表1

 

表1 研究中每种主要结局指标的证据质量[2]

 

 

观察性研究

证据质量

随机对照试验

相关性极强,没有影响有效性的主要因素

研究质量没有严重问题

 

强相关、存在一致性,没有似是而非的混杂

设计或执行有严重问题,或者为准试验设计

研究质量没有严重问题

设计上或执行时有很严重的问题

设计上或执行时有很严重的问题

非常低

设计上或执行时有很严重的问题

降低研究质量的影响因素有:结果严重不一致;直接性不确定;高度可能存在报告偏倚;

稀疏数据;对于直接性如果存在较大的不确定性可能降低证据质量两个级别

其他影响质量的因素有

可能存在着混杂,降低观察效应;存在着剂量--反应梯度

 

 

  • 将GRADE引入中医药临床评价的思考[3-7]

GRADE突破了过去主要从研究设计角度考虑证据质量的局限性,综合考虑研究设计、研究质量、研究结果的一致性和证据的直接性。除随机对照试验外,观察性研究也是重要的证据来源。观察性研究一开始被归为低质量,但若某干预措施疗效显著;证据显示存在剂量效应关系;存在各种可能导致疗效显著性降低的偏倚时,观察性研究证据的等级将可能提高。高质量的观察性研究对于有效性和安全性的评价也具有重要意义。同时,它明确定义了证据质量和推荐强度,即证据质量指在多大程度上能够确信疗效评估的正确性;推荐强度指在多大程度上能够确信遵守推荐意见利大于弊。它注重从使用者而非研究者角度制定标准,拓宽了应用范围,并随时更新。推荐意见将根据当前可得证据的3 种结论(肯定,否定,不确定),简化为强弱两级。它清楚评价了不同治疗方案的重要结局,对不同级别证据的升级与降级有明确、综合的标准,从证据到推荐全过程透明,明确承认患者价值观和意愿,就推荐意见的强弱,分别从临床医生、患者、政策制定者角度做了明确实用的诠释。同时,GRADE认为,研究的设计并不是决定证据等级和推荐强度的唯一标准。其影响因素是多方面的。侧重从临床实际中考察。强调研究质量、一致性。强调患者的接受程度。

GRADE 强调对于结局指标的评价,按照重要性的不同,将其按照0-9分进行评分,并侧重对于重要和关键结局指标的评价。GRADE 还可以用于诊断性试验中。客观评价诊断指标的敏感性和特异性,有助于对于诊断指标的选择。本研究团队在艾滋病和亚健康的研究中,引进并自行研制了量表和PRO量表,观察终点结局指标的变化,突出中医证候学特点,同时进行多项生物学指标的检测,初步建立了艾滋病和亚健康的评价指标体系。在进行大样本的量表的信度、效度、反应度研究之外,下一步可以参考GRADE对于结局指标、诊断指标的评价方法,客观评价中医药诊断、治疗的指标体系。

GRADE 同时重视收益和费用的平衡问题, 督促合理的资源配置。促使中医界引入了卫生经济学的评价方法,客观进行中医药干预的成本效益、成本效果分析。

GRADE 提倡在充分权衡不同治疗方案利弊基础上的利弊平衡,更能凸现中医特色和优势。干预措施的“利”包括降低发病率和病死率、提高生活质量、降低医疗负担和减少资源消耗等;“弊”包括增加发病率和病死率、降低生活质量或增加资源消耗等。与常规西医治疗相比,中医药治疗具有副作用小、使用方便、又廉价,利大于弊,能够凸显中医简、便、验、廉的特点,合理评价中医优缺点。

GRADE 重视患者价值观和意愿。提倡对患者意愿进行调查,根据调查情况决定推荐强度。临床医生必须确保对患者的治疗应符合他们的价值观和意愿。这和中医药学以人为中心的思想是一致的。

当然,近年来,随着临床流行病学的普及,中医界也开展了一系列的随机对照试验。如何对其进行客观评价也是很重要的。GRADE 认为,随机对照试验并不一定意味着证据等级最高。在GRADE 中,基于RCT 得出的证据一开始被定为高质量,但我们对该类证据的信心可能会因为下面5 个因素而降低:研究的局限性;研究结果不一致;间接证据;结果不精确;报告有偏倚。在电话访谈中,我们发现很多标明为随机对照试验的中医临床研究并不是真正的随机,将随机等同于随意,或者采用半随机的方式进行随机,或者随机遭到人为破坏,未做到随机分配方案的隐藏,盲法难以实施、两组基线不均衡,执行随机过程中患者依从性降低甚至导致失访、随机对照试验难以开展等等问题。针对中医药学特点,我们尝试多种随机方法,如最小化随机、多重随机、中央随机、区组随机、患者意愿随机。并引入了实用随机对照试验,对随机中出现的问题进行梳理,注意执行过程中的一致性。注意患者意愿。这是与GRADE的理念一致的。

三、采用GRADE制定亚健康的相关标准

1建立亚健康国际标准的必要性

当前,由于世界范围内医疗费用的持续增加,各国政府都在积极寻求措施,切实改善国民的健康状况,以期降低医疗支出。与此同时,随着经济发展和社会进步,人们对健康的追求越来越高,认识水平也在发生深刻变化,“亚健康”的概念由此应运而生。由于亚健康本身就是介于健康与疾病的中间状态,因此,亚健康的防治对于维护人类健康具有极其重要的战略意义。中医学在长期的发展过程中形成了较为完整的预防思想和有效的防治原则。中医学“治未病”包括未病先防、既病防变和愈后防复,是干预亚健康的基本原则。一方面,通过养神健体,防止亚健康的发生;另一方面,可以对亚健康早期干预,阻止其向疾病转变,同时对疾病痊愈后进行有效干预,防止复发。因此,中医学“治未病”对于亚健康的防治具有独特优势。在21世纪,人类卫生医疗工作将实行预防性健康策略防治亚健康状态是重点之一。处于亚健康状态的人群往往伴随着一系列的主观不适感觉和生活质量的下降,用客观的方法评估亚健康人群的主观感受十分困难,使用正确和恰当客观的方法和手段对中医药干预亚健康的评估是十分重要的,目前,中国很多地区、机构都在开展亚健康的研究,也进行了一些大样本的流行病学调查和干预效果的评价研究,但如何在研究过程中建立亚健康相关标准是目前急需解决的问题,我们拟建立中医药干预亚健康相关标准和评价体系,据此对干预结果做出客观评估。

2发展GRADE体系,建立亚健康国际标准

GRADE适用于制作系统评价、卫生技术评估及指南、标准。该标准代表了当前对研究证据进行分类分级的国际最高水平,意义和影响重大。包括WHO 和Cochrane 协作网在内的28 个国际组织、协会已采纳GRADE 标准,成为证据发展史上的里程碑事件。世界卫生组织在所制定的指导指南制定的指南中推荐使用GRADE,并已经采用GRADE 标准制定了甲型流感H1N1的指南。[8]采用GRADE建立指南的步骤[9]包括:1)建立相应程序:区分问题优先次序,选择专家小组,明确利益冲突,同意按照专家组步骤进行。2)系统评价,对于所有重要结局的可能获得的最佳证据进行系统评价。3)对于重要的结局指标准备足够档案资料。 对于每个亚组,准备足够的档案资料。其结果要根据系统评价结果而定,而且应该包括质量评价和研究结果的总结。4)对证据质量和推荐意见的强度进行分级,评价每一结局指标证据质量。5)评价结局指标的相对重要性。6)评价总体证据质量。7)平衡收益和风险。8)平衡净收益和费用。9)确定推荐强度。10)实施和评价。

我们在世界卫生组织的资助下,主要采用GRADE 体系,建立世界卫生组织亚健康标准。

3 具体步骤

1)文献检索数据库选择:选择公认的医学文献数据库CNKI、MEDLINE、重要的专业协会数据库、手工检索的期刊、会议论文、研究报告、会议记录等。

2)文献年代与范围:来源于近20年内国内外以亚健康、sub-health相关为主体的文献。

3)检索内容:①亚健康的病因病机、病邪特性、临床分期、中医四诊、辨证方法、辨证分型、治则治法、有效方剂、中药等内容。②包括不同干预措施如膏方、敷贴、刮痧、拔罐、艾灸、砭石、足部按摩、脊柱按摩、全身按摩、凉茶、中药药浴、药酒、中成药进行的临床研究文献。

4)制定研究文献纳入标准及证据筛选表,由两名独立的系统评价员定期随机筛选摘要,不同意见,由第三者协调解决。

5)综合分析与证据提取:按专题将证据的摘要汇总、综合为证据表,包括: 作者及资料来源、发表年份、研究类型、研究的质量等级、样本数、干预组或对照组情况、临床结局、效应量、置信区间或P值、试验场所、随访数、特异度、灵敏度、纳入标准、评注等。

6)文献系统评价:采用GRADE标准,运用GRADEprofiler、Revman 5.0软件输入数据,进行meta分析等定量研究,统计方面进行异质性检验、计算统计合并效应量,用森林图表示合并后的结果,同时进行敏感性分析。

7)评价结局指标的相对重要性。将结局指标根据重要性不同分为9个等级。

8)评价总体证据质量。

9)平衡收益和风险。

10)平衡净收益和费用。

12)形成强度不同的推荐意见,为标准的形成奠定基础。

除此之外,我们还采用了访谈、问卷调查、专家共识会等方法参与亚健康标准的制定。在此不再赘述。

四、引入GRADE 体系,进一步发展中医药临床评价体系

作为循证医学教育部网上合作中心的北京分中心,多年来,中国中医科学院多次派人在中国循证医学中心进修、学习,并多次赴国外交流。具备了循证医学、临床流行病学、统计学、数据管理、计算机、医学英语的专业知识,熟练掌握了REVMAN软件的使用,完成20多个系统评价,并已经在国际上注册发表。对团队人员进行GRADE的培训,并检索翻译了大量英文材料,已经联络全国多家医院和基地,为开展临床试验奠定基础。与我院中医药信息研究所、协和医科大学图书馆、中国国家图书馆建立良好的联系,熟练掌握MEDLINE、荷兰医学文摘、CNKI,维普、万方、cochrane 数据库的使用。 主持和参加世界卫生组织西太区临床实践指南的撰写和世界卫生组织亚健康标准的制定。对中医药评价体系的建立有自己独特的思路。与国家中医药管理局、科技部、北京市科委建立了良好的关系,承担多个临床试验的方案优化、质量控制、稽查、监查、临床试验的质量评估。熟练掌握多种与循证医学相关的统计方法。能够熟练进行方案的设计与制定,数据质量评价、电话访谈、数据抽提、建立数据库、数据统计分析。采用纬博融智系统,建立了专家库。针对中医药特点,开展了个体化、辨证论治评价理论体系、真实世界临床评价等的研究。参加了跨国、多中心临床试验,具有很强的国际国内影响力。

我们可以从以下几个方面开展GRADE相关研究:

1理论研究和实践相结合,构建理论、方法、技术于一体的GRADE研究平台,针对中医药临床特点,提高中医药临床试验的质量。

借鉴世界卫生组织推荐的GRADE系统,通过对中医药治疗艾滋病、亚健康的评价研究,突出中医特点,以随机对照试验和观察性研究为突破口,按照研究设计、研究质量、一致性和直接性的要求、制定检索策略、完整检索MEDILINE、CNKI等中英文数据库、进行文献的质量评定和数据的抽提,选择高强度、高水平、高质量的证据,采用REVMAN 软件和GRADE 软件,建立数据库,对关键的结局指标进行客观评价,同时权衡利弊、权衡收益和费用情况,考虑患者的使用情况,进行评分,确立证据质量和推荐等级,促进循证医学和临床流行病学的传播和应用,为国际标准和循证医学指南的建立和完善奠定基础,最终极大程度的提高中医药临床试验质量和水平,推动中医药临床评价体系的成熟和完善。

2以已经开展多年的亚健康和艾滋病中医药评价体系为主体,引入GRADE系统,引入诊断性试验的评价方法,研究影响诊断干预和患者结局的方法,参考针对诊断指标敏感性和特异性的评价方法、对多种结局指标重要性的评价方法、对终点结局指标的评价方法、量表的信度、效度、反应度等评价方法。建立全方位的中医药评价体系。

3以随机对照试验和观察性研究为切入点,开展中医药治疗艾滋病和亚健康的安全性和有效性评价,比较两种不同设计在临床实际中的应用情况,发挥中医学“从临床中来,到临床中去”的特点,注重真实世界的研究。注重研究质量,一致性和直接性,注重患者的实际应用情况调查,对结局指标的重要性进行评定,对费用进行调查。注重对临床试验的质量控制、监查。分析影响研究质量的环节。通过临床一线医生或者患者的访谈或者问卷调查,比较两种设计在临床实际中的应用情况,为进一步提高临床试验的质量奠定基础。

4借鉴GRADE系统和循证医学的理念,针对中医药临床研究特点,发展中医药临床评价方法学研究,探讨多种临床研究设计、评价的新思路

目前正在开展的课题有以下几个方面内容:中医辨证论治评价方法学理论体系的构建,实用随机对照试验的应用与发展、符合中医药研究特点的典型案例研究,基于信息采集系统的名老中医验案研究,注重临床实际的真实世界研究,个体化的中医临床研究的评价体系(如单病例随机对照试验),注重临床实际应用、加速新药研发过程的转化医学研究。符合中医证候特点及问诊情况,反应病人主观感受的量表及PRO 量表的研制。针对医疗费用,强调资源配置的卫生经济学研究。能够真实了解专家、临床一线医生和患者情况的定性研究。中医药应对公共卫生突发事件,挑战证据质量的开拓性研究。响应世界卫生组织号召,采用GRADE 系统,进行循证医学指南和国际标准的制定。结局指标的重要性判定,和关键结局指标的评价研究。从患者角度出发,保护受试者权益,平衡风险和收益的伦理学研究。针对临床中常见的问题,完善临床试验注册制度,采用四级监查制度,加强临床试验质量控制。采用最小化法随机,多重随机、患者意愿随机、中央随机等等多种比较先进的方法,解决中医药临床研究中的随机问题。构建多种符合中医药临床设计的数学模型和统计模型,切实解决中医药临床评价瓶颈问题。

总之,GRADE作为国际可接受的标准,将其引入中医临床疗效评价,将有利于带动整个临床评价的发展,带动中医药学与循证医学的共同发展,有利于发扬中医特点,实现中医的现代化和国际化。因此,有必要汇聚优秀的中医临床评价专业人才,创新科研人才组织机制,营造有利于中青年科研人才的成长环境,借鉴世界卫生组织推荐的GRADE标准,整合我国现有的科技资源,从而形成以GRADE及其相关研究为主体的优秀人才的团队效应和当量效应,提升科技队伍的创新能力和竞争实力,为建立立足于中医药优势,与国际规范接轨的中医临床疗效评价指标体系奠定基础。

参考文献】:

1 GRADE Working Group.Grading quality of evidence and strength of recommendations [J].BMJ,2004,328:1490-1494.

2  Schünemann HJ, Oxman AD,  Brozek J, et al. Grading quality of evidence and strength of recommendations for diagnostic tests and strategies[J]. BMJ, 2008, 336(7653): 1106-1110.

3 Guyatt GH, Oxman AD, Kunz R, et al. Rating quality of evidence and strength of recommendations: What is "quality of evidence" and why is it important to clinicians?[J]. BMJ, 2008,336(7651):995-998.

4 Guyatt GH, Oxman AD, Vist G, Kunz R, et al. Rating quality of evidence and strength of recommendations GRADE: an emerging consensus on rating quality of evidence and strength of recommendations [J]. BMJ , 2008;336:924-926.

5 Guyatt GH, Oxman AD, Kunz R, et al. Rating quality of evidence and strength of recommendations: Incorporating considerations of resources use into grading recommendations[J]. BMJ, 2008, 336(7654):1170-1173.