1. RWS 的起源与现状
2. RWS 与 RCT 的比较
2.1 临床研究目的
RCT 是效力试验(efficacy trials),较多用于药物上市前研究,目标在于确定药品的有效性及揭示部分不良反应。RWS 是效果试验(effectiveness trials),更关注药品上市后患者真实的用药情况,在真实环境下干预患者,旨在发现药物的慢性及潜伏的反应及罕见的不良事件,在验证一般疗效的同时发现药物新的适应症,评估常规临床中的药品经济性。效力试验关注的是干预措施能否在理想状况下产生预期的结果,而效果试验衡量的是药物或干预措施在真实临床环境下带给患者的收益程度[4]。
2.2 纳入和排除标准
RCT 的纳入和排除标准通常很严格,一般排除特殊人群及病情严重、合并症较多的复杂病例,致使研究人群与目标人群存在差异,这种高度选择导致 RCT 的代表性及外部真实性有一定局限性。而 RWS 通常采用较宽泛的纳入标准和较少的排除标准,覆盖较全面的人群,研究环境反应了提供给广泛人群的基本医疗设施,大大增加了外部真实性。在特温特开展的佐它莫司洗脱支架与依维莫司支架疗效比较的研究中[5],纳入标准为处于冠状动脉疾病任何阶段的病人,无论是单支冠脉或是多支冠脉病变,并未设置任何排除标准。在一项白介素 6 受体拮抗剂治疗类风湿关节炎的研究中[6],纳入标准为接受白介质 6 受体拮抗剂治疗的类风湿性关节炎患者,并不排除那些存在感染高危风险的患者。
2.3 样本量
对于 RCT 和 RWS 来说,样本量都是考察结果真实性的重要指标。研究者在进行 RCT、RWS 前根据确定的检验效能和信度估计最小样本量,既是为节省人力物力,同时也是伦理学的要求,确保受试者受到的损害最小。但关于 RWS 所需样本量的大小,尚未取得共识。在用吸入制剂控制哮喘的研究中[7],样本量达 65515,由于该研究为回顾性观察研究,数据来源于相关数据库,且使用吸入制剂控制哮喘患者基数很大,因此可获得较大样本量。在一项 2型糖尿病的研究中[8],样本量为 2679,虽然样本量相对较小,但是入选患者来自亚洲的 11 个不同的国家,具有地域广泛性。且 RWS 的排除标准较宽松,尽可能覆盖广泛患病人群,尽量获得反应真实世界医疗实践的结论。
2.4 干预情况
RWS 强调真实的治疗,研究者通常根据患者实际的病情和意愿选用干预措施,相比之下,RCT 强调的是标准化的治疗,通常采用随机分配的方法。例如,在社区应用依那西普治疗类风湿关节炎患者疗效评估的研究中[9],分设了试验组和对照组,分组依据是患者是否能获得依那西普,且无论是试验组还是对照组,都可以接受其他任何治疗。在一项研究生活方式干预措施对糖尿病控制作用的研究中[10],病人被分为接受生活方式干预的试验组和接受一般治疗的对照组,由指导教练根据患者的具体情况,决定适合患者的生活方式干预措施,而不是所有患者采取同样的干预措施。
2.5 评价时间及评价指标
RCT 研究时间通常较短,特别是对于某些需要终生治疗的疾病,评价时间过短[11]。RCT 以试验性方法为主,其评价指标往往局限于特定的病症或体征。而在 RWS 中,研究者一般进行较长时间的临床观察和随访,开展较长期的评价,除替代指标的改善,评价指标更包括病死率、复发率、伤残程度、生活质量等更具广泛临床意义的指标。例如在日本应用依那西普治疗类风湿关节疗效售后调研中,[12]评价指标不仅包括红细胞沉降率、C 反应蛋白等实验室指标,更包括僵硬关节数、肿胀关节数、生存质量等与临床实际密切相关的指标。又如在一项金刚烷乙胺治疗精神分裂症的研究中[11],评价指标包括精神分裂症住院率和临床改善,通过临床总体印象量表(the Clinical Impressions-Severity)和功能大体评定量表(Global Assessment of Functioning)评价患者使用金刚烷乙胺后获得的临床改善,这些量表更为关注的是患者的生存质量,而不是某个具体指标。
2.6 数据采集、管理及统计分析方法
在数据采集、管理和分析过程中,RCT 和 RWS 所使用的方法基本一致。数据采集方面,RWS 主要采用传统数据采集和电子数据采集两种模式,由于电子数据采集提高了数据的安全性,更便于数据的管理,运输、储存、传递的成本更低,更受青睐。而信息科学的日益进步也使庞大数据的管理更为科学。统计学方面,RCT 主要用卡方检验、Fisher 检验、log-rank 检验、ROC 曲线、Ka-plan-Meier 生存曲线等统计方法,而 RWS 影响因素多,除需要上述统计方法,还需要多因素分析、工具变量、倾向评分等方法。
2.7 局限性
RCT 和 RWS 都存在各自的局限性,RCT 虽然最大程度保证了内部正确性,但由于其严格选择“理想”的患者,严格控制干预措施,得到的结论不一定与真实世界的医疗实践完全一致。RWS 最大程度地保证了其结果的外推性,但由于其开放、非盲的研究方法,存在的混杂因素使得结论的因果关系需要进一步确证。例如在生活方式干预措施控制糖尿病的研究中[10],RWS 最终的结论是实验组与对照组患者获益无统计学差异。且很多时候巨大的样本量,使开展 RWS 的成本相对昂贵,庞大数据的收集整理增大了工作难度。
3. 中医药研究与 RWS
中华医药文明源远流长,先贤们也开展了许多试验,但多停留于经验水平,如张锡纯于《医学衷中参西录》中记载:“活络效灵丹,……治气血凝滞,痃癖癥瘕,心腹疼痛,腿疼臂疼,内外疮疡,一切脏腑积聚,经络湮淤。……自拟得此方以来,数年之间,治愈心腹疼痛者,不可胜计矣。”[13]正是靠着这种经验的代代传承,中华医药文明流传至今。临床疗效是中医药学赖以生存和发展的基础, 但由于未经过严格的评价,类似这种个人经验往往不能取得广泛认可, 这已成为制约中医药学发展的瓶颈[14]。
3.1 中医药开展 RCT 的局限性
随着循证医学的蓬勃开展,传统中医药研究的方法受到诸多怀疑,许多现代中医工作者效仿现代医学研究方法,开展了众多大有裨益的尝试,包括很多 RCT,增强了中医药疗效的说服力,促进了中医的国际化发展。然而却罕见设计特别规范、取得广泛认可的 RCT,反观其原因,主要是由中医自身特点所决定。
第一,中医的辨病、辨证依据及疗效评价均以定性描述为主,缺乏客观的量化性评价指标;
第二,辨证论治的全过程都带有较大的主观性,比如四诊受到医者专业水平及患者觉察、表达能力的影响,遣方用药受到医者用药习惯、思想流派的影响,疗效评价受到患者心理因素、意愿的影响;
第三,中医疗效与个体体质反应性密切相关,并受到药材产地、采摘季节、炮制储存方式等其他环节的影响[15]。中医强调个性化治疗,对疗效的评价注重整体性、复杂性和多重影响,强调脏腑经络的相互关联,患者和环境相互依存的关系,目前难以达到RCT 客观、条件绝对控制等要求,使得中医的特点难以体现于 RCT。
3.2 中医药开展 RWS 的优势
中医药研究受其自身特点束缚,难以开展 RCT,而 RWS 为中医药研究特别是中药上市后疗效评价提供了新的努力方向。中医的一大特征为“整体观念”,既强调人是一个有机整体的内在整体性,亦重视人与自然界及社会环境的外在整体性。基于这种整体观念,中医对于疗效的判定不应拘于某个特定的症状或指标,更不会具体量化的某个具体值,而更为重视患者的整体情况,包括形、神两方面。而 RWS 所关注的正是那些具有广泛临床意义的指标,如伤残程度、生活质量,与中医的“整体观念”不谋而合。中医的另一大特征为“辨证论治”,不主张专病专药、专病专方,根据医者的临床经验辨别患者的所属证候,根据患者的具体情况,结合所处环境、气候,施以适合患者的处方。在 RWS 中,通常纳入标准和排除标准相对宽泛,病人可能同时患有其他疾病,病人的日程活动、饮食可能不规律,病人之间可能难以完全取得同质性,但均可作为观察对象。且RWS 不采用盲法,而是根据患者意愿,结合实际的医疗条件给予适当的干预措施,又与中医所主张的辨证论治契合。
来源:《浙江中医药大学学报》, 2013(9):1127-1129
作者:付玲,周学平,李国春