外科临床研究的偏倚和真实性分析

2015-10-30 文章来源：《外科创新论坛》微信公众号点击量：3251 我要说

【微评】本文作者是一位颇有建树的中青年专家。这篇几年前发表的文章今天读起来仍有很强的现实意义。事实上，临床研究的真实性从来不仅仅体现在病例资料及相关数据的真实，更重要的是要纳入科学规则范畴。本文对临床研究中可能产生的偏倚及其影响进行了细致分析，注意这些问题，将大大提高临床研究的科学性。(杨子明)

外科医生阅读一份临床研究报告时，通常会问两个问题：(1)这份报告可信吗?(2)研究结果如何应用于我的临床实践?第一个问题针对的就是研究的内在真实性(internal validity)，第二个问题针对的是外在真实性(external validity)。

一个好的临床研究一定是兼具内在和外在真实性的，没有内在真实性就没有外在的真实性。但有内在真实性，不一定有外在真实性，再好的研究，如果研究报告撰写得很糟糕，表述不清，读者无处判读何时(when)，如何(how)，哪些人群(who)中推广研究结果;或者研究设计中实施的条件尤其是入组和排除标准很苛刻(特定医院，特定从业者，特定干预措施，特定的人群)，则这样的研究就缺乏外在真实性。

临床研究中的偏倚(bias)是危及其内在真实性和外在真实性的主要原因。识别偏倚的不同形式，有助于临床医生判断研究的真实性。本文着重分析外科临床研究中可能产生的常见偏倚及对临床研究的影响。

1. 研究开始前的偏倚

1.1 易感性偏倚(susceptibilitybias) 易感性偏倚的一种形式是选择偏倚。研究开始前，要制定入组标准，但如果入组标准本身蕴含了可能影响研究结果的因素，那就产生了选择偏倚。避免选择偏倚的最佳方法是前瞻性双盲随机对照研究(RCT)。但很多外科研究涉及手术操作，让研究者(外科医生)和病人完全双盲其实是做不到的。避免选择偏倚的另一个方法是分层分析，按可能影响究结果的因素对样本分层，比如年龄、TNM 分期等。但分层分析需要很大的样本量，否则很有可能分层后，每一亚组的样本量减小，从而影响了统计的效能。

易感性偏倚的另一个形式是时相偏倚(chronology bias)。如果一个临床研究持续很长时间，临床实践中很多因素都发生了变化，临床经验更丰富了，更先进的麻醉、监护、影像甚至缝线的进步都有可能影响研究结果。因此在设计有历史对照的临床研究时，也要注意平衡历史条件和现实的区别。

1.2 设计偏倚(design bias)研究设计中很多环节的疏忽都可以造成设计偏倚。无论是观察性研究还是RCT 研究，设计越完善，产生偏倚的机会就越少。例如研究的终点、观察指标、不良反应的定义力求精确，减少研究者按自己的理解自由量裁的机会。

设计偏倚产生的一个主要因素是使用替代终点(surrogate endpoint)。有些研究的观察终点，如死亡、远期复发等，可能需要随访很长时间才能获得结果。为了便于尽快获得研究结果，往往设计替代研究终点。需要注意的是，替代研究终点与真实研究终点间的关系往往存在不确定性。因此，外科医生选择替代终点时首先要确定其可靠性、科学性，与真实的研究终点之间的联系，尤其是用来替代远期疗效和并发症。同时要认识到替代终点的局限性。尤其是如果替代终点不能最后和一个相关的临床结果相关联，那这个研究就失去了外在真实性。

2. 研究实施过程中的偏倚

2.1 信息偏倚(information bias)信息偏倚的一种形式是检出偏倚(detection bias)，源自研究组内或组间检出标准的不一致，尤其是检出标准涉及主观判断的时候。信息偏倚的另一种形式是确认偏倚(ascertainment bias)，这类偏倚往往发生在病例回顾研究中，需要病人回忆既往的事件。病人往往在潜意识里要为自己的疾病找一个原因，因此可能在研究者的诱导下，也可能不自觉地会把既往一些不确定的事件当成确定事件报告。

信息偏倚直接危及了临床研究的内在真实性。在有主观评价指标的情况下，尽量把评价标准细化、采用双盲法或引入独立的第三方评价者有助于避免信息偏倚。

2.2 传递偏倚(transfer bias)如果临床研究的特性导致了不同研究组间的随访率显著不同，就产生了传递偏倚。传递偏倚同样会影响研究内在的真实性。避免的方法在于采取一切办法鼓励病人随访，如给予交通补偿、将随访时间、地点尽可能安排得比较方便等。

2.3 执行偏倚(performance bias)执行偏倚危及临床研究的内在真实性，是外科临床研究中最常见、也最难避免的偏倚。因为外科手术不可能像内科药物临床研究中那样完全做到标准化。事实上同一个手术，没有两位外科医生的做法是一模一样的;即使是同一位外科医生，在不同的时间，随着手术经验、技巧的发展，他的操作也可能不一样。这种非标准化的状况是外科的特点。但从另一个角度看，外科临床研究实施过程中一定程度的不一致，反而增强了其外在的真实性，使得研究结论可以转化到不同医院和不同外科医生的临床实践中去。关键是掌握不一致的“度”。

为了避免外科临床研究中的执行偏倚，可以设计不同的外科医生作不同研究组的手术，每组外科医生只作本人擅长的手术。为了避免由此产生的设计偏倚，这类非随机研究方案必须非常详细，入组标准、资料收集、结果评估和随访必须标准化并严格执行。为了避免由此产生的选择偏倚，应尽可能进行多中心临床研究，并入组尽可能多的病人。

3. 研究结束后的偏倚

临床研究的结果最终要转化到临床实践中去。如何撰写临床研究报告，会极大地影响临床医生的判断。如果临床研究的结果没有被全面、恰当地报道，将使得临床医生无从判断临床研究的内在和外在真实性，从而扭曲对某一干预措施的预期，这就是引证偏倚(citation bias)。引证偏倚的一个突出表现就是临床研究的发起者、研究者不愿意报道阴性或不利的结果。引证偏倚的另一个表现形式是重复发表，造成多个研究的假象。解决这一问题，一方面需要研究者有良好的学术道德，另一方面则需要审稿人和编辑有高度的责任感和学术敏感性，扮演好“守门人”的角色。

为了解决对临床研究阴性结果隐瞒不报的问题，从2004 年开始，医学杂志编辑国际委员会(ICMJE)要求凡涉及病人的临床研究结果，在国际性杂志上发表，必须预先注册。未注册的临床研究报告将不予发表。但对观察类的研究(observational research)不做强制要求。这个规定的目的在于让其他研究者有机会知道那些获得阴性结果的临床研究。当然注册只是今后研究结果获得发表的一个必要条件，不意味着研究结果一定被发表。研究结果是否发表还是要看研究的质量。目前中国临床试验注册中心(www.chictr.org)可以为国内医生提供WHO 和ICMJE认可的免费临床研究注册服务。

为了使临床医生能准确判断一个研究的内在和外在真实性，一份好的研究报告必须包含研究设计、执行、数据记录、分析的详细内容。很多外科临床研究报告的通病是缺乏必要的详细内容，例如精确定义的研究终点、入组标准和排除标准、随机化方法、样本量的计算。一些对外科医生尤其重要的信息也未记录，而这些信息对保证研究外在的真实性非常重要。

4. 总体偏倚

总体偏倚不是源自研究的设计和实施，而是源自人性的弱点和社会的大环境。

4.1 乐观偏倚盲目相信新药物、新疗法、新手术一定比现有的好，就会造成乐观偏倚。一方面，在涉及主观评价的研究中，病人会倾向于对新疗法作出乐观的评价;另一方面医生或病人会倾向于进入新疗法组。如果被随机到传统治疗组，部分病人可能拒绝入组，转而通过其他途径获得新治疗，在一定程度上影响了病人的募集。乐观偏倚会进一步造成引证偏倚。Ioannidis在2005发布了一个研究报告，比较了高引用文章(引用次数>1000)和低引用文章(平均引用157 次)的特性，发现大部分高引用次数文章报道的是新的、具有阳性结果的临床研究。但具有讽刺意味的是同一研究还发现，这些高引用次数文献报道的疗效有近1/3 在随后的研究中被证明比现有的方法要差。所以研究者和受试者都要保持客观的心态：新方法不一定必然比现有的方法好。

4.2 利益冲突(conflicts of interest)利益冲突可有意或无意地影响从研究设计到实施到结果分析的每个环节。发表在《英国医学杂志》上的一份研究报告分析了1997⁃2001年该杂志发表的RCT 研究，发现由利益机构(如医药公司)支持的研究中，研究结果明显倾向于干预组。这份研究报告，提请各位医生注意在研究的过程中，应有意识地采取各种措施避免利益冲突对研究的影响，如严格的双盲、随机。在发表研究报告的时候，应详细说明利益冲突的具体内容，比如作为公司的研发顾问、讲者，还是股票持有人。

外科临床研究有其固有的特点，由于涉及具体的手术操作，使得双盲、随机和标准化操作难于严格推广，而且这其中还涉及病人的安全、研究开展的可行性、研究费用等问题。因此外科医生更应清楚外科临床研究中的哪些环节会危及研究的内在和外在的真实性，一方面可以在自己的临床研究中尽量加以避免;另一方面可以对他人的研究报告有一个清醒的判断，知道何时、哪里、如何应用这些研究成果。

参考文献(略)

(本文发表于《中国实用外科杂志》2010，30(01)：14-17)

分享到：