精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
大型隨機(jī)對(duì)照試驗(yàn):精準(zhǔn)流行病學(xué)研究的典范與陷阱
唐金陵, 楊祖耀, 毛琛
(999077 中國(guó)香港中文大學(xué)公共衛(wèi)生及基層醫(yī)療學(xué)院流行病學(xué)系)
摘要
現(xiàn)代流行病學(xué)是醫(yī)學(xué)應(yīng)用型研究的方法論,是在人群中定量地研究有關(guān)健康、疾病和醫(yī)療服務(wù)實(shí)踐問題一般規(guī)律的科學(xué)和藝術(shù)。流行病學(xué)研究結(jié)果的準(zhǔn)確度主要取決于研究的設(shè)計(jì)類型,精確度主要取決于樣本量大小。大型隨機(jī)對(duì)照試驗(yàn)是最精、最準(zhǔn)的流行病學(xué)研究設(shè)計(jì)類型,但是由于倫理的限制,只能用于評(píng)估醫(yī)學(xué)干預(yù)效果。一項(xiàng)研究需要的設(shè)計(jì)嚴(yán)謹(jǐn)性和樣本量與預(yù)期效果的大小成反比:效果越小,所需的研究設(shè)計(jì)就越嚴(yán)謹(jǐn),需要的樣本量就越大。因此,只有當(dāng)療效比較小時(shí),才需要大型隨機(jī)對(duì)照試驗(yàn),當(dāng)療效十分明顯時(shí),中小型隨機(jī)對(duì)照試驗(yàn)甚至觀察性研究就足以證明其有效性。從研究階段上看,它是確認(rèn)性、終結(jié)性研究,而不是提出假設(shè)的原創(chuàng)性研究。然而,研究的價(jià)值最終取決于研究問題的意義和原創(chuàng)性,而不是研究方法和P值的大小。過度推崇大型隨機(jī)對(duì)照試驗(yàn)會(huì)引發(fā):① 對(duì)中、小療效干預(yù)的過度強(qiáng)調(diào);② 對(duì)確認(rèn)性研究的過度重視,以及對(duì)項(xiàng)目大小和經(jīng)費(fèi)多少而不是科學(xué)問題的追逐,進(jìn)而弱化原創(chuàng)性研究工作;③ 增加研究資源、醫(yī)學(xué)活動(dòng)和患者利益被制藥公司綁架的風(fēng)險(xiǎn)。
關(guān)鍵詞: 研究設(shè)計(jì);臨床試驗(yàn);大型隨機(jī)對(duì)照試驗(yàn);偏倚;樣本量
現(xiàn)代流行病學(xué)是醫(yī)學(xué)應(yīng)用型研究的方法論,是在人群中定量地研究有關(guān)健康、疾病和醫(yī)療服務(wù)實(shí)踐問題一般規(guī)律的科學(xué)和藝術(shù)。流行病學(xué)研究是與實(shí)驗(yàn)室基礎(chǔ)研究分庭抗禮的兩大醫(yī)學(xué)研究陣營(yíng)之一,可以用來研究疾病的病因和危險(xiǎn)因素、疾病診斷的準(zhǔn)確性、疾病負(fù)擔(dān)、疾病的轉(zhuǎn)歸及其影響因素、醫(yī)學(xué)干預(yù)措施的效果和副作用、醫(yī)學(xué)措施的成本效果等與醫(yī)學(xué)實(shí)踐直接相關(guān)的問題,其發(fā)現(xiàn)可直接用來指導(dǎo)和改善醫(yī)學(xué)實(shí)踐[1-3]。
一  大型隨機(jī)對(duì)照試驗(yàn)是最精準(zhǔn)的流行病學(xué)研究
1.研究設(shè)計(jì)與研究結(jié)果的準(zhǔn)確度:科學(xué)研究的目的是揭示真相,流行病學(xué)研究也不例外。以干預(yù)措施效果的評(píng)估為例,如果一項(xiàng)具體的研究觀察到的結(jié)果為觀察值,真實(shí)的效果為真實(shí)值,則二者的關(guān)系如圖 1所示。觀察值和真實(shí)值之間的差別或距離,在流行病學(xué)中稱為偏倚,也稱作系統(tǒng)誤差。一個(gè)研究的偏倚越大,其觀察值離真實(shí)值越遠(yuǎn),就越不準(zhǔn)確,反之亦然。控制偏倚的首要措施是研究設(shè)計(jì)。研究設(shè)計(jì)越嚴(yán)謹(jǐn),偏倚越小,得到的結(jié)果就越準(zhǔn)確。
常見的可用于評(píng)估干預(yù)措施效果的流行病學(xué)研究設(shè)計(jì)包括單病例報(bào)告、無對(duì)照的病例系列、對(duì)照研究(定群研究)和隨機(jī)對(duì)照研究,在臨床試驗(yàn)里,它們被分別稱為單一病例試驗(yàn)、多病例無對(duì)照試驗(yàn)、非隨機(jī)分組的對(duì)照試驗(yàn),以及隨機(jī)對(duì)照試驗(yàn)[4-5]。所謂試驗(yàn),就是測(cè)試干預(yù)措施效果的試驗(yàn)性研究。不同的研究類型就像不同準(zhǔn)確度的尺子,有些可以測(cè)量到厘米,有些可以測(cè)量到毫米,隨機(jī)對(duì)照試驗(yàn)是流行病學(xué)研究里可測(cè)量到最小差別的尺子,是評(píng)估干預(yù)措施效果最嚴(yán)謹(jǐn)、最準(zhǔn)確、最可信的流行病學(xué)研究設(shè)計(jì)(圖 2)[1, 6]。
2.樣本量與研究結(jié)果的精確度:如圖 1所示,即使研究沒有任何偏倚,觀察值還是不可能與真實(shí)值完全重疊。由于隨機(jī)誤差的存在,不同研究得到的觀察值不是一個(gè)固定的值,而會(huì)因樣本量的不同圍繞一個(gè)中心值左右擺動(dòng)。擺動(dòng)的幅度與樣本量成反比:樣本量越大,研究結(jié)果圍繞中心值擺動(dòng)的平均幅度就越小,平均來說會(huì)更接近中心值,或者說精確度越高,反之則擺動(dòng)幅度越大,精確度越低。由此可見,精確度與隨機(jī)誤差成反比,主要由樣本量的大小決定,增加樣本量是提高精確度的主要措施[7-8]。
什么是合適的樣本量?一項(xiàng)研究需要的樣本量大小與其欲評(píng)估的干預(yù)絕對(duì)效果的大小有關(guān)[9]。以簡(jiǎn)單的兩組比較的臨床試驗(yàn)為例,估計(jì)樣本量需要知道對(duì)照組的有關(guān)事件發(fā)生率、治療效果的大小,統(tǒng)計(jì)學(xué)的第Ⅰ類和第Ⅱ類錯(cuò)誤的概率。第Ⅰ類和第Ⅱ類錯(cuò)誤是人為規(guī)定的幾個(gè)固定可選的常數(shù)值,隨機(jī)對(duì)照試驗(yàn)需要的樣本量主要取決于對(duì)照組結(jié)局事件的發(fā)生率及其與治療組事件發(fā)生率之間的差別(即效果的大小)。一般來講,干預(yù)的絕對(duì)效果越小,需要的樣本量就越大。如果結(jié)局事件的發(fā)生率很低,比如在心血管病和癌癥的預(yù)防研究中,干預(yù)的絕對(duì)效果無論如何都不會(huì)太大,因此需要的樣本量都會(huì)很大[1, 10-12]。
3.大型隨機(jī)對(duì)照試驗(yàn):大型隨機(jī)對(duì)照試驗(yàn)又稱大規(guī)模隨機(jī)對(duì)照試驗(yàn)(large randomized trials或mega-trials),樣本量可以大至幾千,甚至上萬。與小型研究或其他設(shè)計(jì)類型的研究相比,大型隨機(jī)對(duì)照試驗(yàn)結(jié)果的精確度、準(zhǔn)確度都是最高的,因此,大型隨機(jī)對(duì)照試驗(yàn)就是最精、最準(zhǔn)的流行病學(xué)研究設(shè)計(jì)。由于樣本量很大,大型隨機(jī)對(duì)照試驗(yàn)在設(shè)計(jì)上往往還具備一些其他共同的特征,例如多中心、程序簡(jiǎn)單、病例特征和醫(yī)療條件寬泛、治療環(huán)境貼近實(shí)際醫(yī)療環(huán)境、可以估計(jì)實(shí)際效果、結(jié)果有利于推廣等。
大型研究為了快速征募病例并完成研究,研究者多會(huì)聯(lián)合很多單位,一個(gè)單位就是一個(gè)中心,各中心分別征募和治療自己中心的病例,研究在不同地方同時(shí)進(jìn)行。因此,大型隨機(jī)對(duì)照試驗(yàn)一般都是多中心試驗(yàn),中心可以局限于一個(gè)國(guó)家或地區(qū),也可以遍布全世界。由于研究中心遍布各地,每個(gè)地區(qū)在醫(yī)療環(huán)境、醫(yī)療水平、病例特征等方面存在差異,大型試驗(yàn)多是“簡(jiǎn)單試驗(yàn)”。所謂簡(jiǎn)單,就是在病例入選、治療安排和數(shù)據(jù)收集等方面采取比小型試驗(yàn)更為簡(jiǎn)單易行的方法。因?yàn)樾枰髂嫉牟±龜?shù)量很大,而且涉及的單位很多,各單位的條件和水平參差不齊,研究的各種要求需要考慮效率,還需要兼顧中下水平的參與單位的條件和能力,使它們能夠完成研究的各種要求。比如,病例入選條件應(yīng)該簡(jiǎn)單,不添加很多限制(如病程、病情、治療史和合并癥),不使用臨床上不常見的儀器,盡可能使臨床上同類病例都可以入選,這樣才會(huì)有更多的合格病例入選,加速病例征募的程序。
由于參與的地區(qū)和中心很多,以及病例入選條件和臨床治療環(huán)境比較寬泛,如果最終證明有效,一般認(rèn)為其結(jié)果更容易在實(shí)際醫(yī)療條件下得到重復(fù),更容易推廣和普及。由于大型隨機(jī)對(duì)照試驗(yàn)的這些特點(diǎn),以及它們結(jié)果的高準(zhǔn)確性和高精確性,大型隨機(jī)對(duì)照試驗(yàn)是目前最有影響的臨床研究,醫(yī)學(xué)雜志會(huì)爭(zhēng)相發(fā)表,如NEJM、Lancet、JAMA、BMJ幾乎每期都有報(bào)道,這又進(jìn)一步推升了大型隨機(jī)對(duì)照試驗(yàn)在臨床研究中的地位和影響力。
二  隨機(jī)對(duì)照試驗(yàn)的適用條件
1.研究問題與隨機(jī)對(duì)照試驗(yàn)的選用:在流行病學(xué)研究的范式里,針對(duì)同一研究問題,有多種研究設(shè)計(jì)可以選用,不同研究設(shè)計(jì)提供的證據(jù)可信度高低有別,只有一種是最優(yōu)的切實(shí)可行的研究類型(表 1)。例如,欲研究吸煙與肺癌的關(guān)系,可選擇的研究設(shè)計(jì)包括:病例系列、橫斷面研究、生態(tài)學(xué)研究、病例對(duì)照研究、隊(duì)列研究。隊(duì)列研究是研究病因切實(shí)可行的可信度最高的研究。又如,評(píng)估干預(yù)的效果,單病例試驗(yàn)、多病例無對(duì)照試驗(yàn)、非隨機(jī)分組對(duì)照試驗(yàn)都可以用于評(píng)估干預(yù)的效果,隨機(jī)對(duì)照試驗(yàn)是可信度最高的切實(shí)可行的研究。但是,在研究藥物嚴(yán)重、罕見的慢性不良反應(yīng)時(shí),最可信、切實(shí)可行的研究往往是病例對(duì)照研究。
評(píng)估醫(yī)學(xué)干預(yù)的效果,至少有4類研究可以使用,但是它們不是等同的。從設(shè)計(jì)上講,主要區(qū)別為3個(gè)方面:觀察從暴露到結(jié)局的時(shí)間走向,對(duì)照的特征,比較組間的可比性。研究設(shè)計(jì)的核心區(qū)別就是在處理這些問題上的不同,研究設(shè)計(jì)的進(jìn)步就是在處理這些問題上的進(jìn)步。不同研究提供的證據(jù)的可信度有高有低,隨機(jī)對(duì)照試驗(yàn)最高,單個(gè)病例試驗(yàn)最低。提高可信度是有代價(jià)的,一般來講研究需要的資源(包括時(shí)間)與結(jié)果的可信度成正比,回答一類問題最可信、切實(shí)可行的研究往往也是最昂貴耗時(shí)的研究。據(jù)估計(jì),一個(gè)典型的大型隨機(jī)對(duì)照試驗(yàn)平均需要費(fèi)用高達(dá)3 000萬美元[13]。進(jìn)行大型隨機(jī)對(duì)照試驗(yàn)必須謹(jǐn)慎。
其實(shí),評(píng)估干預(yù)效果時(shí),不是都需要使用隨機(jī)對(duì)照試驗(yàn)的。在效果極其明顯時(shí)(如白內(nèi)障手術(shù)、斷肢再植、麻醉和輸血),通常不需要隨機(jī)對(duì)照試驗(yàn)的確認(rèn)[13]。因?yàn)樾Ч麡O其明顯的干預(yù)措施畢竟是少數(shù),絕大多數(shù)干預(yù)措施還是需要經(jīng)過隨機(jī)對(duì)照試驗(yàn)的驗(yàn)證,但不是所有情況下都需要使用大型隨機(jī)對(duì)照試驗(yàn)。效果明顯時(shí)(如抗生素),中、小型試驗(yàn)就足以,只有當(dāng)效果較小時(shí),才需要大型隨機(jī)對(duì)照試驗(yàn)。
2.研究階段與隨機(jī)對(duì)照試驗(yàn)的選用:決定研究設(shè)計(jì)選擇的另一個(gè)重要因素是評(píng)估的階段。對(duì)于同一類研究問題,研究設(shè)計(jì)的選擇主要取決于研究的階段。
科學(xué)研究可大致分為3個(gè)階段:產(chǎn)生假設(shè)、檢驗(yàn)假設(shè)和確認(rèn)假設(shè)。從時(shí)間上看,產(chǎn)生假設(shè)是研究的初期階段,檢驗(yàn)假設(shè)是中期階段,確認(rèn)假設(shè)是終末階段。就評(píng)估醫(yī)學(xué)干預(yù)效果而言,早期階段應(yīng)使用安全、快速、簡(jiǎn)單、省錢的研究,但結(jié)果可信度比較低,中期應(yīng)使用可信度較高的研究,最后再經(jīng)過隨機(jī)對(duì)照試驗(yàn)的確認(rèn)。
以新藥的臨床驗(yàn)證為例,一般分為4個(gè)階段,即常說的Ⅰ~Ⅳ期臨床試驗(yàn)(圖 3)[14-16]。研究的問題包括毒副作用和效果2個(gè)方面,對(duì)二者的研究也需要循序漸進(jìn),研究設(shè)計(jì)選擇也需靈活多變。Ⅰ期臨床試驗(yàn)是一個(gè)新藥第一次在人體上的測(cè)試,需十分謹(jǐn)慎,評(píng)估的不是療效而是急性毒性作用,也包括對(duì)藥物代謝動(dòng)力學(xué)的考察。研究往往是在仔細(xì)挑選的健康人中進(jìn)行的,且沒有對(duì)照組。如果一個(gè)藥物通過了Ⅰ期試驗(yàn),沒有明顯的急性毒性作用,可進(jìn)入Ⅱ期試驗(yàn),對(duì)療效進(jìn)行初步評(píng)估。根據(jù)評(píng)估的進(jìn)展時(shí)段,可選的研究設(shè)計(jì)很多,如無對(duì)照試驗(yàn)、前后對(duì)照試驗(yàn)、交叉試驗(yàn)、非隨機(jī)的平行對(duì)照試驗(yàn)和小樣本隨機(jī)對(duì)照試驗(yàn)等。Ⅲ期試驗(yàn)是對(duì)療效最嚴(yán)格的驗(yàn)證,需要使用樣本量足夠大的隨機(jī)對(duì)照盲法試驗(yàn)。Ⅳ期試驗(yàn)是藥物上市后的研究,主要是對(duì)嚴(yán)重罕見慢性不良反應(yīng)的監(jiān)察,主要使用的是病例對(duì)照研究和隊(duì)列研究。
三  大型隨機(jī)對(duì)照試驗(yàn)的作用和陷阱
1.大型隨機(jī)對(duì)照試驗(yàn)的作用:為什么要進(jìn)行大型隨機(jī)對(duì)照試驗(yàn)?zāi)兀孔罡镜睦碛墒茄芯繂栴}的需要,具體來說是欲證明的治療的效果很小。由此可見,大型隨機(jī)對(duì)照試驗(yàn)主要是用于評(píng)估中小療效(尤其是小療效)的干預(yù)措施的效果[10]。
換言之,如果一個(gè)隨機(jī)對(duì)照試驗(yàn)需要很大的樣本量,那么它所估計(jì)的絕對(duì)效果就一定很小。白內(nèi)障手術(shù),立竿見影,3~5例患者就足以證明其效果,對(duì)照都不需要。抗菌素治療大葉性肺炎,在幾十例病例中測(cè)試就足夠了。但是,要證明一個(gè)抗高血壓藥物是否可以預(yù)防心血管事件,一般需要幾千甚至上萬病例,隨訪觀察幾年的時(shí)間。
上述3種治療之間,第一種肯定是最有效的,第三種是效果最低的。換言之,臨床觀察就可以確認(rèn)的效果一定大于小型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果,小型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果一定大于大型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果。從這個(gè)意義上講,我們絕不能說臨床觀察和小型隨機(jī)對(duì)照試驗(yàn)確認(rèn)的療效沒有大型隨機(jī)試驗(yàn)證明的效果重要,其實(shí)恰恰相反。
事實(shí)上,抗生素、麻醉術(shù)、胰島素、夾板正骨、癤癰引流、大失血后的輸血、出血的壓迫或包扎等十分有效的醫(yī)學(xué)措施,在隨機(jī)對(duì)照試驗(yàn)誕生以前,就被證明有效且廣泛應(yīng)用了[17]。相反,隨機(jī)對(duì)照試驗(yàn)誕生以后,我們并沒有產(chǎn)生多少新的比這些治療更有效的措施,現(xiàn)在臨床上使用最多的抗高血壓藥物、抗血脂藥物、抗腫瘤藥物(表 2)等,雖然它們的療效經(jīng)都過大型隨機(jī)對(duì)照試驗(yàn)的確認(rèn),但是它們的效果遠(yuǎn)遠(yuǎn)沒有上述醫(yī)學(xué)措施的效果明顯而快速[18]。
認(rèn)識(shí)到這一點(diǎn)十分重要,在討論大型隨機(jī)對(duì)照試驗(yàn)結(jié)果的臨床實(shí)踐意義時(shí),不能盯在樣本量上,不能把樣本量和統(tǒng)計(jì)學(xué)顯著性與干預(yù)效果大小混為一談,干預(yù)的臨床價(jià)值在于其療效的大小,不是樣本量的大小。增加隨機(jī)對(duì)照試驗(yàn)的樣本量,可以增加測(cè)量的穩(wěn)定性,但是只有當(dāng)效果很小時(shí)才需要大型隨機(jī)對(duì)照試驗(yàn)。換言之,對(duì)研究要求越是精、準(zhǔn),說明欲證明的效果就越小。相反,如果效果很大,小型隨機(jī)對(duì)照試驗(yàn)甚至非隨機(jī)分組的對(duì)照試驗(yàn)就足以形成確認(rèn)性研究。
如此看來,大型隨機(jī)對(duì)照試驗(yàn)只是評(píng)估中、小療效的金標(biāo)準(zhǔn),不是評(píng)估所有干預(yù)措施的金標(biāo)準(zhǔn)。大型隨機(jī)對(duì)照試驗(yàn)也可能用來比較兩個(gè)療效差別不大的治療,證明療效不存在,或是證明藥物間中、小交互作用的存在。但無論是哪種情況,需要大型隨機(jī)對(duì)照試驗(yàn)證明的作用或差別都是比較小的,因此它們的實(shí)踐意義也是值得拷問的。
2.大型隨機(jī)對(duì)照試驗(yàn)不是原創(chuàng)性研究:如前所述,對(duì)一個(gè)科學(xué)問題的探索可分為提出假設(shè)、驗(yàn)證假設(shè)和確認(rèn)假設(shè)3個(gè)階段。從評(píng)估干預(yù)效果的程序上看,大型隨機(jī)對(duì)照試驗(yàn)不屬于早期提出科學(xué)問題的原創(chuàng)性研究,而是中后期的確認(rèn)性研究[16, 19],是最后的研究,是終結(jié)性研究,一旦證明有效,將不再需要新的研究繼續(xù)驗(yàn)證,一般也不會(huì)衍生出新的科學(xué)發(fā)現(xiàn)和發(fā)明。
如果把流行病學(xué)研究分為創(chuàng)新性研究和驗(yàn)證性研究,前者在于提出嶄新的研究問題或假設(shè),后者在于驗(yàn)證初步探索過的假設(shè)或理論的正確性。前者是科學(xué)發(fā)展的基礎(chǔ),是科學(xué)的靈魂,因?yàn)闆]有前者就不需要后者;但是如果沒有后者,科學(xué)就只有一堆不知錯(cuò)對(duì)的想象和假設(shè)而已,科學(xué)將不會(huì)扎實(shí)地進(jìn)步。前者更多需要的是靈感和想象力,是科學(xué)家的核心價(jià)值所在;而后者更多依賴于研究資源和執(zhí)行能力,是常規(guī)科學(xué)和科學(xué)工匠的工作范圍[20]。
由此可見,科學(xué)研究(尤其是醫(yī)學(xué)應(yīng)用型研究)的意義和價(jià)值最終取決于研究問題,而不是回答問題的方法的優(yōu)劣和結(jié)果的精準(zhǔn)。哲學(xué)家Laude Levi-Strauss甚至說,真正的科學(xué)家是那些提出關(guān)鍵問題的人,而不是可以正確回答問題的人。普林斯頓大學(xué)統(tǒng)計(jì)學(xué)系創(chuàng)始人John Tukey也說過:數(shù)據(jù)分析最重要的原則,也是很多統(tǒng)計(jì)學(xué)家想規(guī)避的原則:對(duì)一個(gè)正確問題的不精準(zhǔn)回答,遠(yuǎn)遠(yuǎn)好于對(duì)一個(gè)錯(cuò)誤問題的精準(zhǔn)回答。統(tǒng)計(jì)分析和流行病學(xué)研究的正確運(yùn)用,其實(shí)異曲同工。再好再大的研究,如果沒有一流的研究問題,也不可能成為一流的研究。
3.大型隨機(jī)對(duì)照試驗(yàn)的陷阱:大型隨機(jī)對(duì)照試驗(yàn)是最精、最準(zhǔn)的流行病學(xué)研究,因此人們經(jīng)常把大型隨機(jī)對(duì)照試驗(yàn)視為確認(rèn)醫(yī)學(xué)干預(yù)措施效果的金標(biāo)準(zhǔn)[13]。NEJM、Lancet、JAMA、BMJ等醫(yī)學(xué)雜志已成為大型隨機(jī)對(duì)照試驗(yàn)熱衷的發(fā)布平臺(tái),它們的宣傳和肯定進(jìn)一步推升和穩(wěn)固了大型隨機(jī)對(duì)照試驗(yàn)在醫(yī)學(xué)實(shí)踐中的“霸主”地位。因此,大型隨機(jī)對(duì)照試驗(yàn)成了國(guó)際臨床指南所追捧的旗幟,通過國(guó)際指南巨大而又快速影響著世界范圍內(nèi)的醫(yī)學(xué)實(shí)踐活動(dòng)。
然而,大型隨機(jī)對(duì)照試驗(yàn)只是確認(rèn)中、小療效的金標(biāo)準(zhǔn),不是確認(rèn)十分有效的干預(yù)的金標(biāo)準(zhǔn)。在醫(yī)學(xué)實(shí)踐中,過度推崇大型隨機(jī)對(duì)照試驗(yàn),會(huì)導(dǎo)致對(duì)中、小療效干預(yù)的過度強(qiáng)調(diào)。所謂中、小療效的臨床意義是值得商榷的[11],而且在多數(shù)情況下中、小型隨機(jī)對(duì)照試驗(yàn)的系統(tǒng)綜述完全可以替代大型隨機(jī)對(duì)照試驗(yàn)[19, 21-22]。另外,如果設(shè)計(jì)上出了問題,例如未使用重要的終末結(jié)局[23-25],大型隨機(jī)對(duì)照試驗(yàn)的浪費(fèi)是巨大的[26]。
絕大多數(shù)大型隨機(jī)對(duì)照試驗(yàn)主要是評(píng)估新的藥物。過度推崇大型隨機(jī)對(duì)照試驗(yàn),還會(huì)導(dǎo)致對(duì)新藥的過度重視和依賴,弱化很多老的甚至更有效的藥物,弱化預(yù)防、非藥物干預(yù)(例如生活方式)和傳統(tǒng)醫(yī)學(xué)(例如中醫(yī))的作用[13]。
在醫(yī)學(xué)研究中,過度推崇大型隨機(jī)對(duì)照試驗(yàn),會(huì)導(dǎo)致對(duì)確認(rèn)性研究的過度重視,因而間接地弱化開創(chuàng)性研究工作的重要性,導(dǎo)致對(duì)大型驗(yàn)證性項(xiàng)目的盲目崇拜,對(duì)大樣本和統(tǒng)計(jì)學(xué)顯著性而不是臨床意義的重視[27],以及對(duì)科研經(jīng)費(fèi)而不是科學(xué)問題的追逐。長(zhǎng)期下去,勢(shì)必會(huì)導(dǎo)致研究領(lǐng)域原創(chuàng)性能力的下降,丟了科學(xué)靈魂(表 3)。
大型隨機(jī)對(duì)照試驗(yàn)的病例入選條件和臨床治療環(huán)境比較寬泛,增加了代表性,提高了結(jié)果的外推性,似乎是一個(gè)優(yōu)點(diǎn)。但實(shí)際上,這恰恰是大型隨機(jī)對(duì)照試驗(yàn)的另一個(gè)更隱秘的陷阱。為了盡快招募到足夠的病例,大型隨機(jī)對(duì)照試驗(yàn)經(jīng)常會(huì)放寬納入標(biāo)準(zhǔn)。在療效很小的情況下,病例納入標(biāo)準(zhǔn)越寬泛,從治療中受益的病例的比例可能就越低,需要的樣本量就越大,最后認(rèn)為在更廣泛的病例中治療有效就越不合理,因?yàn)闀?huì)使更多不會(huì)受益的人接受治療。大型隨機(jī)對(duì)照試驗(yàn)所謂增加了研究的外部真實(shí)性,其實(shí)是一種誤導(dǎo)。
另外,值得注意的是,很多大型隨機(jī)對(duì)照試驗(yàn)是由藥廠資助的,它們已經(jīng)成為推廣藥物最有力的市場(chǎng)工具[28-31]。例如,NEJM曾多次報(bào)道有關(guān)癌癥靶向治療藥物的臨床試驗(yàn),但是這些極其昂貴的藥物最好也只不過能延長(zhǎng)幾個(gè)月的生存,經(jīng)常只是延緩腫瘤進(jìn)展幾個(gè)月的時(shí)間,但并不能延長(zhǎng)生存,也不能提高生命質(zhì)量[23-24, 32-33]。這使得我們更應(yīng)該對(duì)大型隨機(jī)對(duì)照試驗(yàn)持客觀、謹(jǐn)慎、警覺的態(tài)度。
Ioannidis[34]曾說,醫(yī)學(xué)研究中有很多所謂的“陽性結(jié)果”和“重要發(fā)現(xiàn)”只是具有高度統(tǒng)計(jì)學(xué)顯著意義但沒有太大臨床意義的結(jié)果,或者是在各種動(dòng)機(jī)的驅(qū)使下玩弄數(shù)字的結(jié)果,很難得到重復(fù)。大型隨機(jī)對(duì)照試驗(yàn)的結(jié)果被重復(fù)驗(yàn)證的機(jī)會(huì)幾乎是零,因?yàn)榇笮碗S機(jī)對(duì)照試驗(yàn)極其昂貴,針對(duì)同一研究問題開展兩個(gè)或多個(gè)如此昂貴的研究的可能性極小。即使有后續(xù)研究,由于研究間諸多因素的不同,它們的結(jié)果都不大可能否定之前大型試驗(yàn)的結(jié)論,從而使得現(xiàn)實(shí)中不大可能出現(xiàn)有效的驗(yàn)證研究。這種幾乎不可驗(yàn)證的特性,增加了大型隨機(jī)對(duì)照試驗(yàn)被不良動(dòng)機(jī)利用、甚至出現(xiàn)欺騙性結(jié)果的風(fēng)險(xiǎn)。
四  大型隨機(jī)對(duì)照試驗(yàn)與大型隊(duì)列研究的區(qū)別
20世紀(jì)中葉以后,隨機(jī)對(duì)照試驗(yàn)的興起以及醫(yī)學(xué)對(duì)大型隨機(jī)對(duì)照試驗(yàn)的尊崇和膜拜,正在導(dǎo)致對(duì)中、小干預(yù)效果的過度重視,對(duì)驗(yàn)證性研究的過度重視,對(duì)樣本量和研究經(jīng)費(fèi)的過度追逐,進(jìn)而導(dǎo)致對(duì)原創(chuàng)性研究的淡化。但是,這樣的結(jié)論似乎不適用于大型前瞻性隊(duì)列研究。
除了研究設(shè)計(jì)嚴(yán)謹(jǐn)性之外,大型前瞻性隊(duì)列研究與大型隨機(jī)對(duì)照試驗(yàn)之間存在兩個(gè)重要區(qū)別。一是隨機(jī)對(duì)照試驗(yàn)一般只能用來回答一個(gè)簡(jiǎn)單的研究問題,即在干預(yù)和結(jié)局方面都必須做嚴(yán)格的限定,如某藥與安慰劑比較是否可以在某特定病例中改變某重要臨床結(jié)局。隊(duì)列研究則不然,它可納入的暴露往往有幾十種幾百種甚至更多,對(duì)照有很多種可能,這些暴露可能影響的結(jié)局又有很多種,可以包括多種常見和罕見疾病[35-37]。因此,通常一個(gè)隨機(jī)對(duì)照試驗(yàn)一般只產(chǎn)生一個(gè)核心研究報(bào)告,而大型隊(duì)列研究可以產(chǎn)生無數(shù)個(gè)重要性相當(dāng)?shù)难芯繄?bào)告。例如,美國(guó)的佛明翰心臟研究1950年以來共發(fā)表超過3 000篇文章,涉及很多危險(xiǎn)因素和疾病,是歷史上貢獻(xiàn)最大的流行病學(xué)研究之一[37]。
大型隊(duì)列研究與大型隨機(jī)對(duì)照試驗(yàn)的第二個(gè)重要區(qū)別在于它們可引發(fā)新的發(fā)現(xiàn)。大型隨機(jī)對(duì)照試驗(yàn)是終結(jié)性研究,所謂終結(jié)性研究,就是完成以后不再需要新的驗(yàn)證,一般也不會(huì)引發(fā)出新的科學(xué)問題。隊(duì)列研究則不同,主要用于發(fā)現(xiàn)病因,病因是預(yù)防和治療疾病的開始,因此隊(duì)列研究是控制一個(gè)疾病的開端,而不是結(jié)束。發(fā)現(xiàn)了病因,就可以找到預(yù)防的方法,以及治療的線索。例如,發(fā)現(xiàn)細(xì)菌是傳染病的病因,這個(gè)發(fā)現(xiàn)導(dǎo)致了后來抗生素和疫苗的發(fā)現(xiàn)。再如,發(fā)現(xiàn)高血脂可引起冠心病,控制高血脂的危險(xiǎn)因素就可以預(yù)防冠心病,而很多治療冠心病藥物也是受到血脂和動(dòng)脈粥樣硬化和血栓關(guān)系的啟發(fā)而產(chǎn)生的。
參考文獻(xiàn)
[1]唐金陵, GlasziouP..循證醫(yī)學(xué)概論//唐金陵, Glasziou P.循證醫(yī)學(xué)基礎(chǔ)[M]. 2版. 北京: 北京大學(xué)醫(yī)學(xué)出版社, 2016: 1–18.
Tang JL, Glasziou P.Introduction to evidence-based medicine//Tang JL, Glasziou P. Essentials in evidence-based medicine[M]. 2nd ed. Beijing: Peking University Medical Press, 2016: 1–18.
[2]Rothman KJ, Greenland S, Lash TL.Modern epidemiology[M]. 3rd ed. Philadelphia, PA: Lippincott Williams & Wilkins, 2008.
[3]Feinstein AR.Clinical epidemiology:the architecture of clinical research[M]. 2nd ed. Philadelphia, PA: W.B. Saunders, 1985.
[4]Haynes RB, Sackett DL, Guyatt GH, et al.Clinical epidemiology:how to do clinical practice research[M]. 3rd ed. Philadelphia, PA: Lippincott Williams & Wilkins, 2006.
[5]Fletcher RH, Fletcher SW.Clinical epidemiology:the essentials[M]. 5th ed. Baltimore, MD: Lippincott Williams & Wilkins, 2012.
[6]Straus SE, Glasziou P, Richardson WS, et al.Evidence-based medicine:how to practice and teach it[M]. 4th ed. Edinburgh: Churchill Livingstone, 2010.
[7]Altman DG.Practical statisticsfor medical research[M]. London: Chapman & Hall, 1990.
[8]Armitage P, Berry G, Matthews JNS.Statistical methods in medical research[M]. 4th ed. Oxford: Wiley-Blackwell Science, 2001.
[9]Day SJ, Graham DF. Sample size and power for comparing two or more treatment groups in clinical trials[J]. BMJ, 1989, 299(6700): 663–665. DOI:10.1136/bmj.299.6700.663
[10]Peto R, Collins R, Gray R. Large-scale randomized evidence:large, simple trials and overviews of trials[J]. J Clin Epidemiol, 1995, 48(1): 23–40. DOI:10.1016/0895-4356(94)00150-O
[11]Worrall J.Do we need some large, simple randomized trials in medicine//Suárez M, Dorato M, Rédei M. EPSA philosophical issues in the sciences[M]. Dordrecht: Springer, 2010: 289–301.
[12]Yusuf S, Collins R, Peto R. Why do we need some large, simple randomized trials?[J]. Stat Med, 1984, 3(4): 409–420. DOI:10.1002/sim.4780030421
[13]Bothwell LE, Greene JA, Podolsky SH, et al. Assessing the gold standard-lessons from the history of RCTs[J]. N Engl J Med, 2016, 374(22): 2175–2181. DOI:10.1056/NEJMms1604593
[14]Sedgwick P. What are the four phases of clinical research trials?[J]. BMJ, 2014, 348: g3727. DOI:10.1136/bmj.g3727
[15]Di MY, Tang JL. Adaption and application of the four phase trials to traditional Chinese medicines[J]. Evid Based Complement Alternat Med, 2013, 2013: 128030. DOI:10.1155/2013/128030
[16]唐金陵, 楊祖耀. 觀察與實(shí)驗(yàn)效力與效果[J]. 中華流行病學(xué)雜志, 2014, 35(3): 221–227.
Tang JL, Yang ZY. Observation versus experiment, efficacy versus effectiveness[J]. Chin J Epidemiol, 2014, 35(3): 221–227. DOI:10.3760/cma.j.issn.0254-6450.2014.03.001
[17]Glasziou P, Chalmers I, Rawlins M, et al. When are randomised trials unnecessary? Picking signal from noise[J]. BMJ, 2007, 334(7589): 349–351. DOI:10.1136/bmj.39070.527986.68
[18]唐金陵.證據(jù)選集導(dǎo)讀//唐金陵, GlasziouP.循證醫(yī)學(xué)基礎(chǔ)[M]. 2版. 北京: 北京大學(xué)醫(yī)學(xué)出版社, 2016: 226–228.
Tang JL. A summary of evidence on the effectiveness of selected medical interventions//Tang JL, Glasziou P.A summary of evidence on the effectiveness of selected medical interventions//Tang JL, Glasziou P. Essentials in evidence-based medicine[M]. 2nd ed. Beijing: Peking University Medical Press, 2016: 226–228.
[19]Lau J, Antman EM, Jimenez-Silva J, et al. Cumulative Meta-analysis of therapeutic trials for myocardial infarction[J]. N Engl J Med, 1992, 327(4): 248–254. DOI:10.1056/NEJM199207233270406
[20]Kuhn TS.The structure of scientific revolutions[M]. Chicago, IL: University of Chicago Press, 1962.
[21]Shrier I, Platt RW, Steele RJ. Mega-trials vs. heterogeneity?[J]. Contemp Clin Trials, 2007, 28(3): 324–328. DOI:10.1016/j.cct.2006.11.007
[22]Antman EM, Lau J, Kupelnick B, et al. A comparison of results of Meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial infarction[J]. JAMA, 1992, 268(2): 240–248.DOI:10.1001/jama.1992.03490020088036
[23]Mok TS, Wu YL, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma[J]. N Engl J Med, 2009, 361(10): 947–957. DOI:10.1056/NEJMoa0810699
[24]Mok TS, Wu YL, Ahn MJ, et al. Osimertinib or platinum-pemetrexed in EGFR T790M-positive lung cancer[J]. N Engl J Med, 2017, 376(7): 629–640. DOI:10.1056/NEJMoa1612674
[25]Guyatt GH, Oxman AD, Kunz R, et al. What is 'quality of evidence' and why is it important to clinicians?[J]. BMJ, 2008, 336(7651): 995–998. DOI:10.1136/bmj.39490.551019.BE
[26]Ioannidis JPA. Mega-trials for blockbusters[J]. JAMA, 2013, 309(3): 239–240. DOI:10.1001/jama.2012.168095
[27]Horton R. Offline:what is medicine's 5 sigma?[J]. Lancet, 2015, 385(9976): 1380. DOI:10.1016/S0140-6736(15)60696-1
[28]Goldacre B.Bad pharma:how drug companies mislead doctors and harm patients[M]. London: Fourth Estate, 2012.
[29]Moynihan R, Cassels A.Selling sickness:how the world's biggest pharmaceutical companies are turning us all into patients[M]. New York, NY: Nation Books, 2006.
[30]Smith R. Medical journals are an extension of the marketing arm of pharmaceutical companies[J]. PLoS Med, 2005, 2(5): e138. DOI:10.1371/journal.pmed.0020138
[31]Macleod MR, Michie S, Roberts I, et al. Biomedical research:increasing value, reducing waste[J]. Lancet, 2014, 383(9912): 101–104. DOI:10.1016/S0140-6736(13)62329-6
[32]Kim C, Prasad V. Cancer drugs approved on the basis of a surrogate end point and subsequent overall survival:an analysis of 5 years of US Food and Drug Administration approvals[J]. JAMA Intern Med, 2015, 175(12): 1992–1994. DOI:10.1001/jamainternmed.2015.5868
[33]Rupp T, Zuckerman D. Quality of life, overall survival, and costs of cancer drugs approved based on surrogate endpoints[J]. JAMA Intern Med, 2017, 177(2): 276–277. DOI:10.1001/jamainternmed.2016.7761
[34]Ioannidis JPA. Why most published research findings are false[J]. PLoS Med, 2005, 2(8): e124. DOI:10.1371/journal.pmed.0020124
[35]The Nurses' Health Study. About NHS[EB/OL].[2017-04-27].http://www.nurseshealthstudy.org/about-nhs.
[36]Oxford Clinical Trial Service Unit and Epidemiological Studies Unit. British doctors study[EB/OL].[2017-04-27]. https://www.ctsu.ox.ac.uk/research/british-doctors-study.
[37]Framingham Heart Study. Framingham heart study bibliography[EB/OL].[2017-04-27]. https://www.framinghamheartstudy.org/fhs-bibliography/index.php.
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
輕松5步,提出臨床研究好問題
再論觀察與實(shí)驗(yàn): 大數(shù)據(jù)現(xiàn)實(shí)世界研究不能取代隨機(jī)對(duì)照試驗(yàn)
隨機(jī)對(duì)照臨床試驗(yàn)(1/5): 概述
ISUOG實(shí)踐指南:超聲在預(yù)測(cè)子癇前期篩查及隨訪中的作用
一文講清常見幾類文獻(xiàn)的應(yīng)用場(chǎng)景
營(yíng)養(yǎng)支持對(duì)存在營(yíng)養(yǎng)風(fēng)險(xiǎn)的老年患者的質(zhì)量生命調(diào)整年的影響
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

主站蜘蛛池模板: 曲阳县| 抚顺县| 台山市| 建始县| 和林格尔县| 平利县| 临潭县| 吉木萨尔县| 瓮安县| 嫩江县| 余江县| 大同市| 宕昌县| 内黄县| 张家界市| 上高县| 宁城县| 舞阳县| 鄂尔多斯市| 洪泽县| 蕲春县| 宜章县| 宜良县| 平罗县| 兴城市| 诏安县| 古丈县| 长兴县| 阿尔山市| 扬州市| 周宁县| 项城市| 甘孜县| 南江县| 元阳县| 东乡县| 周宁县| 和硕县| 大埔区| 井研县| 中山市|