无码aⅴ一区二区三松子荣子,怡红院av亚洲一区二区三区h,日韩产品和欧美产品的区别

唐金陵, 楊祖耀, 毛琛

（999077 中國(guó)香港中文大學(xué)公共衛(wèi)生及基層醫(yī)療學(xué)院流行病學(xué)系）

摘要

現(xiàn)代流行病學(xué)是醫(yī)學(xué)應(yīng)用型研究的方法論，是在人群中定量地研究有關(guān)健康、疾病和醫(yī)療服務(wù)實(shí)踐問題一般規(guī)律的科學(xué)和藝術(shù)。流行病學(xué)研究結(jié)果的準(zhǔn)確度主要取決于研究的設(shè)計(jì)類型，精確度主要取決于樣本量大小。大型隨機(jī)對(duì)照試驗(yàn)是最精、最準(zhǔn)的流行病學(xué)研究設(shè)計(jì)類型，但是由于倫理的限制，只能用于評(píng)估醫(yī)學(xué)干預(yù)效果。一項(xiàng)研究需要的設(shè)計(jì)嚴(yán)謹(jǐn)性和樣本量與預(yù)期效果的大小成反比：效果越小，所需的研究設(shè)計(jì)就越嚴(yán)謹(jǐn)，需要的樣本量就越大。因此，只有當(dāng)療效比較小時(shí)，才需要大型隨機(jī)對(duì)照試驗(yàn)，當(dāng)療效十分明顯時(shí)，中小型隨機(jī)對(duì)照試驗(yàn)甚至觀察性研究就足以證明其有效性。從研究階段上看，它是確認(rèn)性、終結(jié)性研究，而不是提出假設(shè)的原創(chuàng)性研究。然而，研究的價(jià)值最終取決于研究問題的意義和原創(chuàng)性，而不是研究方法和P值的大小。過度推崇大型隨機(jī)對(duì)照試驗(yàn)會(huì)引發(fā)：① 對(duì)中、小療效干預(yù)的過度強(qiáng)調(diào)；② 對(duì)確認(rèn)性研究的過度重視，以及對(duì)項(xiàng)目大小和經(jīng)費(fèi)多少而不是科學(xué)問題的追逐，進(jìn)而弱化原創(chuàng)性研究工作；③ 增加研究資源、醫(yī)學(xué)活動(dòng)和患者利益被制藥公司綁架的風(fēng)險(xiǎn)。

關(guān)鍵詞: 研究設(shè)計(jì)；臨床試驗(yàn)；大型隨機(jī)對(duì)照試驗(yàn)；偏倚；樣本量

現(xiàn)代流行病學(xué)是醫(yī)學(xué)應(yīng)用型研究的方法論，是在人群中定量地研究有關(guān)健康、疾病和醫(yī)療服務(wù)實(shí)踐問題一般規(guī)律的科學(xué)和藝術(shù)。流行病學(xué)研究是與實(shí)驗(yàn)室基礎(chǔ)研究分庭抗禮的兩大醫(yī)學(xué)研究陣營(yíng)之一，可以用來研究疾病的病因和危險(xiǎn)因素、疾病診斷的準(zhǔn)確性、疾病負(fù)擔(dān)、疾病的轉(zhuǎn)歸及其影響因素、醫(yī)學(xué)干預(yù)措施的效果和副作用、醫(yī)學(xué)措施的成本效果等與醫(yī)學(xué)實(shí)踐直接相關(guān)的問題，其發(fā)現(xiàn)可直接用來指導(dǎo)和改善醫(yī)學(xué)實(shí)踐[1-3]。

一大型隨機(jī)對(duì)照試驗(yàn)是最精準(zhǔn)的流行病學(xué)研究

1.研究設(shè)計(jì)與研究結(jié)果的準(zhǔn)確度：科學(xué)研究的目的是揭示真相，流行病學(xué)研究也不例外。以干預(yù)措施效果的評(píng)估為例，如果一項(xiàng)具體的研究觀察到的結(jié)果為觀察值，真實(shí)的效果為真實(shí)值，則二者的關(guān)系如圖 1所示。觀察值和真實(shí)值之間的差別或距離，在流行病學(xué)中稱為偏倚，也稱作系統(tǒng)誤差。一個(gè)研究的偏倚越大，其觀察值離真實(shí)值越遠(yuǎn)，就越不準(zhǔn)確，反之亦然。控制偏倚的首要措施是研究設(shè)計(jì)。研究設(shè)計(jì)越嚴(yán)謹(jǐn)，偏倚越小，得到的結(jié)果就越準(zhǔn)確。

常見的可用于評(píng)估干預(yù)措施效果的流行病學(xué)研究設(shè)計(jì)包括單病例報(bào)告、無對(duì)照的病例系列、對(duì)照研究（定群研究）和隨機(jī)對(duì)照研究，在臨床試驗(yàn)里，它們被分別稱為單一病例試驗(yàn)、多病例無對(duì)照試驗(yàn)、非隨機(jī)分組的對(duì)照試驗(yàn)，以及隨機(jī)對(duì)照試驗(yàn)[4-5]。所謂試驗(yàn)，就是測(cè)試干預(yù)措施效果的試驗(yàn)性研究。不同的研究類型就像不同準(zhǔn)確度的尺子，有些可以測(cè)量到厘米，有些可以測(cè)量到毫米，隨機(jī)對(duì)照試驗(yàn)是流行病學(xué)研究里可測(cè)量到最小差別的尺子，是評(píng)估干預(yù)措施效果最嚴(yán)謹(jǐn)、最準(zhǔn)確、最可信的流行病學(xué)研究設(shè)計(jì)（圖 2）[1, 6]。

2.樣本量與研究結(jié)果的精確度：如圖 1所示，即使研究沒有任何偏倚，觀察值還是不可能與真實(shí)值完全重疊。由于隨機(jī)誤差的存在，不同研究得到的觀察值不是一個(gè)固定的值，而會(huì)因樣本量的不同圍繞一個(gè)中心值左右擺動(dòng)。擺動(dòng)的幅度與樣本量成反比：樣本量越大，研究結(jié)果圍繞中心值擺動(dòng)的平均幅度就越小，平均來說會(huì)更接近中心值，或者說精確度越高，反之則擺動(dòng)幅度越大，精確度越低。由此可見，精確度與隨機(jī)誤差成反比，主要由樣本量的大小決定，增加樣本量是提高精確度的主要措施[7-8]。

什么是合適的樣本量？一項(xiàng)研究需要的樣本量大小與其欲評(píng)估的干預(yù)絕對(duì)效果的大小有關(guān)[9]。以簡(jiǎn)單的兩組比較的臨床試驗(yàn)為例，估計(jì)樣本量需要知道對(duì)照組的有關(guān)事件發(fā)生率、治療效果的大小，統(tǒng)計(jì)學(xué)的第Ⅰ類和第Ⅱ類錯(cuò)誤的概率。第Ⅰ類和第Ⅱ類錯(cuò)誤是人為規(guī)定的幾個(gè)固定可選的常數(shù)值，隨機(jī)對(duì)照試驗(yàn)需要的樣本量主要取決于對(duì)照組結(jié)局事件的發(fā)生率及其與治療組事件發(fā)生率之間的差別（即效果的大小）。一般來講，干預(yù)的絕對(duì)效果越小，需要的樣本量就越大。如果結(jié)局事件的發(fā)生率很低，比如在心血管病和癌癥的預(yù)防研究中，干預(yù)的絕對(duì)效果無論如何都不會(huì)太大，因此需要的樣本量都會(huì)很大[1, 10-12]。

3.大型隨機(jī)對(duì)照試驗(yàn)：大型隨機(jī)對(duì)照試驗(yàn)又稱大規(guī)模隨機(jī)對(duì)照試驗(yàn)（large randomized trials或mega-trials），樣本量可以大至幾千，甚至上萬。與小型研究或其他設(shè)計(jì)類型的研究相比，大型隨機(jī)對(duì)照試驗(yàn)結(jié)果的精確度、準(zhǔn)確度都是最高的，因此，大型隨機(jī)對(duì)照試驗(yàn)就是最精、最準(zhǔn)的流行病學(xué)研究設(shè)計(jì)。由于樣本量很大，大型隨機(jī)對(duì)照試驗(yàn)在設(shè)計(jì)上往往還具備一些其他共同的特征，例如多中心、程序簡(jiǎn)單、病例特征和醫(yī)療條件寬泛、治療環(huán)境貼近實(shí)際醫(yī)療環(huán)境、可以估計(jì)實(shí)際效果、結(jié)果有利于推廣等。

大型研究為了快速征募病例并完成研究，研究者多會(huì)聯(lián)合很多單位，一個(gè)單位就是一個(gè)中心，各中心分別征募和治療自己中心的病例，研究在不同地方同時(shí)進(jìn)行。因此，大型隨機(jī)對(duì)照試驗(yàn)一般都是多中心試驗(yàn)，中心可以局限于一個(gè)國(guó)家或地區(qū)，也可以遍布全世界。由于研究中心遍布各地，每個(gè)地區(qū)在醫(yī)療環(huán)境、醫(yī)療水平、病例特征等方面存在差異，大型試驗(yàn)多是“簡(jiǎn)單試驗(yàn)”。所謂簡(jiǎn)單，就是在病例入選、治療安排和數(shù)據(jù)收集等方面采取比小型試驗(yàn)更為簡(jiǎn)單易行的方法。因?yàn)樾枰髂嫉牟±龜?shù)量很大，而且涉及的單位很多，各單位的條件和水平參差不齊，研究的各種要求需要考慮效率，還需要兼顧中下水平的參與單位的條件和能力，使它們能夠完成研究的各種要求。比如，病例入選條件應(yīng)該簡(jiǎn)單，不添加很多限制（如病程、病情、治療史和合并癥），不使用臨床上不常見的儀器，盡可能使臨床上同類病例都可以入選，這樣才會(huì)有更多的合格病例入選，加速病例征募的程序。

由于參與的地區(qū)和中心很多，以及病例入選條件和臨床治療環(huán)境比較寬泛，如果最終證明有效，一般認(rèn)為其結(jié)果更容易在實(shí)際醫(yī)療條件下得到重復(fù)，更容易推廣和普及。由于大型隨機(jī)對(duì)照試驗(yàn)的這些特點(diǎn)，以及它們結(jié)果的高準(zhǔn)確性和高精確性，大型隨機(jī)對(duì)照試驗(yàn)是目前最有影響的臨床研究，醫(yī)學(xué)雜志會(huì)爭(zhēng)相發(fā)表，如NEJM、Lancet、JAMA、BMJ幾乎每期都有報(bào)道，這又進(jìn)一步推升了大型隨機(jī)對(duì)照試驗(yàn)在臨床研究中的地位和影響力。

二隨機(jī)對(duì)照試驗(yàn)的適用條件

1.研究問題與隨機(jī)對(duì)照試驗(yàn)的選用：在流行病學(xué)研究的范式里，針對(duì)同一研究問題，有多種研究設(shè)計(jì)可以選用，不同研究設(shè)計(jì)提供的證據(jù)可信度高低有別，只有一種是最優(yōu)的切實(shí)可行的研究類型（表 1）。例如，欲研究吸煙與肺癌的關(guān)系，可選擇的研究設(shè)計(jì)包括：病例系列、橫斷面研究、生態(tài)學(xué)研究、病例對(duì)照研究、隊(duì)列研究。隊(duì)列研究是研究病因切實(shí)可行的可信度最高的研究。又如，評(píng)估干預(yù)的效果，單病例試驗(yàn)、多病例無對(duì)照試驗(yàn)、非隨機(jī)分組對(duì)照試驗(yàn)都可以用于評(píng)估干預(yù)的效果，隨機(jī)對(duì)照試驗(yàn)是可信度最高的切實(shí)可行的研究。但是，在研究藥物嚴(yán)重、罕見的慢性不良反應(yīng)時(shí)，最可信、切實(shí)可行的研究往往是病例對(duì)照研究。

評(píng)估醫(yī)學(xué)干預(yù)的效果，至少有4類研究可以使用，但是它們不是等同的。從設(shè)計(jì)上講，主要區(qū)別為3個(gè)方面：觀察從暴露到結(jié)局的時(shí)間走向，對(duì)照的特征，比較組間的可比性。研究設(shè)計(jì)的核心區(qū)別就是在處理這些問題上的不同，研究設(shè)計(jì)的進(jìn)步就是在處理這些問題上的進(jìn)步。不同研究提供的證據(jù)的可信度有高有低，隨機(jī)對(duì)照試驗(yàn)最高，單個(gè)病例試驗(yàn)最低。提高可信度是有代價(jià)的，一般來講研究需要的資源（包括時(shí)間）與結(jié)果的可信度成正比，回答一類問題最可信、切實(shí)可行的研究往往也是最昂貴耗時(shí)的研究。據(jù)估計(jì)，一個(gè)典型的大型隨機(jī)對(duì)照試驗(yàn)平均需要費(fèi)用高達(dá)3 000萬美元[13]。進(jìn)行大型隨機(jī)對(duì)照試驗(yàn)必須謹(jǐn)慎。

其實(shí)，評(píng)估干預(yù)效果時(shí)，不是都需要使用隨機(jī)對(duì)照試驗(yàn)的。在效果極其明顯時(shí)（如白內(nèi)障手術(shù)、斷肢再植、麻醉和輸血），通常不需要隨機(jī)對(duì)照試驗(yàn)的確認(rèn)[13]。因?yàn)樾Ч麡O其明顯的干預(yù)措施畢竟是少數(shù)，絕大多數(shù)干預(yù)措施還是需要經(jīng)過隨機(jī)對(duì)照試驗(yàn)的驗(yàn)證，但不是所有情況下都需要使用大型隨機(jī)對(duì)照試驗(yàn)。效果明顯時(shí)（如抗生素），中、小型試驗(yàn)就足以，只有當(dāng)效果較小時(shí)，才需要大型隨機(jī)對(duì)照試驗(yàn)。

2.研究階段與隨機(jī)對(duì)照試驗(yàn)的選用：決定研究設(shè)計(jì)選擇的另一個(gè)重要因素是評(píng)估的階段。對(duì)于同一類研究問題，研究設(shè)計(jì)的選擇主要取決于研究的階段。

科學(xué)研究可大致分為3個(gè)階段：產(chǎn)生假設(shè)、檢驗(yàn)假設(shè)和確認(rèn)假設(shè)。從時(shí)間上看，產(chǎn)生假設(shè)是研究的初期階段，檢驗(yàn)假設(shè)是中期階段，確認(rèn)假設(shè)是終末階段。就評(píng)估醫(yī)學(xué)干預(yù)效果而言，早期階段應(yīng)使用安全、快速、簡(jiǎn)單、省錢的研究，但結(jié)果可信度比較低，中期應(yīng)使用可信度較高的研究，最后再經(jīng)過隨機(jī)對(duì)照試驗(yàn)的確認(rèn)。

以新藥的臨床驗(yàn)證為例，一般分為4個(gè)階段，即常說的Ⅰ~Ⅳ期臨床試驗(yàn)（圖 3）[14-16]。研究的問題包括毒副作用和效果2個(gè)方面，對(duì)二者的研究也需要循序漸進(jìn)，研究設(shè)計(jì)選擇也需靈活多變。Ⅰ期臨床試驗(yàn)是一個(gè)新藥第一次在人體上的測(cè)試，需十分謹(jǐn)慎，評(píng)估的不是療效而是急性毒性作用，也包括對(duì)藥物代謝動(dòng)力學(xué)的考察。研究往往是在仔細(xì)挑選的健康人中進(jìn)行的，且沒有對(duì)照組。如果一個(gè)藥物通過了Ⅰ期試驗(yàn)，沒有明顯的急性毒性作用，可進(jìn)入Ⅱ期試驗(yàn)，對(duì)療效進(jìn)行初步評(píng)估。根據(jù)評(píng)估的進(jìn)展時(shí)段，可選的研究設(shè)計(jì)很多，如無對(duì)照試驗(yàn)、前后對(duì)照試驗(yàn)、交叉試驗(yàn)、非隨機(jī)的平行對(duì)照試驗(yàn)和小樣本隨機(jī)對(duì)照試驗(yàn)等。Ⅲ期試驗(yàn)是對(duì)療效最嚴(yán)格的驗(yàn)證，需要使用樣本量足夠大的隨機(jī)對(duì)照盲法試驗(yàn)。Ⅳ期試驗(yàn)是藥物上市后的研究，主要是對(duì)嚴(yán)重罕見慢性不良反應(yīng)的監(jiān)察，主要使用的是病例對(duì)照研究和隊(duì)列研究。

三大型隨機(jī)對(duì)照試驗(yàn)的作用和陷阱

1.大型隨機(jī)對(duì)照試驗(yàn)的作用：為什么要進(jìn)行大型隨機(jī)對(duì)照試驗(yàn)?zāi)兀孔罡镜睦碛墒茄芯繂栴}的需要，具體來說是欲證明的治療的效果很小。由此可見，大型隨機(jī)對(duì)照試驗(yàn)主要是用于評(píng)估中小療效（尤其是小療效）的干預(yù)措施的效果[10]。

換言之，如果一個(gè)隨機(jī)對(duì)照試驗(yàn)需要很大的樣本量，那么它所估計(jì)的絕對(duì)效果就一定很小。白內(nèi)障手術(shù)，立竿見影，3~5例患者就足以證明其效果，對(duì)照都不需要。抗菌素治療大葉性肺炎，在幾十例病例中測(cè)試就足夠了。但是，要證明一個(gè)抗高血壓藥物是否可以預(yù)防心血管事件，一般需要幾千甚至上萬病例，隨訪觀察幾年的時(shí)間。

上述3種治療之間，第一種肯定是最有效的，第三種是效果最低的。換言之，臨床觀察就可以確認(rèn)的效果一定大于小型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果，小型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果一定大于大型隨機(jī)對(duì)照試驗(yàn)可確認(rèn)的效果。從這個(gè)意義上講，我們絕不能說臨床觀察和小型隨機(jī)對(duì)照試驗(yàn)確認(rèn)的療效沒有大型隨機(jī)試驗(yàn)證明的效果重要，其實(shí)恰恰相反。

事實(shí)上，抗生素、麻醉術(shù)、胰島素、夾板正骨、癤癰引流、大失血后的輸血、出血的壓迫或包扎等十分有效的醫(yī)學(xué)措施，在隨機(jī)對(duì)照試驗(yàn)誕生以前，就被證明有效且廣泛應(yīng)用了[17]。相反，隨機(jī)對(duì)照試驗(yàn)誕生以后，我們并沒有產(chǎn)生多少新的比這些治療更有效的措施，現(xiàn)在臨床上使用最多的抗高血壓藥物、抗血脂藥物、抗腫瘤藥物（表 2）等，雖然它們的療效經(jīng)都過大型隨機(jī)對(duì)照試驗(yàn)的確認(rèn)，但是它們的效果遠(yuǎn)遠(yuǎn)沒有上述醫(yī)學(xué)措施的效果明顯而快速[18]。

認(rèn)識(shí)到這一點(diǎn)十分重要，在討論大型隨機(jī)對(duì)照試驗(yàn)結(jié)果的臨床實(shí)踐意義時(shí)，不能盯在樣本量上，不能把樣本量和統(tǒng)計(jì)學(xué)顯著性與干預(yù)效果大小混為一談，干預(yù)的臨床價(jià)值在于其療效的大小，不是樣本量的大小。增加隨機(jī)對(duì)照試驗(yàn)的樣本量，可以增加測(cè)量的穩(wěn)定性，但是只有當(dāng)效果很小時(shí)才需要大型隨機(jī)對(duì)照試驗(yàn)。換言之，對(duì)研究要求越是精、準(zhǔn)，說明欲證明的效果就越小。相反，如果效果很大，小型隨機(jī)對(duì)照試驗(yàn)甚至非隨機(jī)分組的對(duì)照試驗(yàn)就足以形成確認(rèn)性研究。

如此看來，大型隨機(jī)對(duì)照試驗(yàn)只是評(píng)估中、小療效的金標(biāo)準(zhǔn)，不是評(píng)估所有干預(yù)措施的金標(biāo)準(zhǔn)。大型隨機(jī)對(duì)照試驗(yàn)也可能用來比較兩個(gè)療效差別不大的治療，證明療效不存在，或是證明藥物間中、小交互作用的存在。但無論是哪種情況，需要大型隨機(jī)對(duì)照試驗(yàn)證明的作用或差別都是比較小的，因此它們的實(shí)踐意義也是值得拷問的。

2.大型隨機(jī)對(duì)照試驗(yàn)不是原創(chuàng)性研究：如前所述，對(duì)一個(gè)科學(xué)問題的探索可分為提出假設(shè)、驗(yàn)證假設(shè)和確認(rèn)假設(shè)3個(gè)階段。從評(píng)估干預(yù)效果的程序上看，大型隨機(jī)對(duì)照試驗(yàn)不屬于早期提出科學(xué)問題的原創(chuàng)性研究，而是中后期的確認(rèn)性研究[16, 19]，是最后的研究，是終結(jié)性研究，一旦證明有效，將不再需要新的研究繼續(xù)驗(yàn)證，一般也不會(huì)衍生出新的科學(xué)發(fā)現(xiàn)和發(fā)明。

如果把流行病學(xué)研究分為創(chuàng)新性研究和驗(yàn)證性研究，前者在于提出嶄新的研究問題或假設(shè)，后者在于驗(yàn)證初步探索過的假設(shè)或理論的正確性。前者是科學(xué)發(fā)展的基礎(chǔ)，是科學(xué)的靈魂，因?yàn)闆]有前者就不需要后者；但是如果沒有后者，科學(xué)就只有一堆不知錯(cuò)對(duì)的想象和假設(shè)而已，科學(xué)將不會(huì)扎實(shí)地進(jìn)步。前者更多需要的是靈感和想象力，是科學(xué)家的核心價(jià)值所在；而后者更多依賴于研究資源和執(zhí)行能力，是常規(guī)科學(xué)和科學(xué)工匠的工作范圍[20]。

由此可見，科學(xué)研究（尤其是醫(yī)學(xué)應(yīng)用型研究）的意義和價(jià)值最終取決于研究問題，而不是回答問題的方法的優(yōu)劣和結(jié)果的精準(zhǔn)。哲學(xué)家Laude Levi-Strauss甚至說，真正的科學(xué)家是那些提出關(guān)鍵問題的人，而不是可以正確回答問題的人。普林斯頓大學(xué)統(tǒng)計(jì)學(xué)系創(chuàng)始人John Tukey也說過：數(shù)據(jù)分析最重要的原則，也是很多統(tǒng)計(jì)學(xué)家想規(guī)避的原則：對(duì)一個(gè)正確問題的不精準(zhǔn)回答，遠(yuǎn)遠(yuǎn)好于對(duì)一個(gè)錯(cuò)誤問題的精準(zhǔn)回答。統(tǒng)計(jì)分析和流行病學(xué)研究的正確運(yùn)用，其實(shí)異曲同工。再好再大的研究，如果沒有一流的研究問題，也不可能成為一流的研究。

3.大型隨機(jī)對(duì)照試驗(yàn)的陷阱：大型隨機(jī)對(duì)照試驗(yàn)是最精、最準(zhǔn)的流行病學(xué)研究，因此人們經(jīng)常把大型隨機(jī)對(duì)照試驗(yàn)視為確認(rèn)醫(yī)學(xué)干預(yù)措施效果的金標(biāo)準(zhǔn)[13]。NEJM、Lancet、JAMA、BMJ等醫(yī)學(xué)雜志已成為大型隨機(jī)對(duì)照試驗(yàn)熱衷的發(fā)布平臺(tái)，它們的宣傳和肯定進(jìn)一步推升和穩(wěn)固了大型隨機(jī)對(duì)照試驗(yàn)在醫(yī)學(xué)實(shí)踐中的“霸主”地位。因此，大型隨機(jī)對(duì)照試驗(yàn)成了國(guó)際臨床指南所追捧的旗幟，通過國(guó)際指南巨大而又快速影響著世界范圍內(nèi)的醫(yī)學(xué)實(shí)踐活動(dòng)。

然而，大型隨機(jī)對(duì)照試驗(yàn)只是確認(rèn)中、小療效的金標(biāo)準(zhǔn)，不是確認(rèn)十分有效的干預(yù)的金標(biāo)準(zhǔn)。在醫(yī)學(xué)實(shí)踐中，過度推崇大型隨機(jī)對(duì)照試驗(yàn)，會(huì)導(dǎo)致對(duì)中、小療效干預(yù)的過度強(qiáng)調(diào)。所謂中、小療效的臨床意義是值得商榷的[11]，而且在多數(shù)情況下中、小型隨機(jī)對(duì)照試驗(yàn)的系統(tǒng)綜述完全可以替代大型隨機(jī)對(duì)照試驗(yàn)[19, 21-22]。另外，如果設(shè)計(jì)上出了問題，例如未使用重要的終末結(jié)局[23-25]，大型隨機(jī)對(duì)照試驗(yàn)的浪費(fèi)是巨大的[26]。

絕大多數(shù)大型隨機(jī)對(duì)照試驗(yàn)主要是評(píng)估新的藥物。過度推崇大型隨機(jī)對(duì)照試驗(yàn)，還會(huì)導(dǎo)致對(duì)新藥的過度重視和依賴，弱化很多老的甚至更有效的藥物，弱化預(yù)防、非藥物干預(yù)（例如生活方式）和傳統(tǒng)醫(yī)學(xué)（例如中醫(yī)）的作用[13]。

在醫(yī)學(xué)研究中，過度推崇大型隨機(jī)對(duì)照試驗(yàn)，會(huì)導(dǎo)致對(duì)確認(rèn)性研究的過度重視，因而間接地弱化開創(chuàng)性研究工作的重要性，導(dǎo)致對(duì)大型驗(yàn)證性項(xiàng)目的盲目崇拜，對(duì)大樣本和統(tǒng)計(jì)學(xué)顯著性而不是臨床意義的重視[27]，以及對(duì)科研經(jīng)費(fèi)而不是科學(xué)問題的追逐。長(zhǎng)期下去，勢(shì)必會(huì)導(dǎo)致研究領(lǐng)域原創(chuàng)性能力的下降，丟了科學(xué)靈魂（表 3）。

大型隨機(jī)對(duì)照試驗(yàn)的病例入選條件和臨床治療環(huán)境比較寬泛，增加了代表性，提高了結(jié)果的外推性，似乎是一個(gè)優(yōu)點(diǎn)。但實(shí)際上，這恰恰是大型隨機(jī)對(duì)照試驗(yàn)的另一個(gè)更隱秘的陷阱。為了盡快招募到足夠的病例，大型隨機(jī)對(duì)照試驗(yàn)經(jīng)常會(huì)放寬納入標(biāo)準(zhǔn)。在療效很小的情況下，病例納入標(biāo)準(zhǔn)越寬泛，從治療中受益的病例的比例可能就越低，需要的樣本量就越大，最后認(rèn)為在更廣泛的病例中治療有效就越不合理，因?yàn)闀?huì)使更多不會(huì)受益的人接受治療。大型隨機(jī)對(duì)照試驗(yàn)所謂增加了研究的外部真實(shí)性，其實(shí)是一種誤導(dǎo)。

另外，值得注意的是，很多大型隨機(jī)對(duì)照試驗(yàn)是由藥廠資助的，它們已經(jīng)成為推廣藥物最有力的市場(chǎng)工具[28-31]。例如，NEJM曾多次報(bào)道有關(guān)癌癥靶向治療藥物的臨床試驗(yàn)，但是這些極其昂貴的藥物最好也只不過能延長(zhǎng)幾個(gè)月的生存，經(jīng)常只是延緩腫瘤進(jìn)展幾個(gè)月的時(shí)間，但并不能延長(zhǎng)生存，也不能提高生命質(zhì)量[23-24, 32-33]。這使得我們更應(yīng)該對(duì)大型隨機(jī)對(duì)照試驗(yàn)持客觀、謹(jǐn)慎、警覺的態(tài)度。

Ioannidis[34]曾說，醫(yī)學(xué)研究中有很多所謂的“陽性結(jié)果”和“重要發(fā)現(xiàn)”只是具有高度統(tǒng)計(jì)學(xué)顯著意義但沒有太大臨床意義的結(jié)果，或者是在各種動(dòng)機(jī)的驅(qū)使下玩弄數(shù)字的結(jié)果，很難得到重復(fù)。大型隨機(jī)對(duì)照試驗(yàn)的結(jié)果被重復(fù)驗(yàn)證的機(jī)會(huì)幾乎是零，因?yàn)榇笮碗S機(jī)對(duì)照試驗(yàn)極其昂貴，針對(duì)同一研究問題開展兩個(gè)或多個(gè)如此昂貴的研究的可能性極小。即使有后續(xù)研究，由于研究間諸多因素的不同，它們的結(jié)果都不大可能否定之前大型試驗(yàn)的結(jié)論，從而使得現(xiàn)實(shí)中不大可能出現(xiàn)有效的驗(yàn)證研究。這種幾乎不可驗(yàn)證的特性，增加了大型隨機(jī)對(duì)照試驗(yàn)被不良動(dòng)機(jī)利用、甚至出現(xiàn)欺騙性結(jié)果的風(fēng)險(xiǎn)。

四大型隨機(jī)對(duì)照試驗(yàn)與大型隊(duì)列研究的區(qū)別

20世紀(jì)中葉以后，隨機(jī)對(duì)照試驗(yàn)的興起以及醫(yī)學(xué)對(duì)大型隨機(jī)對(duì)照試驗(yàn)的尊崇和膜拜，正在導(dǎo)致對(duì)中、小干預(yù)效果的過度重視，對(duì)驗(yàn)證性研究的過度重視，對(duì)樣本量和研究經(jīng)費(fèi)的過度追逐，進(jìn)而導(dǎo)致對(duì)原創(chuàng)性研究的淡化。但是，這樣的結(jié)論似乎不適用于大型前瞻性隊(duì)列研究。

除了研究設(shè)計(jì)嚴(yán)謹(jǐn)性之外，大型前瞻性隊(duì)列研究與大型隨機(jī)對(duì)照試驗(yàn)之間存在兩個(gè)重要區(qū)別。一是隨機(jī)對(duì)照試驗(yàn)一般只能用來回答一個(gè)簡(jiǎn)單的研究問題，即在干預(yù)和結(jié)局方面都必須做嚴(yán)格的限定，如某藥與安慰劑比較是否可以在某特定病例中改變某重要臨床結(jié)局。隊(duì)列研究則不然，它可納入的暴露往往有幾十種幾百種甚至更多，對(duì)照有很多種可能，這些暴露可能影響的結(jié)局又有很多種，可以包括多種常見和罕見疾病[35-37]。因此，通常一個(gè)隨機(jī)對(duì)照試驗(yàn)一般只產(chǎn)生一個(gè)核心研究報(bào)告，而大型隊(duì)列研究可以產(chǎn)生無數(shù)個(gè)重要性相當(dāng)?shù)难芯繄?bào)告。例如，美國(guó)的佛明翰心臟研究1950年以來共發(fā)表超過3 000篇文章，涉及很多危險(xiǎn)因素和疾病，是歷史上貢獻(xiàn)最大的流行病學(xué)研究之一[37]。

大型隊(duì)列研究與大型隨機(jī)對(duì)照試驗(yàn)的第二個(gè)重要區(qū)別在于它們可引發(fā)新的發(fā)現(xiàn)。大型隨機(jī)對(duì)照試驗(yàn)是終結(jié)性研究，所謂終結(jié)性研究，就是完成以后不再需要新的驗(yàn)證，一般也不會(huì)引發(fā)出新的科學(xué)問題。隊(duì)列研究則不同，主要用于發(fā)現(xiàn)病因，病因是預(yù)防和治療疾病的開始，因此隊(duì)列研究是控制一個(gè)疾病的開端，而不是結(jié)束。發(fā)現(xiàn)了病因，就可以找到預(yù)防的方法，以及治療的線索。例如，發(fā)現(xiàn)細(xì)菌是傳染病的病因，這個(gè)發(fā)現(xiàn)導(dǎo)致了后來抗生素和疫苗的發(fā)現(xiàn)。再如，發(fā)現(xiàn)高血脂可引起冠心病，控制高血脂的危險(xiǎn)因素就可以預(yù)防冠心病，而很多治療冠心病藥物也是受到血脂和動(dòng)脈粥樣硬化和血栓關(guān)系的啟發(fā)而產(chǎn)生的。

參考文獻(xiàn)

[1]唐金陵, GlasziouP..循證醫(yī)學(xué)概論//唐金陵, Glasziou P.循證醫(yī)學(xué)基礎(chǔ)[M]. 2版. 北京: 北京大學(xué)醫(yī)學(xué)出版社, 2016: 1–18.

Tang JL, Glasziou P.Introduction to evidence-based medicine//Tang JL, Glasziou P. Essentials in evidence-based medicine[M]. 2nd ed. Beijing: Peking University Medical Press, 2016: 1–18.

[2]Rothman KJ, Greenland S, Lash TL.Modern epidemiology[M]. 3rd ed. Philadelphia, PA: Lippincott Williams & Wilkins, 2008.

[3]Feinstein AR.Clinical epidemiology:the architecture of clinical research[M]. 2nd ed. Philadelphia, PA: W.B. Saunders, 1985.

[4]Haynes RB, Sackett DL, Guyatt GH, et al.Clinical epidemiology:how to do clinical practice research[M]. 3rd ed. Philadelphia, PA: Lippincott Williams & Wilkins, 2006.

[5]Fletcher RH, Fletcher SW.Clinical epidemiology:the essentials[M]. 5th ed. Baltimore, MD: Lippincott Williams & Wilkins, 2012.

[6]Straus SE, Glasziou P, Richardson WS, et al.Evidence-based medicine:how to practice and teach it[M]. 4th ed. Edinburgh: Churchill Livingstone, 2010.

[7]Altman DG.Practical statisticsfor medical research[M]. London: Chapman & Hall, 1990.

[8]Armitage P, Berry G, Matthews JNS.Statistical methods in medical research[M]. 4th ed. Oxford: Wiley-Blackwell Science, 2001.

[9]Day SJ, Graham DF. Sample size and power for comparing two or more treatment groups in clinical trials[J]. BMJ, 1989, 299(6700): 663–665. DOI:10.1136/bmj.299.6700.663

[10]Peto R, Collins R, Gray R. Large-scale randomized evidence:large, simple trials and overviews of trials[J]. J Clin Epidemiol, 1995, 48(1): 23–40. DOI:10.1016/0895-4356(94)00150-O

[11]Worrall J.Do we need some large, simple randomized trials in medicine//Suárez M, Dorato M, Rédei M. EPSA philosophical issues in the sciences[M]. Dordrecht: Springer, 2010: 289–301.

[12]Yusuf S, Collins R, Peto R. Why do we need some large, simple randomized trials?[J]. Stat Med, 1984, 3(4): 409–420. DOI:10.1002/sim.4780030421

[13]Bothwell LE, Greene JA, Podolsky SH, et al. Assessing the gold standard-lessons from the history of RCTs[J]. N Engl J Med, 2016, 374(22): 2175–2181. DOI:10.1056/NEJMms1604593

[14]Sedgwick P. What are the four phases of clinical research trials?[J]. BMJ, 2014, 348: g3727. DOI:10.1136/bmj.g3727

[15]Di MY, Tang JL. Adaption and application of the four phase trials to traditional Chinese medicines[J]. Evid Based Complement Alternat Med, 2013, 2013: 128030. DOI:10.1155/2013/128030

[16]唐金陵, 楊祖耀. 觀察與實(shí)驗(yàn)效力與效果[J]. 中華流行病學(xué)雜志, 2014, 35(3): 221–227.

Tang JL, Yang ZY. Observation versus experiment, efficacy versus effectiveness[J]. Chin J Epidemiol, 2014, 35(3): 221–227. DOI:10.3760/cma.j.issn.0254-6450.2014.03.001

[17]Glasziou P, Chalmers I, Rawlins M, et al. When are randomised trials unnecessary? Picking signal from noise[J]. BMJ, 2007, 334(7589): 349–351. DOI:10.1136/bmj.39070.527986.68

[18]唐金陵.證據(jù)選集導(dǎo)讀//唐金陵, GlasziouP.循證醫(yī)學(xué)基礎(chǔ)[M]. 2版. 北京: 北京大學(xué)醫(yī)學(xué)出版社, 2016: 226–228.

Tang JL. A summary of evidence on the effectiveness of selected medical interventions//Tang JL, Glasziou P.A summary of evidence on the effectiveness of selected medical interventions//Tang JL, Glasziou P. Essentials in evidence-based medicine[M]. 2nd ed. Beijing: Peking University Medical Press, 2016: 226–228.

[19]Lau J, Antman EM, Jimenez-Silva J, et al. Cumulative Meta-analysis of therapeutic trials for myocardial infarction[J]. N Engl J Med, 1992, 327(4): 248–254. DOI:10.1056/NEJM199207233270406

[20]Kuhn TS.The structure of scientific revolutions[M]. Chicago, IL: University of Chicago Press, 1962.

[21]Shrier I, Platt RW, Steele RJ. Mega-trials vs. heterogeneity?[J]. Contemp Clin Trials, 2007, 28(3): 324–328. DOI:10.1016/j.cct.2006.11.007

[22]Antman EM, Lau J, Kupelnick B, et al. A comparison of results of Meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial infarction[J]. JAMA, 1992, 268(2): 240–248.DOI:10.1001/jama.1992.03490020088036

[23]Mok TS, Wu YL, Thongprasert S, et al. Gefitinib or carboplatin-paclitaxel in pulmonary adenocarcinoma[J]. N Engl J Med, 2009, 361(10): 947–957. DOI:10.1056/NEJMoa0810699

[24]Mok TS, Wu YL, Ahn MJ, et al. Osimertinib or platinum-pemetrexed in EGFR T790M-positive lung cancer[J]. N Engl J Med, 2017, 376(7): 629–640. DOI:10.1056/NEJMoa1612674

[25]Guyatt GH, Oxman AD, Kunz R, et al. What is 'quality of evidence' and why is it important to clinicians?[J]. BMJ, 2008, 336(7651): 995–998. DOI:10.1136/bmj.39490.551019.BE

[26]Ioannidis JPA. Mega-trials for blockbusters[J]. JAMA, 2013, 309(3): 239–240. DOI:10.1001/jama.2012.168095

[27]Horton R. Offline:what is medicine's 5 sigma?[J]. Lancet, 2015, 385(9976): 1380. DOI:10.1016/S0140-6736(15)60696-1

[28]Goldacre B.Bad pharma:how drug companies mislead doctors and harm patients[M]. London: Fourth Estate, 2012.

[29]Moynihan R, Cassels A.Selling sickness:how the world's biggest pharmaceutical companies are turning us all into patients[M]. New York, NY: Nation Books, 2006.

[30]Smith R. Medical journals are an extension of the marketing arm of pharmaceutical companies[J]. PLoS Med, 2005, 2(5): e138. DOI:10.1371/journal.pmed.0020138

[31]Macleod MR, Michie S, Roberts I, et al. Biomedical research:increasing value, reducing waste[J]. Lancet, 2014, 383(9912): 101–104. DOI:10.1016/S0140-6736(13)62329-6

[32]Kim C, Prasad V. Cancer drugs approved on the basis of a surrogate end point and subsequent overall survival:an analysis of 5 years of US Food and Drug Administration approvals[J]. JAMA Intern Med, 2015, 175(12): 1992–1994. DOI:10.1001/jamainternmed.2015.5868

[33]Rupp T, Zuckerman D. Quality of life, overall survival, and costs of cancer drugs approved based on surrogate endpoints[J]. JAMA Intern Med, 2017, 177(2): 276–277. DOI:10.1001/jamainternmed.2016.7761

[34]Ioannidis JPA. Why most published research findings are false[J]. PLoS Med, 2005, 2(8): e124. DOI:10.1371/journal.pmed.0020124

[35]The Nurses' Health Study. About NHS[EB/OL].[2017-04-27].http://www.nurseshealthstudy.org/about-nhs.

[36]Oxford Clinical Trial Service Unit and Epidemiological Studies Unit. British doctors study[EB/OL].[2017-04-27]. https://www.ctsu.ox.ac.uk/research/british-doctors-study.

[37]Framingham Heart Study. Framingham heart study bibliography[EB/OL].[2017-04-27]. https://www.framinghamheartstudy.org/fhs-bibliography/index.php.

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

精品伊人久久大香线蕉,开心久久婷婷综合中文字幕,杏田冲梨,人妻无码aⅴ不卡中文字幕