作者簡介:黃卓山(1988-),男,廣州人,碩士研究生,從事冠心病的基礎與臨床研究。
隨機對照臨床試驗是目前獲得證據、制定診療策略的主要依據之一,但是,隨機對照試驗并不總能代表臨床實踐中的真實情況。真實世界研究是觀察性研究,通過“真實世界樣本”來反映真實世界總體。臨床試驗關注效力研究,而真實世界研究則關注效果研究。真實世界研究需要使用多重傾向性評分來減少協變量在組間分布的不均衡性。近年來,真實世界研究正越來越多地應用到臨床研究中,可將經驗醫學與循證醫學結合起來。臨床試驗和真實世界研究是承啟關系,前者的結果需要后者的進一步驗證及拓展,二者綜合考慮才是最佳選擇。
Randomized controlled trial (RCT) is so far considered as an important way to provide evidence to make up therapeutic strategy. However, sometimes it is limited to represent the authentic condition during clinical practice. Whereas, Real world study(RWS), a kind of observational studies, is applied to present the real world population through analysis of “real world sample”. RCT pays more attention to efficacy trials. While RWS more concentrates on effectiveness trials. RWS requires giving propensity scores to decrease covariant malconformation among groups. In the past few years, RWS has been increasingly applied in clinical studies to integrate experience medicine with evidence-based medicine. Results of RCT need to be tested and expanded forward in real world study. Therefore, comprehensive evaluations by both RCT and RWS are supposed to be the best selection.
Symplicity HTN-1是首個腎交感神經消融(renal sympathetic denervation, RSD)治療高血壓的臨床研究[1], 45例難治性高血壓患者接受了RSD治療, 結果顯示術后即刻與術前相比平均診室血壓降低, 術后1個月顯著降低。隨后, 該研究進一步擴大樣本量至153例, 隨訪2年結果顯示, 患者血壓水平有明顯的下降[2]。最終3年的隨訪結果顯示[3], 術后12個月、24個月、36個月, 患者血壓分別降低27/12 mmHg、30/13 mmHg、32/14 mmHg。術后隨訪1個月、6個月、12個月、24個月、36個月時, 分別有69%、81%、83%、85%、93%的患者收縮壓降低10 mmHg以上, 提示部分患者可能存在延遲起效。雖然該研究提示RSD具有良好的安全性和有效性, 但是不能排除安慰劑效應和觀察者偏倚, 因此提出需要進行前瞻性隨機臨床研究。
為解決HTN-1試驗設計的局限性, 2010年Symplicity HTN-2試驗采用多中心、前瞻性、隨機對照設計[4], 106例難治性高血壓患者按1∶ 1比例隨機分組, 一組接受導管消融術和常規降壓藥物治療, 另一組僅接受降壓藥物治療。6個月隨訪時, 與基線血壓水平相比, 手術治療組血壓下降32/12 mmHg, 藥物治療組血壓無明顯改變, 兩組間平均血壓差為33/11 mmHg, 存在明顯差異。隨后, 該試驗對照組中35例患者接受了RSD治療, 再隨訪6個月后平均收縮壓顯著下降(24 mmHg)[5]。此項隨機試驗證實了以前的研究結果, 但也同樣有局限性。第一, 樣本量相對較小。第二, 隨訪時間有限。第三, 繼發性高血壓篩查有限, 患者用藥依從性不可控。第四, 以診室血壓作為主要觀察結果而非24小時動態血壓監測易產生測量誤差和觀察者偏倚。第五, 頑固性高血壓定義和藥物治療不嚴格。第六, 患者不設盲故不能排除安慰劑效應。
基于以上理由, Symplicity HTN-3多中心試驗于2011年開展[6]。該研究為單盲、隨機、對照研究, 入選530名難治性高血壓患者, 隨機分為RSD組和單純藥物治療組(按2∶ 1比例隨機分組), 主要研究終點指標為術后6個月患者診室收縮壓變化, 次要終點指標是術后6個月患者24小時血壓動態監測的平均變化, 主要安全性終點指標是術后6個月內主要不良事件發生率。該試驗設有非常嚴格的入組標準, 排除首次動態血壓評估平均收縮壓< 135 mmHg的患者, 同時, 對臨床觀察人員設盲并應用自動血壓計監測診室血壓。此外, 所有隨機進入對照組的患者均需接受假手術治療。然而, 出乎意料的是, 試驗沒有達到最初設定的主要終點。盡管沒有安全性方面的相關事件發生, 但受試者的收縮壓未曾持續性下降。
這是一個讓人意外的結果, 但底特律醫學中心醫學博士Cindy Grines說:“ 我認為這個研究結果并不能終結這種去腎神經支配手術的開展。相反這個試驗結果可能僅僅是由于方法學的錯誤所造成” 。隨機對照臨床試驗(randomized controlled trial, RCT)是目前公認的治療性或預防性臨床研究方法的金標準, 用于臨床醫學研究已有50多年的歷史。RCT是將符合要求的研究對象分別分配到試驗組和對照組, 在同一條件下, 同期按預期方案給予干預措施和觀察, 對試驗結果進行測定和評價。RCT的嚴謹設計可以避免研究中可能存在的選擇性偏倚和測量性偏倚, 確保研究結果的真實性, 是獲得證據、制定診療策略的主要依據之一。RCT研究獲得的只是理想條件下或某一年齡段或疾病亞組人群干預措施的結果, 尚不能代表臨床實踐中的真實狀況。此外, RCT常涉及到醫學倫理學問題; 觀察時間很有限, 有時不可避免地出現過多的失訪、退出、沾染或干擾影響研究結果事件; 不能滿足不同危險度個體的循證治療; 甚至某些疾病無法實施RCT(如手術治療與非手術治療比較)。
那么我們是否會有更好的選擇來進行臨床研究呢?
真實世界研究(real world study, RWS)起源于實用性臨床試驗, 是指在較大的樣本量(覆蓋具有代表性的更大受試人群)基礎上, 根據患者的實際病情和意愿非隨機選擇治療措施, 開展長期評價, 并注重有意義的結局治療, 以進一步評價干預措施的外部有效性和安全性, 1993年Kaplan等[7]首次在論文中使用。其涵蓋的范圍較隨機對照試驗更寬, 除治療性研究外, 還可用于診斷、預后、病因等方面的研究。
針對嚴格的解釋性RCT納入人群限制較多用藥條件控制嚴格, 使得研究結果的內部真實性較高, 外部真實性卻較差, 研究結果的實際應用推廣受限等問題, 國際上在實用性RCT的基礎上, 提出了真實世界研究的概念和方法, 通過“ 真實世界樣本” 來反映真實世界總體, 最初主要用于對藥物臨床不良反應的監測, 就某藥物在現實臨床中監測到的不良作用, 采用藥物流行病學分析方法, 辨別是否屬于該藥的不良反應; 其后逐步發展到上市藥物有效性和安全性再評價及臨床干預措施的評價, 主要是在不限定臨床干預措施的情況下研究其效果。RCT從醫療者角度評估醫療手段的“ 效力” (efficacy), 是確定醫療手段有效性和安全性的標準方法。RWS在真實醫療過程中進行觀察性臨床研究, 用于觀察藥物、新療法在廣泛真實醫療過程中的療效和不良反應, 是從患者角度評估醫療措施的“ 效果” (effectiveness)。需要注意的是, 效力并不等于效果。RCT關注效力研究(efficacy trials), 即藥物與干預措施能否在理想、嚴格控制的環境下產生預期的效果, 著重于內部有效性, 不易普遍化; 選擇人群觀察時間短, 人群樣本小, 測量手段主要有中間終點如糖化血紅蛋白、肺功能-第一秒用力呼氣量、血壓等, 當然如果隨訪時間較長也有硬終點如病死率等。RWS關注效果研究(effectiveness trials), 即評價藥物在真實臨床環境下的治療效果, 重在外部有效性; 缺乏控制, 存在選擇性偏倚、觀察性偏倚等混雜因素, 需要有不同于RCT的統計方法進行校正, 測量手段有死亡率、無癥狀時間、患者生存質量等[8, 9]。
真實世界數據或真實世界研究覆蓋多種研究類型及數據資源, 包括患者注冊研究、已有的電子健康記錄、常規收集的服藥數據、患者原始數據、人群健康調查等, 數據來源廣泛。在多種數據類型中, 臨床終點指標(如發病率、死亡率)、患者報告的終點事件、安全性數據、疾病進展的自然病史均可直接供他國參考, 而處方類型、經濟學模型數據、流行病學數據則要分別結合當地經濟及政策、疾病及國家具體情況考慮, 治療路徑、使用資源、患者服務經驗則因各國具體國情不一無法參考。
在具體的設計和各自的局限性上, RCT和RWS有很大的差別(見表1)。由于RWS是觀察性研究, 研究對象納入限制較少、人群異質性較大、自主選擇治療措施可造成的選擇偏倚以及重要預后因素在組間分布的不均衡性, 需要進行多重傾向性評分減少這些影響。傾向性評分的概念最早由Rosenbaum和Rubin在1983年首次提出[10], 其基本原理是用一個傾向指數表示多個協變量的影響, 根據傾向指數進行不同對比組間的匹配、分層或加權, 即均衡對比組間協變量的分布, 最后在協變量分布均衡的層內或者匹配組中估計處理效應。在大樣本的情況下, 經過傾向評分值調整的組間個體, 除了暴露因素和結局變量分布不同外, 其他協變量應當均衡可比, 相當于進行了“ 事后隨機化” , 使觀察性數據達到“ 接近隨機分配數據” 的效果[11]。
![]() | 表1 RCT與RWS設計的區別和局限性 |
雖然二者差別巨大, 但并不是對立關系, 而是互補與承啟關系。RCT是評價任何臨床干預措施的基礎, 用于評價有效性和安全性, 沒有RCT, 任何外部有效性的結果都將受到質疑。在RCT的基礎上制定相應的治療指南, 新的臨床干預措施得以真正用于臨床, 但指南是一種推薦, 它告訴醫生哪些應該做或可以做, 而不是哪些必須做, 指南不能替代臨床經驗。所以, 就需要RWS作為有效補充, RWS用于決定效應性, 能夠用于決定臨床實踐中真實的效益、風險和治療價值, 使臨床研究的結論在RCT后回歸真實世界。
2012年, Chitnis 等用多重傾向性分析的方法比較幾種血管緊張素轉換酶抑制劑(angiotensin-converting enzyme inhibitors, ACEI)對心力衰竭患者死亡率的影響[12], 這是真實世界研究的一個例子。該研究納入了139 994例心力衰竭患者, 其中69.50%(97 293例)接受賴諾普利、21.79%(30 503例)接受福辛普利、8.41%(11 775例)接受卡托普利和0.30%(423例)接受依那普利的治療, 以卡托普利為參照, 比較不同ACEI治療的粗略死亡率。研究中共有47個基線危險因素(協變量), 在這些基線危險因素中僅11項治療組間無差異, 36項差異有統計學意義, 但是建立傾向性評分模型、經過標準化傾向性權重評估后, 絕大多數協變量差異無統計學意義, 僅3項(腎衰竭、消化系統疾病、貧血和凝血異常)仍有差異, 傾向性評分后顯示各治療組間具有可比性(圖1)。最終研究結論顯示, 與卡托普利相比, 福辛普利和賴諾普利顯著降低心力衰竭患者死亡風險, 依那普利與卡托普利在此方面無顯著差異。該研究首次在現實世界人群證實了不同ACEI對于心力衰竭患者預后會產生不同的影響, 對未來ACEI的治療及研究提供了新的參考思路, 可以使更多患者受益于更好ACEI的治療。同時, 多重傾向性分析方法的應用, 為現實世界治療數據分析提供了有效的方法和思路。
2011年, Petrella等在《臨床治療學》雜志發表血管緊張素受體拮抗劑(angiotensin receptor blocker, ARB) 對比其它類降壓藥物真實世界研究回顧性分析[13], 回顧性分析納入17萬加拿大高血壓患者數據, 堅持使用降壓藥治療超過9個月, 旨在比較ARB對比非ARB治療方案的降壓療效, 主要觀察終點指標為血壓達標率(目標血壓值< 140/90 mmHg)。真實世界臨床數據顯示, 以ARB為基礎的聯合治療方案血壓達標率更高, 其中, ARB/氫氯噻嗪聯合治療方案血壓達標率較高。
2011年, Vegter等進行ACEI和ARB的依從性、堅持率及換藥模式的研究[14], 納入1999-2010年間的超過50 000例患者處方, 處方用藥包括ACEI:卡托普利、依那普利、賴諾普利、培哚普利、雷米普利、福辛普利; ARB:氯沙坦、纈沙坦、厄貝沙坦、坎地沙坦、奧美沙坦, 用藥模式包括:劑量、依從性、堅持率、換藥。研究結果顯示, ACEI與ARB之間的依從性無差別; 治療3年后, ACEI與ARB之間的堅持率無顯著差別; 福辛普利的依從性高于培哚普利, 且顯著高于依那普利; 福辛普利的堅持率高于培哚普利。
通過以上的3個例子, 我們可以看到RWS的重要作用, 作為試驗與實踐的兩個組成部分, RCT與RWS相互補充。高血壓領域“ 真實世界研究” 類文獻逐年遞增, 通過PubMed, 以hypertension + real-world為關鍵詞搜索高血壓領域在2003-2012年之間發表的實效研究相關文獻資料結果(圖2)表明, 真實世界研究正越來越多地應用到臨床研究中。計算機技術支持的臨床實踐所產生的大量臨床數據為進行科學研究奠定了基礎。在大數據背景下, 可基于現有數據庫中的數據進行分析, 來支持不同種類的業務, 如醫療費用及報銷、患者病史分析、歸檔影像分析、實時臨床數據分析, 并可應用于遠程會診, 無線移動技術醫療信息采集、分析及共享, 以支持醫療協同、臨床決策支持和公共衛生管理。過去的醫學模式是經驗醫學, 強調的是個人經驗與實踐, 隨著RCT的發展, 現在是循證醫學的年代, RWS則可將經驗醫學與循證醫學結合起來。
毋庸置疑, 21世紀是循證醫學時代, 是數據引導策略的新紀元!這就意味著, 大樣本數據庫所能帶給我們的絕不僅僅是數字的堆砌, 其真正價值在于能幫助我們深入、全面和準確地研究或解決重大臨床問題, 使結論更接近于“ 真實世界” , 進而優化或革新臨床實踐。RCT用于評價效力, 而RWS用于決定效果, 用于決定臨床實踐中真實的效益、風險和治療價值。RCT提供證據, 薈萃分析確定證據, RWS驗證證據, 臨床治療經驗個體化應用證據, 這一切源自臨床實踐, 回答臨床問題, 總結治療推薦, 回歸實踐檢驗。RCT與RWS對同一個問題的論證是承啟關系, RCT結果需要RWS的進一步驗證及拓展, 二者綜合考慮才是最佳選擇。RWS是開展治療措施再評價研究的一種新思路, 可進一步保障藥物的有效性和安全性。但是, 如何解決RWS中觀察者偏倚、成本高等問題, 仍然需要進一步繼續完善。
The authors have declared that no competing interests exist.
[1] | |
[2] | |
[3] | |
[4] | |
[5] | |
[6] | |
[7] | |
[8] | |
[9] | |
[10] | |
[11] | |
[12] | |
[13] | |
[14] | |