[ 摘要 ] 本文系統查詢并梳理了臨床研究方法發展的典型事件和相關人物,遴選、呈現臨床試驗發展歷程中的“第一次”和重大方法學進展,旨在通過典型人物和事件勾畫臨床研究的歷史演變和發展脈絡,解析臨床研究方法轉變的深刻背景,為醫學臨床、科研工作者、衛生決策者、醫學生等認識臨床研究發展史提供參考依據。
[ 關鍵詞 ] 臨床試驗;大事記;歷史
衛生保健對于促進人類健康的作用不容忽視。據估計,預期壽命增加因素中有三分之一到一半的作用歸功于衛生保健,它還使人們免受慢性健康問題困擾的平均時間延長了5年。
未經充分驗證的治療措施可造成嚴重危害,為了“公平”地驗證治療措施,我們必須致力于獲取可靠的療效信息。此處所說的“公平試驗”是通過采取措施減少偏倚和機遇因素帶來的誤導影響,從而獲得可靠療效信息的試驗過程。關于醫學治療公平試驗的歷史沿革,詹姆斯·林德圖書館(James Lind Library)做了示例解釋。歷經“歷史上的對照試驗”(Controlled Trials from History)的網站、Sibbald圖書館的變遷,2003年在紀念詹姆斯·林德發表《壞血病論文集》250周年的座談會上,該網站被重建并改名為詹姆斯·林德圖書館(www.jameslindlibrary.org),Cochrane協作網創始人Iain Chalmers博士擔任了此網站的負責人。
樸素的公平試驗原則至少可追溯到公元前6世紀,該理論在歷史發展的長河中不斷發展、完善。然而,在很長一段時間里,人們常常根據如何治療疾病的理論采取治療措施,而未對這些理論在實踐中的使用效果進行科學驗證,有些干預措施后來被證明是無效甚至有害的。因此干預措施推廣使用前有必要在實踐中驗證其利弊關系,以盡可能避免某些有效的措施未及時推廣或原本無效甚至有害的措施長期被使用。
認識到需開展臨床試驗驗證干預措施療效后,我們更應強調驗證試驗方法的可靠性,采取恰當的措施降低受到偏倚的影響,并謹慎地做出解釋。臨床試驗需要設立對照,例如安慰劑對照、前后對照、交叉對照、對不同群組患者采用不同干預措施的對照等。對照選擇前應對以往相關治療措施試驗進行系統評價或參考相關系統評價的結論,否則就不能解決療效的真正不確定性。
臨床研究的設計方案可分為兩大類:試驗性研究(experimental study)和觀察性研究(observational study)。試驗性研究設計可人為控制試驗條件。常用的設計類型包括隨機對照試驗、交叉試驗、前后對照試驗等。而觀察性研究不能人為控制試驗條件,分組系自然形成,只能盡可能控制非研究因素的影響,來提高結論的真實性與可靠性。常用的觀察性研究設計類型包括橫斷面研究、病例對照研究、隊列研究、系列病例分析、個案病例報告等(圖1)。其中,如何設立合理的對照、控制組間研究因素、避免研究者和受試者知道用藥情況對結果產生影響等,是醫學研究者關注的重要方法學問題。
在臨床研究發展歷程中,有很多對臨床研究方法學發展起到重要作用的事件發生,也涌現出很多推波助瀾的典型人物,為臨床試驗發展歷史留下濃墨重彩的一筆,開啟了很多重要的“第一次”,促進了循證醫學醫療模式的來臨。本文對臨床試驗發展歷史長河中的重要事件進行歸納整理,總結出臨床試驗大事記時線圖(圖2),遴選具有代表性的重要事件,從一個側面縱觀臨床研究方法學發展的脈絡,銘記歷史的烙印。
1 驗證臨床療效的方法
臨床試驗方法學發展經歷了漫長的探索和實踐過程。自1747年James Lind開展第一個現代意義上的臨床對照試驗以來,臨床試驗方法學進入了發展期,出現了臨床試驗的對照設計、安慰劑設立、研究對象分配方法等各方面方法學的探索和應用,形成了第一個臨床對照試驗、病例對照研究、隊列研究、半隨機對照試驗等多種臨床試驗設計;1948年開展的鏈霉素治療結核的臨床試驗被認為是第一個設計規范的臨床隨機對照試驗,此后臨床試驗方法學日趨成熟,進入了快速發展時期。現將臨床試驗發展史上較為重要的“第一次”事件簡單闡述如下:
1061年,中國古代開展的樸素的對照試驗——人參的對照試驗。宋代《本草圖經》中記載了鑒別人參的方法,原文如下:“相傳欲試上黨人參者,當使二人同走,一與人參含之,一不與,度走三五里許,其不含人參者,必大喘,含者氣息自如者,其人參乃真也。”選擇兩人做對照,一人口含人參,另一人不含人參,步行三、五里路,不含人參者大喘,口含人參者呼吸自如,從而判斷后者為口服上黨人參產生的作用。這一個含人參奔跑的故事記載被認為是中國古代開展的樸素的對照試驗。
1747年,第一個臨床對照試驗——柑橘和檸檬治療壞血病。在18世紀,壞血病是困擾英國海軍的主要健康問題。當時用于治療壞血病的方法有多種,但人們并不確定哪種方法是有效的?為了驗證壞血病有效的治療方法,海軍醫生Lind召集、遴選了12名患有壞血病并具有相似的癥狀的船員,安置在船上同一位置,基本飲食相同,使得患者身處的環境具有可比性。每2名船員為1組,共分為6組,但6個組予以不同的補充品互為對照:醋、稀釋的硫酸、蘋果酒、海水、肉豆蔻、大蒜、辣根的混合物,兩個橘子和一個檸檬。最終結果是吃了兩個橘子和一個檸檬的2名船員癥狀逐漸好轉、康復。此后,英國海軍部下令所有船只都供應檸檬汁,到18世紀末,這種致命的疾病便從英國皇家海軍中消失了。James Lind設計的試驗比較了當時用于治療壞血病的6種方法,得出了柑橘和檸檬(因為柑橘和檸檬含有大量維生素C)治療壞血病有效的結論。這項研究被視為第一個臨床對照試驗,這一成果最后被撰寫為論文于1753年發表,James Lind也被認為是臨床對照試驗歷史發展的先驅者之一。
1781年,第一個單盲臨床試驗——動物磁療試驗。德國醫生安東·梅斯梅爾(Franz Anton Mesmer)提出了一種催眠術或者稱為動物磁療的方法,宣稱可以治療各種各樣的疾病。為驗證動物磁療的療效,由Benjamin Franklin牽頭的委員會調查動物磁療是否有效。委員會做測試時要求接受動物磁療的受試者蒙住眼睛,試驗過程中告訴患者他們是否正在接受動物磁療,但可能被告訴是否接受磁療的信息與事實相反。受試者只有當被告知他們正在接受治療時才會感覺到“動物磁力”,并非真正實施“動物磁療”的效果,應是心理暗示在起作用。本試驗通過科學的方法否定了動物磁療的治療作用。在試驗過程中,被試者并不知道自己是否接受了真正的“動物磁療”,用蒙面的方法實現了對受試對象采用的“盲法”,本試驗也被認為是第一個單盲臨床試驗。
1801年,第一個安慰劑對照試驗——金屬棍是否有電磁作用。John Haygarth于1801年首次報告了“安慰劑”對照的試驗結果。當時常用的一種治療疾病的方法是將金屬棍放在身體上,認為人體可以通過接受金屬電磁的影響而緩解癥狀。Haygarth在第一天給5位病人使用木頭仿造的金屬棍治療,發現四個人病情緩解,第二天使用真正的金屬棍進行治療得到相同的結果,也是4個人報告了病情的緩解,試驗證明了金屬棍對病情沒有任何作用。盡管他沒有明確提出安慰劑效應的概念,但顯然他已經有了與現代安慰劑效應相似的觀點。
1855年,第一例具備雛形的病例對照研究——Broad Street水井與霍亂暴發。1854年英國倫敦市區暴發霍亂,在John Snow起初調查發現霍亂發生與當地寬街水井污染有關后的第二年,一位名叫Whitehead的當地官員對霍亂暴發細節信息展開進一步調查。Whitehead詢問收集事發當年8月30日至9月8日期間飲用寬街水井水的居民信息,包括向有霍亂死亡病例的家屬詢問死者生活習慣,詢問霍亂傳染病的生存者以及336名未發生疾病的當地居民是否引用了寬街井水。Whitehead發現,飲用井水和不飲用井水居民的霍亂發生比例為4∶1(80∶20),而在未發病人群中此比例則大約為1∶4.9(57∶279),飲用污染的寬街井水的比值比OR=19.6(P<0.001),提示飲用寬街水井的水大大增加了人群的發病危險。Whitehead的研究具備了病例對照研究設計的基本要素,設立了病例組和對照組,回顧調查既往可能的危險因素暴露史,并對兩組的暴露比例進行比較等,在病因學研究方面是一大進步。
1898年,第一個半隨機臨床對照試驗——血清治療白喉試驗。19世紀末有關血清治療白喉療效的證據是有爭議的。為試圖驗證血清療法治療白喉的臨床療效,年僅28歲的Fibiger設計了一項“更為嚴謹”的臨床對照試驗。Fibiger收集1896年5月13日至1897年5月13日期間丹麥哥本哈根(Blegdamshospitalet)醫院收治的白喉患者(檢查出白喉桿菌),根據病人入院的日期將之分配為兩組(隔日交替),一組在標準治療基礎上接受每天兩次皮下注射白喉血清,另一組僅接受標準治療。所有病人都使用硝酸銀或瀝青油的方案擦洗喉嚨,主要結局指標是病死率,其他的指標還有體溫、蛋白尿等。試驗結果提示血清治療白喉可降低白喉的病死率。隔天交替的方式是早期采用的隨機分組方法之一,簡單易行;但當前已被更為嚴謹的隨機分配方法所替代。本試驗被認為是第一個嘗試隨機分配的臨床對照試驗。
1920年,第一個考慮混雜因素的病例對照研究——糙皮病影響因素研究。Goldberger于1920年發表糙皮病研究,比較糙皮病患者和非糙皮病患者的飲食結構,試圖分析糙皮病與哪些因素有關。研究者選擇了糙皮病高發的春末開展研究,時限為兩周,對南卡羅萊納的7個村莊居民逐戶排查,經過嚴格的臨床診斷標準收集、確診所有糙皮病患者。該研究結果提示,糙皮病發病與家庭的新鮮肉和奶制品攝入不足有關。Goldberger的研究是首次考慮了混雜因素(家庭經濟收入)的病例對照研究,研究設計關注疾病的臨床診斷標準,以及病例組、對照組間混雜因素對其的影響,注意病例組和對照組樣本選擇的匹配。
Fisher與實驗設計三原則。費歇爾(Ronald Aylmer Fisher)是英國著名統計學家,他在統計學發展史上地位顯赫,他的研究成果大量應用于生物學、醫學領域,而且為臨床試驗方法學的發展起到了重要推動作用。從1912年費歇爾提出了一種重要而普遍的點估計法,到1925年,費歇爾在創建試驗設計理論的過程中提出的“隨機化”原則,再到1935年《實驗設計法》(The Design of Experiments)的出版,提出了著名的實驗設計三原則:隨機化、區組控制和重復,其成就對于臨床試驗方法學的發展舉足輕重。此外,費歇爾還提出隨機區組法和拉丁方方法,并與耶特斯合作編制了有名的FisherYates隨機數字表。
1926年,第一個現代模式下的病例對照研究——生殖因素和乳腺癌的關系。1926年英國衛生部在公共衛生和醫學學科發表了一篇探究生殖因素與乳腺癌間關系的研究,被認為是現代模式下第一個病例對照研究。研究者Lane Claypon從英國倫敦和格拉斯哥所在醫院的住院和門診患者中選擇了500例就診的乳腺癌患者和500例非乳腺癌患者(其他特征與病例組相似)作為病例組和對照組,并對兩組婦女的職業、新生兒病死率、國籍、婚姻狀態、年齡等因素進行了分析,很好地控制了兩組婦女在年齡和社會地位上的相似性,排除了絕經前乳腺癌的特殊情況,減少了其他因素對該研究產生的影響,研究結果認為乳腺癌與絕經年齡、首次妊娠年齡、分娩次數、哺乳等因素相關。盡管該研究并不是第一次證明低生育是乳腺癌的高危因素,但在病例對照研究的歷史上卻有著里程碑的意義。
1933年,第一個回顧性隊列研究——家庭接觸史與結核病傳播的研究。美國流行病學家Frost于1933年開展了一項家庭接觸史與結核病傳播的研究。本試驗在美國田納西州某小鎮黑人人群的132個家庭中展開。本研究涉及對危險人年的計算,觀察連續5年的數據(未依據性別分析),記錄每個人進入或離開家庭的時間。依據是否存在結核病家庭接觸史來計算兩組結核病年發病率,結果提示有結核病家庭接觸史的人群結核病發病率是無結核病家庭接觸史的人群的2倍。它被認為是有意識地應用回顧性隊列研究設計的較早研究之一。
1943年,第一個大規模、多中心、臨床對照試驗——棒曲霉素治療感冒試驗。《柳葉刀》雜志于1943年報告了一種新的抗生素——棒曲霉素,它是一種展青霉的代謝產物。為了驗證棒曲霉素是否具有抗感冒作用,在醫學研究委員會(Medical Research Council,MRC)的支持下開展了覆蓋英國的一項多中心臨床對照試驗,不同中心采用設計一致的試驗方案。研究結果提示棒曲霉素并不能緩解由感冒造成的痛苦與負擔。該試驗被認為是第一個大規模、多中心、臨床對照試驗。
1948年,第一個設計規范的臨床隨機雙盲對照試驗——鏈霉素治療結核試驗。20世紀中葉,英國MRC牽頭開展了一項覆蓋整個英國的多中心、隨機對照臨床試驗,旨在驗證鏈霉素是否對肺結核有效。該試驗研究對象為經細菌學檢查確診的急性進展性雙側肺結核患者共107例,隨機分為2組,采用隨機數字表產生隨機序列號進行隨機分配,并通過密閉信封保存隨機序列號;試驗組55例接受鏈霉素治療加臥床休養的方案,對照組52例只臥床休養。研究結果提示:隨訪6個月后,鏈霉素組病死率(7%)低于臥床休息組(27%);鏈霉素組患者臨床癥狀、影像學檢查改善率以及結核桿菌陰轉率均高于臥床休息組。本試驗結果證明鏈霉素治療結核病有效。本研究詳細描述了試驗設計方法,它在臨床試驗方法學發展中的地位舉足輕重,被視為第一個臨床隨機雙盲對照試驗。
1989年,第一個現代意義的系統評價——糖皮質激素防治早產兒的病死率。20世紀80年代的歐洲,對于有早產傾向的孕婦是否應該應用糖皮質激素存有較大爭議,臨床實踐中是否給早產孕婦使用糖皮質激素多基于醫師自身的臨床經驗和散在的臨床研究證據。Chalmers教授研究組試圖全面收集到所有發表的糖皮質激素治療有早產傾向孕婦的RCT,并用Meta分析的方法對其結果進行合并,其綜合效應量結果提示給早產孕婦使用這種短療程、低價格的糖皮質激素可以有效地降低早產兒呼吸窘迫綜合征的并發癥及其病死率。該系統評價結果被歐洲產科醫師廣泛采納后,使歐洲新生兒病死率下降30%~50%。其成果被寫入1989年出版的《妊娠和分娩領域的有效治療》一書。這項研究被認為是現代意義的第一篇基于隨機對照試驗的系統評價,成為系統評價的里程碑事件。
2 促進臨床試驗發展的重要事件
20世紀是臨床試驗方法學以及臨床醫學相關學科快速發展的時期。自1938年臨床流行病學誕生以來,循證醫學、轉化醫學、精準醫學與個性化醫學相繼出現;以及臨床醫學、計算機信息學的迅速發展,許多重要事件都為臨床研究的發展起到極大地促進作用,舉例如下:
1938年,美國耶魯大學John教授首次提出了臨床流行病學概念,創造性地將流行病學及統計學的原理和方法應用于臨床醫學,誕生了臨床流行病學。世界衛生組織(World Health Organization,WHO)對臨床流行病學給予了極高的評價,指出“臨床流行病學的建立及其在群體水平的研究成果對疾病的研究和臨床干預,做出了十分驚人的貢獻,其創造性地在群體水平所建立的量化測量疾病的研究方法,使之在各種群體水平上能夠可信地評價干預治療的結果”。
1938年,美國國會通過了食品、藥品及化妝品的有關法案履行保護公眾健康的職責,由食品藥品監督管理局(Food and Drug Administration,FDA)強制實施。此后藥物臨床試驗質量管理逐步發展、完善。
1991年,“循證醫學”一詞首次出現在ACP Journal Club,作者是時任加拿大McMaster大學醫學院內科住院醫師培訓計劃主任Gordon Guyatt博士。1992年,Gordon Guyatt博士團隊在JAMA雜志上發表了“Evidence-based medicine:a new approach to teaching the practice of medicine(循證醫學:醫學實踐教學的新模式)”一文,標志著循證醫學正式誕生。
1992年Science雜志提出B2B(bench to bedside,從實驗室到臨床)的概念,1994年開始出現轉化型研究(translational research),1996年《柳葉刀》雜志首次出現“translational medicine”這一新名詞。轉化醫學被認為是一類醫學研究,是倡導實驗室與臨床研究雙向轉化的模式。
1993年,循證醫學奠基人之一的英國Iain Chalmers博士在英國發起成立了世界上第一個以Cochrane名字命名的Cochrane中心。同年,在牛津召開了第一屆世界Cochrane年會,正式成立了國際Cochrane協作網,其重要的工作成果是Cochrane圖書館,旨在產生、保存和傳播最佳衛生保健證據,其網址是www.cochrane.org。Cochrane協作網的成立和發展,是循證醫學發展史上最為重要的事件之一,成為全世界衛生保健決策時最佳證據的重要來源。
1993年,WHO根據各國藥物臨床試驗管理規范,制定、頒布了適用于各成員國的《WHO藥物臨床試驗規范指導原則》,隨之《藥物臨床試驗質量管理規范》(Good Clinical Practice,GCP)開始廣泛實施。20世紀90年代,藥物臨床試驗管理規范國際統一標準逐步形成。
1993年Kaplan等首次在論文中使用“真實世界研究”(real world study,RWS)一詞。RWS即運用流行病學研究方法,在真實無偏倚或偏倚較少的人群中,對某種或某些干預措施(包括診斷、治療、預后)的實際應用情況進行研究。RWS是國際上在實況隨機對照試驗(pragmatic randomized controlled trial,PRCT)的基礎上提出來的概念和方法,通過真實世界樣本來反映真實世界總體,這是一種遵照臨床實情的理念。
1994年,以加拿大渥太華大學臨床流行病學系David Moher為代表的試驗報告規范(the standards of reporting trials,SORT)工作組成立,提出結構化報告隨機對照試驗的提議。
1996年,臨床試驗報告的統一標準(consolidated standards of reporting Trials)——CONSORT聲明首次發表,開啟了醫學研究報告規范的新篇章。
2004年,包括WHO在內19個國家和國際組織共同成立了多學科專家組成的工作組歷經4年的努力,正式發布了證據推薦分級的評估、制訂與評價(Grading of Recommendations Assessment,Development and Evaluation,GRADE)系統,它是適用于系統評價(systematic reviews,SR)、臨床實踐指南(clinic practice guideline,CPG)和衛生技術評估(health technology assessment,HTA)的分級工具,是當前證據質量和推薦強度分級的國際標準之一。
2007年5月,WHO國際臨床試驗注冊平臺(WorldHealthOrganizationInternationalClinicalTrialRegistrationPlatform,WHOICTRP,http://www.who.int/ictrp/en/)正式運行,標志著按統一標準、對臨床試驗進行注冊并頒發統一注冊號的臨床試驗注冊制度正式在全球建立。WHOICTRP是對全人類健康事業做出的巨大貢獻,是21世紀臨床試驗領域的里程碑事件。
2008年,國家中醫藥管理局啟動倫理審查的規范化建設工作,先后頒布《中醫藥臨床研究倫理審查管理規范》、《中醫藥臨床研究倫理審查平臺建設規范》《中醫藥臨床研究倫理審查平臺建設質量評估要點》,并成立了中醫藥倫理專家委員會。
2013年,劉保延主任醫師在《中醫雜志》發表了《真實世界的中醫臨床科研范式》,從科學范式的角度對真實世界的中醫臨床研究方法進行了系統論述。中醫臨床科研范式的核心是臨床科研一體化,鮮明特征是以人為中心,以數據為導向,以問題為驅動,醫療實踐與科學計算交替,從臨床中來,到臨床中去。它突出了中醫辨證論治和個體化治療為基礎的規律發現和療效驗證,其價值觀和世界觀將為中醫臨床研究帶來歷史性變革(圖3)。
2015年8月WHOICTRP發布的關于支持臨床試驗數據共享的聲明;2016年1月20日ICMJE發布的關于臨床試驗數據共享的建議。這是進一步推動的臨床試驗透明化的舉措,體現了全社會對承擔安全風險、為全人類健康事業做出卓越奉獻的參試者的尊重,也體現了醫學研究者的社會責任感。
3 討論
3.1 發展臨床試驗方法學是提高臨床試驗質量的重要保障
臨床試驗是臨床證據的基石。但并非所有臨床試驗的結果都是可靠的,它需要科學的設計、采取恰當的措施降低偏倚的影響,并謹慎地做出解釋。臨床試驗方法學發展也不是一蹴而就的,經歷了漫長的探索、驗證、發展的過程。
起初科學家注意到設計合理的對照有利于比較不同干預措施的療效,設立對照也同時需要考慮采用什么方法分配研究對象到不同的組別。要合理地設立對照,不同組群的患者構成必須類似,即基線相似。1740年威廉·切塞爾登(William Cheselden)醫生在比較摘除膀胱結石術后的患者病死率問題時注意到,病死率隨著患者的年齡不同而發生變化,因此欲比較不同類手術的患者組群之間的死亡率,就必須考慮試驗組和對照組患者的年齡差異。為有效地避免選擇性偏倚,需在試驗開始前就籌劃好對照的選擇方法。1747年,James Lind開展了第一個臨床對照試驗,利用柑橘和檸檬有效得控制了壞血病。隨后很多學者開始了對隨機分配、盲法、安慰劑對照以及對試驗中混雜因素問題的探索。
20世紀上半葉,“隨機分配”研究對象的方法得到了充分發展,30年代出現了抽簽、擲骰子、彩色珠子,40年代很多臨床試驗以隨機抽取號碼的方法分配研究對象。1948年開展的鏈霉菌治療結核病的臨床試驗被視為第一個隨機對照試驗,它是基于隨機數字表的方法對研究對象進行隨機分配,確保每位研究對象都有相似的機會進入試驗組和對照組,從而減少選擇偏倚對研究結果的影響。
臨床試驗又一項原則是實施盲法,可對受試者、衛生保健實施者、結局指標測量者和數據分析者實施盲法,目的是有效避免實施偏倚或測量偏倚。最早的盲法評估是1784年路易十六所委任的一個調查委員會實施的蒙面評估,受試者被蒙住眼睛,結果是他們只有在被告知接受“動物磁力說”治療時才會感覺到“動物磁力”,說明這只是一種所謂的“精神幻覺”而非“動物磁力”真正在起效。1800年,約翰·海加斯(John Haygarth)探索用安慰劑實現盲法的試驗,比較了當時流行的“電物理作用力”起作用的電金屬牽引器與外觀相同的木制“牽引器”(“安慰物牽引器”)治療疾病的效果毫無差異。1880年,報道了一個在密爾沃基醫學院(Milwaukee Academy of Medicine)進行的“雙盲、安慰劑”臨床試驗,患者和實驗人員都不知道所做的治療是真正的順勢療法,還是服用了一種糖丸,以驗證順勢療法的療效。此后21世紀,盲法原則在臨床試驗實施中得到了很好的認可和發展。德國研究人員在臨床試驗中引入了盲法,1918年,阿道夫·賓格(Adolf Bingel)在其白喉試驗中應用了盲法。1932年臨床藥理學家保羅·馬提尼(Paul Martini)對德國的盲法評估傳統系統進行了闡述。英國醫學理事會1944年和1950年開展的臨床試驗中,也應用“雙盲”的方法。盲法也成為驗證治療措施是否為公平試驗的關鍵方法之一。當然,盲法的實施也受到臨床試驗自身的限制,例如手術與藥物比較或西醫和中醫比較的臨床試驗,對于受試者和醫生很難實施盲法,但對于結果測量者和數據統計者實施盲法是完全可行也是非常必要的,尤其是對于主觀性測量指標,如果沒有采取措施來減少治療措施的比較中帶有偏倚的結局評估,治療效果往往會被高估。
在經歷了一次又一次的探索和努力,臨床試驗的設計方法日趨完善。1935年費歇爾出版的《實驗設計法》中提出了著名的實驗設計三原則,即隨機化、區組控制和重復,以及1938年John教授提出了臨床流行病學,都為臨床試驗方法學發展起到了至關重要的作用。臨床試驗過程中可能出現各種偏倚最終會影響到臨床療效的準確的評估。無論是選擇偏倚、實施偏倚、測量偏倚,還是其他設計偏倚、分析偏倚、報告偏倚以及系統評價中的偏倚等都會使研究結果距離真實療效更遠。Sackett教授對以上提到的常見的偏倚進行過總結,我們針對臨床問題,選擇和設計科學的臨床試驗,目的也是為了盡可能地控制偏倚,提高臨床試驗質量,使我們的研究結果更為真實、可靠。因此,日臻科學、完善的臨床試驗方法學是提高臨床試驗質量的重要保障。
3.2 臨床試驗的發展離不開相關學科的發展和國際相關學術組織的重視
臨床試驗方法學的發展是提高臨床試驗質量的重要內因,但其發展也同時離不開相關學科的發展和國際相關學術組織的重視這一外因。
美國FDA、WHO通過制定法案加強對藥物臨床試驗質量管理,促進GCP在全球范圍內廣泛實施,逐步形成藥物臨床試驗管理規范國際統一標準。
國際相關學術組織對于開展臨床試驗的三個關鍵環節——入口、實施過程和出口——采取了有效措施以促進臨床試驗質量持續提高和臨床試驗透明化。
美國國家癌癥研究所(National Cancer Institute,NCI)早在1977年建立癌癥臨床試驗注冊中心(Cancer Clinical Trials Registry)對癌癥臨床試驗進行注冊。2000年,美國國立衛生研究院(National Institutes of Health,NIH)發布Clinical Trials.gov臨床試驗注冊網站。隨后臨床試驗注冊問題受到了國際醫學期刊編輯委員會和WHO的高度重視,2004年確定并于2007年正式建立了WHOICTRP。
1994年加拿大渥太華大學臨床流行病學系David Moher為代表的試驗報告規范(the standards of reporting trials,SORT)工作組成立,提出結構化報告隨機對照試驗的提議,并于1996年發布了CONSORT聲明,目前已更新至CONSORT聲明2010版,其官網已發布了包括研究設計(Cluster trials,Non-inferiority and equivalence trials,Pragmatic Trials,N-of-1),干預措施(Herbal medicinal interventions,Non-pharmacological treatment interventions,Acupuncture Interventions(STRICTA))以及數據(Patient-Reported Outcomes,Harms,Abstracts)方面的10個擴展版。此外,其他類型臨床試驗報告規范也相繼出版,如觀察性研究的報告規范——STROBE(strengthening the reporting of observational studies in epidemiology)、非隨機對照設計透明報告規范(Transparent Reporting of Evaluations with Nonrandomized Designs,TREND)、診斷試驗研究報告標準——STARD聲明(Standards for Reporting of Diagnostic Accuracy)及案例報告的報告規范(CAse Report,CARE)共識等,共同為臨床試驗“出口”提供了可依據的報告依據。
對于臨床試驗實施過程,臨床流行病學所關注的臨床試驗方法學的發展、各類臨床試驗的方法學質量評估工具,以及國際醫學期刊編輯委員會和WHO等組織對試驗數據資料實時管理采取的措施(如臨床試驗數據共享的聲明),都是提高臨床試驗質量措施的重中之重。
臨床試驗是驗證干預措施療效的重要方法,但源于臨床試驗制作的系統評價、臨床實踐指南更貼近于臨床實踐。2004年發布的GRADE系統,也為臨床試驗與臨床實踐間建立了很好的橋梁。
綜上,多學科的發展和相關國際學術組織的重視,為臨床試驗自身的發展起到了促進的作用。
3.3 臨床試驗發展遇到的困難、挑戰和對策
臨床試驗需要科學設計、嚴謹實施、準確測量、科學報告以及合理轉化。高質量臨床試驗的開展并非紙上談兵那么簡單,在實際實施過程中會遇到很多實際問題需要研究者面對。臨床試驗為解決臨床問題而生,最終也要回歸臨床。大多數臨床試驗要在臨床完成,但開展臨床試驗是有別于日常的臨床實踐診療疾病的過程。
當前對于開展高質量的臨床試驗仍然有許多的困難和挑戰。首先,臨床試驗方法學有其自身局限性:例如在某些外科或傳統中醫藥領域,設計開展隨機對照試驗可行性較低,有些臨床試驗將受到倫理學的質疑,因此需要選擇和探索適合不同臨床問題的設計方法,例如開展高質量的觀察性研究、真實世界研究等也不失為好的選擇。第二,研究經費不足:研究經費是開展臨床試驗的必要條件之一,在經費不足甚至沒有經費來源的情況下勉強啟動臨床試驗其結果往往是草草收場,難以得到預期評價效果。第三,開展有規模的臨床試驗需要成熟的研究機構、研究組織、研究團隊共同協作完成:臨床試驗設計、實施、質控、數據分析、研究報告等各項工作復雜而細致,這些工作需要事先設計、組織并且嚴格培訓,不能將工作事無巨細地全推給某(幾)位臨床一線醫生,甚至身兼數職:研究設計、干預措施實施、結局指標測量/隨訪和錄入、數據統計以及結果報告撰寫工作,加之繁忙的臨床日常工作,不堪重負,使試驗實施質量難以保證。第四,要重視臨床試驗注冊、倫理審查和規范報告:很多臨床試驗都是在投稿過程中應編輯或審稿專家的要求,才開始補充臨床試驗注冊和查找相應的報告規范來修改研究報告,屆時有些問題已經無法彌補。因此應該在提煉出好的臨床問題之后,合理地將其轉化為臨床問題,精心地設計研究方案,盡早參考臨床試驗方法學質量評估工具和報告規范,爭取制定出令人滿意的研究計劃書,試驗啟動前完成臨床試驗注冊、通過倫理審核并發表研究計劃書。第五,要做好質控工作,按要求保存好所有相關資料:臨床試驗的工作有些細致而繁瑣,例如數據收集、錄入、核對工作,看似簡單,但如果由未接受培訓的、尤其是流動的臨床醫生和實習學生完成,很容易出錯,而且無從把關,難以建立高質量的數據庫。這一工作最好由經過培訓的專人完成,如尋找專業的錄入公司的專業人員完成,提高工作效率、同時也保證數據的統一規范;如沒有條件,也要制定計劃培訓固定研究人員完成,以確保研究質量。在臨床試驗實施工作中,還要做好嚴格的第三方監察和稽查的質控工作。相關工作人員也一定要按照要求做好研究對象的隱私保護工作、保存好試驗相關的所有紙質版和電子版資料。
4 小結
臨床試驗方法學發展經歷了漫長的過程,但人類從未停止探究的腳步。DME的臨床流行病學方法學在實踐中不斷完善、不斷豐富,不斷發展。循證醫學、轉化醫學、精準醫學與個性化醫學魚貫而出;隨機對照試驗、系統評價、效果比較研究以及真實世界臨床研究方法日新月異。尤其隨著互聯網、大數據、云計算等的飛速發展,臨床研究范式的轉換所帶動的臨床研究方法學革命正在醞釀之中,人們的世界觀、價值觀、方法論以及研究的技術支撐平臺都在發展變化之中,以此來滿足臨床對疾病研究從個體水平到群體水平,再從群體水平到更高一級個體水平的不斷發展,推動著醫學目的、醫學模式、醫學重點的不斷創新。
在臨床研究方法學發展的過程中,人類經歷了無數次的探索,留下成千上萬次歷史事件的印跡,涌現出眾多推動臨床研究發展的歷史人物。本文為《臨床試驗溯源》一書節選,試圖將臨床研究方法發展的典型事件和相關人物進行了系統地查詢和梳理,重點關注眾多歷史事件中重要的“第一次”,旨在通過典型人物和事件勾畫臨床研究的歷史演變和發展脈絡,解析臨床研究方法轉變的深刻背景,以便溫故知新,啟發思路,解放思想,自覺推動范式的轉化,迎接臨床研究革命時代的到來。
參考文獻(略)
收稿日期:2016-10-12
從事臨床試驗以來,令你印象最深刻的是?
歡迎留言!