首頁 資訊 這波「真實世界研究」熱一定要趕上!學會這兩個方法=研究成功了一半(純干貨)

這波「真實世界研究」熱一定要趕上!學會這兩個方法=研究成功了一半(純干貨)

來源:泰然健康網(wǎng) 時間:2024年12月08日 13:08

近年來,真實世界研究掀起一波“熱潮”,越來越多的科研人將目光投向了「真實世界臨床研究」,各國也紛紛出臺相關(guān)政策提供支持。 然而,對于大多數(shù)臨床醫(yī)生或科研人來說,盡管工作中經(jīng)常遇到大量的研究“樣本”,但若要談及如何開展好“真實世界研究”?又要如何保證“真實世界證據(jù)”的有效性和可靠性?還是有些“模糊不清”、“疑問重重”。 今天,將從基礎原理入手,為大家深入淺出地介紹“真實世界研究以及常用的校正混雜因素的方法”。

一、真實世界研究與混雜偏倚

評估一種治療方法是否有效或者判斷某個暴露因素是否與某疾病風險相關(guān),最理想的試驗就是在平行時空下,觀察相同個體服藥/未服藥或暴露/非暴露后結(jié)局分別是什么。

很顯然,這種試驗設計是不現(xiàn)實的,但其實我們追求的這種理想化設計的核心就是希望干預組和對照組的人群特征盡可能同質(zhì)化(Homogeneity)。因為如果失去了這個同質(zhì)化前提,我們很難判斷最后結(jié)局的差異究竟是源于暴露因素本身,還是源于這兩組人群本身的差異。

例如,我們想探究吸煙與冠心病之間有沒有相關(guān)性,如果招納一批吸煙者、一批不吸煙者,不作任何校正或處理,直接比較他們患冠心病的比例,存在什么問題呢?

把情境具象化一點,一個不吸煙的14歲青少年沒有冠心病,而一個65歲的老年男性煙民患有冠心病,我們說是因為吸煙導致的差異,你是否覺得這個推論不太科學呢?

沒錯,這里的年齡就是一個會干擾我們判斷暴露與結(jié)局相關(guān)性的一個混雜因素(Confounder),因為我們知道年齡越大的人得冠心病的風險越高。同理,性別、生活作息、肥胖、其他合并癥等等都有可能影響一個人患冠心病的風險。

85621660519386421

圖1. 暴露、結(jié)局與混雜因素的關(guān)系

隨機對照試驗(RCT)之所以一直以來被認為是評價臨床證據(jù)的金標準,其寶貴就在于它的“隨機(Randomization)”。

隨機分組可以從概率學上最大化地消除組間差異,使兩組人群在各變量的分布盡可能相似,實現(xiàn)我們追求的同質(zhì)化假設。但是,RCT也有許多不足之處,例如成本高,特殊人群(如孕婦、兒童)中開展的倫理問題,苛刻的入組條件很難反映實際用藥人群的特征,樣本量較小,隨訪時間通常較短等。

真實世界研究(Real-world study)可以在上述這些方面補上RCT的短板,近年來無論在歐美還是國內(nèi),都在醫(yī)藥監(jiān)管決策上發(fā)揮越來越重要的作用。

但真實世界研究的局限性也是顯而易見的。因為其非干預性 (Non-experimental) 的特征,所有的治療或暴露都發(fā)生在自然條件下,因此個體是否受到治療或是否暴露于某因素,都不可避免地會受到其他因素的干擾,從而有很大可能引入混雜因素。

例如,我們想比較兩種降壓藥的療效,一種常見的真實世界研究數(shù)據(jù)來源就是從醫(yī)院病歷系統(tǒng)中收集分別使用兩種降壓藥的患者,再對后續(xù)療效進行比較。 在真實的臨床情況下,醫(yī)生選擇給患者用哪一種藥一定是有理由的。比如對于較年輕的、合并癥少的患者會首選A藥;而對于年紀大的、合并癥多的患者傾向于用B藥。 類似這樣的人群組間差異,就會引入大量的混雜因素,干擾我們判斷A藥和B藥的療效。

既然真實世界研究中的存在大量混雜因素,我們要如何校正混雜偏倚,來提高研究結(jié)果的可靠性和有效性呢?

二、校正混雜偏倚的方法

常見的幾種校正混雜因素的方法包括限制(Restriction)、分層(Stratification)、隨機化(Randomization)、匹配(Matching)、多元回歸分析(Multivariable regression)等。

① 限制/分層:

這兩種方法的邏輯是類似的,就是通過限制納入排除標準或者把人群按照某一混雜因素分類再進行分析。

比如,如果我們擔心年齡是一個混雜因素,那么在納入患者時我們就僅納入某一年齡段的患者,或者將患者按照年齡進行分層,再分別對各年齡段的患者進行分別比較分析,以減少組間差異性。

使用這種方法很顯然我們能一次性識別或處理的混雜因素的數(shù)量非常有限,只適合混雜因素很明確且數(shù)量很少的情況。

② 隨機化:

正如之前我們提到的RCT,可以使用隨機化將組間差異平衡掉。這樣的好處是無論是已知還是未知的混雜因素,均能通過隨機化法最大化消除組間差異。但在真實世界研究中,幾乎不可能進行隨機化。

③ 多元回歸分析:

在回歸分析中納入多個自變量,考察我們感興趣的自變量在對其他自變量進行校正后,是否與因變量還有顯著相關(guān)性。但納入的自變量個數(shù)并不是沒有上限的,一般認為對于 logistic 回歸和 Cox 回歸,結(jié)局事件應至少為 15-20 倍的自變量個數(shù)。

④ 匹配:

顧名思義,就是將兩組中各方面特征都很相似的個體進行匹配,然后將匹配后的人群進行分析。那么如果他們的結(jié)局有差異,我們就可以認為這種差異是由治療方案或暴露因素引起,而非源于其他因素。因此匹配可以起到類似“事后隨機化”的作用。

今天,主要和大家介紹“如何用匹配法來進行真實世界研究的混雜偏倚校正”。其中,傾向性分析 (Propensity score analysis)是較常見的一種方法,也是下文介紹的重點。

三、傾向性評分及其應用

傾向性評分(Propensity score, PS)的定義是:個體在一組既定的協(xié)變量下,接受某種治療/暴露的概率(The probability of participating in a treatment given observed characteristics)。

我們還用之前舉例的降壓藥做例子,年齡小、合并癥少的患者有更大可能用A藥,而年齡大、合并癥多的患者更傾向于使用B藥。 假如我們通過計算(稍后會詳細說如何計算)得到當一個人年紀為35歲,沒有合并癥時,他使用A藥的概率(即  PS  A  )為0.8,使用B藥的概率為0.2(即1-  PS  A  )。 那么,此時站在你面前有這樣一個患者,年齡35歲,沒有并發(fā)癥,你預測他用哪個藥的概率高呢?答案顯然是A藥。但要注意,現(xiàn)實情況中一定存在年齡小、沒有合并癥的患者卻正在使用B藥的。 如果此時我們把A藥組中  PS  A  =0.8的患者和B藥組中  PS  A  =0.8的患者匹配到一起,我們可以認為他們是很相似的,而在其他條件很相似的情況下,一個用A藥一個用B藥,如果最后二者治療結(jié)局不同,我們就可以認為這種差異是由用藥不同所導致的。

PS的優(yōu)點是,可以將很多維的變量化歸成一個一維的數(shù)字,在許多已有的觀察性試驗中,甚至納入上百個協(xié)變量來計算PS。

PS可以用來將兩組患者進行匹配,把相近PS的個體以1:1或1:n (一般n不超過4) 進行配對,也即傾向性評分匹配 (Propensity score matching, PSM)。

也可以利用PS對每個個體賦予一定的權(quán)重,相當于對樣本進行了標準化,也即逆概率加權(quán) (Inverse probability weighting, IPW)。

下面將逐一對PSM和IPW進行介紹。

① 傾向性評分匹配 (PSM)

86971660519386600

圖2. PSM的步驟(Caliendo, 2008)

Step 1. PS的計算

這里我們討論最常見的雙臂研究,即研究對象只分成兩個組別,Logistic回歸一般是最常用的模型。

對于模型中自變量(即潛在的混雜因素)的選擇,也有一定規(guī)律。某種因素成為混雜因素需要滿足下列三個條件:

1) 在兩組中的分布不同 (如A組平均年齡比B組大);

2) 會影響結(jié)局指標 (如年齡會影響得冠心病的風險);

3) 該因素不能處于治療/暴露與結(jié)局的因果鏈上。

對于3)的理解,再舉一個例子 (可能略有不科學,只是幫助大家理解)。 在探究高脂飲食冠心病的相關(guān)性時,血脂水平就處于因果鏈上——因為高脂飲食會導致血脂升高,而血脂升高會導致冠心病。 在這個情境中,血脂水平就不應被納入為潛在的混雜因素。可以想見,如果將血脂納入混雜因素而校正掉,高脂飲食帶來的影響(effect)就被削弱甚至消除,干擾我們對高脂飲食與冠心病相關(guān)性的判斷。

此外,自變量的選擇也并非多多益善,過多的變量會引入高方差,影響匹配表現(xiàn)。

在確定了要使用的模型(logistic回歸)和潛在混雜因素后,我們就可以以組別作為二變量的結(jié)局變量,選定的混雜因素作為自變量,開始跑模型。Logistic回歸得到一系列協(xié)變量系數(shù),而通過這些系數(shù),我們可以計算出每個人被分配到A組或B組的概率,即PS。

Step 2. 匹配方法

當我們得到每個人的PS后,要如何將他們進行匹配呢?這時就需要制定一套匹配標準,目前有以下幾種常見的匹配方法:

1) 最近鄰匹配(Nearest Neighbor Matching):

顧名思義,在對照組中選擇PS值最接近的個體與研究組中的某個個體進行匹配。

這里又要分兩種情況,可替換 (with replacement) 和不可替換 (without replacement)。可替換表示對照組中的個體可以被選擇匹配多次,而不可替換則表示對照組中的個體不能被重復取用匹配。

2) 卡鉗匹配/半徑匹配(Caliper/Radius Matching):

上述的最鄰近匹配法會帶來一個問題,對于某個體,如果即使他的最鄰近匹配值也和其本身的PS值相差很大怎么辦呢?

這時我們就要設定一個匹配容差 (match tolerance),也即卡鉗值(caliper),希望要匹配的PS差值在此范圍內(nèi)。研究表明卡鉗值取0.2倍的PS的標準差時可以消除原始估計中至少98%的偏差 (Austin, 2011)。

我們既可以選擇卡鉗值內(nèi)的最近鄰PS值作為匹配對象,也可以將卡鉗值半徑內(nèi)所有PS值都納入作為匹配對象,以期最大化地利用數(shù)據(jù),這種方法又叫半徑匹配 (radius matching)。

3)分層匹配(Stratification Matching):

將PS值的范圍分層,再在每一層級中進行分析。有研究表明,一般5個層級可以消除掉大部分由混雜因素帶來的偏倚 (Cochran, 1968)。

除此之外,還有一些比較高階的匹配方法比如非參數(shù)匹配,包括核匹配和局部線性匹配 (Kernel and Local Linear Matching),這里不作過多介紹。上述介紹的匹配方法各有優(yōu)劣,主要是偏倚和方差二者之間的權(quán)衡。

32651660519386818

表1. 各匹配方法關(guān)于偏倚及有效性的比較(Caliendo, 2008)

Step 3. 重疊區(qū)域/共同支持域

兩組傾向評分的重疊范圍 (Overlap Region),又叫共同支持域 (Common Support Region),一般我們會剔除PS在重疊區(qū)域以外的離群值(outlier)。

重疊區(qū)域的大小是評估匹配效力的一個重要因素,如果重疊區(qū)域小或完全沒有重疊,則表明兩組完全沒有可比性,無法進行匹配。

Step 4. 匹配效果評估方法

對于匹配效果的評估,比較直觀的有觀察PS在匹配前后的分布,以及特征在匹配前后的分布。如果要量化匹配效果,我們引入一個標準均值差(Standardized Mean Difference, SMD)的概念。

SMD = (實驗組均值 - 對照組均值) / 實驗組(或總體)標準差。一般當SMD<0.1時我們認為配平效果較好。

以上研究步驟均屬于傾向性評分匹配 (PSM)。

② 逆概率加權(quán) (IPW)

PS除了可以應用于匹配外,還有一種思路就是根據(jù)PS對每個個體賦予不同權(quán)重,從而構(gòu)成一個虛擬的、標準化人群,使得研究組和對照組人群特征達到平衡。常用的一種方法就是逆概率加權(quán)(IPW)。

對于研究組,權(quán)重為1/PStreatment;對于對照組,權(quán)重為1/(1- PStreatment)。

與匹配相似,有時我們也會將賦予權(quán)重的對象限制在重合區(qū)域中。但因為不設置卡鉗值,樣本損耗會比匹配要小很多,可以應用于樣本量不足以實現(xiàn)匹配的情況。

經(jīng)過上述介紹,相信大家對混雜因素及其校正方式都有了一定了解。有關(guān)「如何在SAS和R中實現(xiàn)傾向性評分匹配和逆概率加權(quán)」,敬請期待后續(xù)兩篇實操教程!

參考文獻: 1.Austin, Peter C. An introduction to propensity score methods for reducing the effects of confounding in observational studies. Multivariate behavioral research 46.3 (2011): 399-424. 2.Cochran, William G. The effectiveness of adjustment by subclassification in removing bias in observational studies. Biometrics (1968): 295-313. 3.Marco Caliendo, and Sabine Kopeinig. Some practical guidance for the implementation of propensity score matching. Journal of economic surveys 22.1 (2008): 31-72. 撰文:烤鴨小籠包 編輯:Catherine

本文由“健康號”用戶上傳、授權(quán)發(fā)布,以上內(nèi)容(含文字、圖片、視頻)不代表健康界立場?!敖】堤枴毕敌畔l(fā)布平臺,僅提供信息存儲服務,如有轉(zhuǎn)載、侵權(quán)等任何問題,請聯(lián)系健康界(jkh@hmkx.cn)處理。

相關(guān)知識

行業(yè)革新!保健食品真實世界研究與標準化的融合之道
JAMA子刊:真實世界研究,睡覺可減少卡路里攝入,有助于減肥
一天真要喝夠8杯水?研究有了新發(fā)現(xiàn):這樣喝水更健康!
CDK4/6 抑制劑耐藥的晚期乳腺癌怎么治?來看這項真實世界研究|ASCO 2024
怎么減肥更容易成功?科學家匯集數(shù)十項研究確認了一個好用的方法
科學研究
旅界專研|健康旅游行業(yè)研究(上篇)
世界首例!自費研發(fā),一群鄭州醫(yī)生完成重磅試驗,人造子宮要來了?
抑郁癥可能和這個行為有關(guān)?600萬人研究揭開真相
【中國科學報】飲用水水質(zhì)與健康研究是一門科學

網(wǎng)址: 這波「真實世界研究」熱一定要趕上!學會這兩個方法=研究成功了一半(純干貨) http://www.u1s5d6.cn/newsview364833.html

推薦資訊