Predictive-Models

Cox回歸預測模型的樣本量和交叉驗證方法

  • January 31, 2012

我有一個問題想向社區提出。我最近被要求為腫瘤標誌物預後研究提供統計分析。我主要使用這兩個參考來指導我的分析:

  1. 麥克肖恩 LM 等人。腫瘤標誌物預後研究(REMARK)的報告建議。J Natl 癌症研究所。2005 年 8 月 17 日;97(16):1180-4。
  2. 西蒙 RM 等人。使用交叉驗證評估基於高維數據的生存風險分類器的預測準確性。簡短的生物信息。2011年5月;12(3):203-14。電子版 2011 年 2 月 15 日。

我在下面總結了這項研究和我的分析。我將不勝感激任何意見、建議或批評。

學習背景:

一些癌症 X 患者在治療後會出現早期復發。目前醫生使用的臨床預後評分不能很好地預測這些患者的臨床結果。因此,識別在該標準得分之上和之上增加價值的生物學預後標誌物將是有用的。本研究的目的是發現這樣的生物標誌物。

學習方法:

候選生物標誌物的預選

在先前的研究中確定了與癌症 X 相關的 12 種生物標誌物。我們試圖在患者/腫瘤的獨立樣本中驗證這 12 名候選者與癌症 X 之間的關聯,如下所述。

預選候選生物標誌物的單變量驗證

在一組 220 名患者/腫瘤中測量了這些生物標誌物的水平。

[注意:我已經屏蔽了數據,並將它們作為*.csv 文件提供給公眾下載。該文件具有以下列: “ID”,每個患者的唯一標識符;“PS”,每位患者的預後評分,1表示預後良好,2表示預後不良;“m1”到“m12”,每個腫瘤標誌物的水平;“時間”,以月為單位;和“事件”,其中 0 表示觀察受到譴責,1 表示發生治療失敗。]

為 12 個生物標誌物(n = 220 次觀察,事件數 = 91)中的每一個建立了以死亡時間作為因變量的單變量 Cox 回歸模型。

   Risk  LCI  UCI pValue
1   0.93 0.86 1.02 0.1088
2   0.93 0.88 0.99 0.0215
3   0.99 0.92 1.05 0.6528
4   0.93 0.87 1.00 0.0468
5   0.93 0.88 0.98 0.0055
6   0.97 0.92 1.01 0.1202
7   0.91 0.83 0.99 0.0297
8   0.98 0.90 1.07 0.6972
9   0.99 0.92 1.06 0.7841
10  1.01 0.91 1.11 0.9149
11  0.96 0.87 1.05 0.3837
12  0.90 0.83 0.97 0.0047

使用 0.05/12 = 0.004 的閾值 p 值,所有結果均不顯著。

多變量分析

決定通過將所有 12 種生物標誌物一次輸入使用十倍交叉驗證的逐步 Cox 回歸算法來擬合數據的模型。在十個不同的訓練集上建立十個模型後,建立時間相關的 ROC 曲線以允許選擇最佳截止點來識別兩組患者,“高”和“低”風險。選擇最小化“1 - TP + FP”的切割點。然後要求這十個模型對驗證組中的相應患者進行預測。然後將這些患者分為“高”和“低”風險組,並繪製在單個交叉驗證的 Kaplan Meier 曲線上。

結論

高風險曲線和低風險曲線的置信區間顯著重疊,表明已鑑定的生物標誌物不是有用的預後標誌物。因此,我們的研究未發現這些標誌物與患者預後之間存在任何顯著的單變量或多變量關聯。

社區問題

我是否以正確的方式分析我的數據?

如果你是這項研究的統計學家,你會做一些不同的事情嗎?

在進行驗證分析之前,未進行樣本大小和功效計算以確定要包括的樣本數量和可檢測的效應大小。我想現在進行這些分析以指導未來的研究。有人可以告訴我該怎麼做嗎?

我真正感興趣的是這些生物標誌物是否提供超出臨床預後評分的預測信息。據我了解,這將需要製作三個不同的模型:(1)僅具有臨床協變量的模型,(2)僅具有生物標誌物協變量的生物標誌物模型,以及(3)基於兩種協變量的生物標誌物/臨床模型。到目前為止,我已經製作了模型 1(上面未顯示;它也無法區分我們樣本中的高風險和低風險患者)和模型 2(如上所示)。因為 1 和 2 不重要,所以我沒有製作模型 3。我應該這樣做嗎?

任何關於分析問題的額外評論將不勝感激!請隨時下載屏蔽數據並親自查看。

您已經很好地描述了這個問題,並以多種方式很好地設置了它。我不清楚“預後評分”的定義,但 2 級評分不太可能對臨床有幫助。在選擇時根據專家意見調整所有相關的可用臨床變量,這一點很重要。以下是一些改進的機會:

  1. 10 折交叉驗證是不穩定的,需要重複 100 次才能獲得足夠的精度(或使用 Efron-Gong 樂觀自舉法進行 400 次重採樣;這兩種方法都在 Rrms包中提供)
  2. 由 ROC 曲線驅動將信號分為“好”和“壞”是一種流行的技術,但不是基於任何好的統計原理。任何值得稱道的生物標誌物都應該具有劑量反應關係,並且將其分為兩個非常武斷的組是不必要的、誤導性的,並且會丟失信息和功率。
  3. 在這種情況下,ROC 曲線絕對沒有什麼可提供的
  4. 在生物標誌物上選擇切點是一場統計災難。除其他事項外,它未能認識到數學上是否有任何切點有用,它們只能位於後端,而不是協變量端,因為每個標記的切點取決於患者所有其他標記值的絕對值。
  5. 沒有懲罰的逐步回歸是不可靠的。在您的設置中,沒有理由不將所有標記放入一個模型並進行似然比測試以測試它們添加到臨床變量的值。
    1. 的一個很好的替代方法是對生物標誌物進行冗餘分析或變量聚類,以在將它們與結果相關聯之前減少它們的數量。
  6. 如果您的樣本量較大,您可以允許所有變量使用回歸樣條非線性地進入模型。偶爾允許一個生物標誌物是平滑的和非線性的,其值比強制線性加倍。
  7. 讓對數似然,這是一個最佳評分規則(懲罰似然會更好)來完成它的工作。不要花時間在不正確的準確性評分規則上。
  8. 考慮使用基於對數似然的“充分性指數”來描述生物標誌物的效用,如我的《回歸建模策略》一書中所述。

引用自:https://stats.stackexchange.com/questions/22017

comments powered by Disqus