Ordinal-Data
創建增長圖表的最佳方法
我必須為 5 到 15 歲的兒童(只有 5、6、7 等;沒有像 2.6 歲這樣的小數值)為非負的、連續的、連續的健康變量創建圖表(類似於成長圖表) 50-150 的範圍(只有少數值超出此範圍)。我必須創建第 90、第 95 和第 99 個百分位曲線,並為這些百分位創建表格。樣本量約為 8000。
我檢查並發現了以下可能的方法:
- 找到分位數,然後用黃土法從這些分位數中得到一條平滑的曲線。平滑度可以通過“span”參數進行調整。
- 使用 LMS (Lambda-Mu-Sigma) 方法(例如在 R 中使用 gamlss 或 VGAM 包)。
- 使用分位數回歸。
- 使用每個年齡組的平均值和 SD 來估計該年齡的百分位數並創建百分位數曲線。
最好的方法是什麼?我所說的“最佳”是指作為創建此類增長曲線的標準方法並且所有人都可以接受的理想方法。或者一種更容易實現的方法,它可能有一些限制,但是是一種可以接受的更快的方法。(例如,在百分位值上使用 loess 比使用 gamlss 包的 LMS 快得多)。
此外,該方法的基本 R 代碼是什麼。
謝謝你的幫助。
有大量關於增長曲線的文獻。在我看來,有三種“頂級”方法。在所有三個中,時間都被建模為具有足夠數量(例如,6 個)結的受限三次樣條。這是一個參數平滑器,具有出色的性能和易於解釋。
- 具有合理相關模式的縱向數據的經典增長曲線模型(廣義最小二乘法),例如連續時間 AR1。如果您可以證明殘差是高斯分佈的,則可以使用估計的均值和共同標準差獲得分位數的 MLE。
- 分位數回歸。這對於非大型. 即使精度不是最佳的,該方法也做出了最小的假設(因為一個分位數的估計與不同分位數的估計沒有聯繫)並且是無偏的。
- 序數回歸。這對待連續為了穩健,使用半參數模型(例如比例優勢模型)作為序數。從序數模型中,您可以估計平均值和任何分位數,後者僅在是連續的。