Data-Transformation

在 Box-Cox 轉換數據中以原始單位表示答案

  • August 15, 2010

對於某些測量,分析結果會以轉換後的比例適當地呈現。然而,在大多數情況下,最好以原始測量尺度呈現結果(否則您的工作或多或少毫無價值)。

例如,在對數轉換數據的情況下,由於記錄值的平均值不是平均值的對數,因此會出現對原始尺度的解釋問題。在對數尺度上取平均值估計值的反對數並不能給出原始尺度上平均值的估計值。

但是,如果對數轉換後的數據具有對稱分佈,則以下關係成立(因為對數保留了排序):

(對數平均值的反對數是原始測量範圍的中位數)。

所以我只能推斷原始測量尺度上中位數的差異(或比率)。

如果總體大致正常且具有近似標準偏差,則兩樣本 t 檢驗和置信區間是最可靠的,因此我們可能會嘗試使用Box-Cox轉換來保持正態假設(我也認為它也是方差穩定轉換)。

但是,如果我們將 t-tools 應用於Box-Cox轉換後的數據,我們將推斷出轉換後數據的均值差異。我們如何解釋原始測量尺度上的那些?(轉換值的平均值不是轉換後的平均值)。換句話說,在變換後的尺度上對均值估計值進行逆變換,並不會給出原始尺度上的均值估計值。

在這種情況下,我也可以僅對中位數進行推斷嗎?是否有一種轉變可以讓我回到手段(在原始規模上)?

這個問題最初是作為評論發佈在這裡

如果您想專門推斷原始變量的平均值,請不要使用 Box-Cox 變換。當轉換後的變量有自己的解釋時,IMO Box-Cox 變換最有用,而 Box-Cox 變換只能幫助您找到正確的分析尺度 - 事實證明,這種情況經常發生。我以這種方式發現的兩個意外指數是 1/3(當響應變量是膀胱容量時)和 -1(當響應變量是每分鐘呼吸次數時)。

對數轉換可能是唯一的例外。對數尺度上的平均值對應於原始尺度中的幾何平均值,這至少是一個明確定義的量。

引用自:https://stats.stackexchange.com/questions/1713

comments powered by Disqus