Data-Transformation
在不影響峰度的情況下改變偏斜的變換?
我很好奇是否有一種變換可以改變隨機變量的偏斜而不影響峰度。這類似於 RV 的仿射變換如何影響均值和方差,但不影響偏斜和峰度(部分原因是偏斜和峰度被定義為不受尺度變化的影響)。這是一個已知問題嗎?
我的回答是全面破解的開始,但我不知道有任何既定的方法可以按照您的要求進行操作。
我的第一步是對您的數據集進行排序,您可以在數據集中找到比例位置,然後將其轉換為正態分佈,這種方法在 Reynolds & Hewitt, 1996 中使用。請參閱下面的 PROCMiracle 中的示例 R 代碼。
一旦分佈正常,問題就迎刃而解了——調整峰度而不是偏斜。谷歌搜索表明可以按照 John & Draper, 1980 的程序來調整峰度而不是偏斜 - 但我無法複製該結果。
我嘗試開發一個粗略的擴展/縮小函數,該函數採用輸入(歸一化)值並從中添加或減去一個與正常比例上的變量位置成比例的值確實會導致單調調整,但實際上往往會創建雙峰分佈雖然具有所需的偏度和峰度值。
我意識到這不是一個完整的答案,但我認為它可能會朝著正確的方向邁出一步。
PROCMiracle <- function(datasource,normalrank="BLOM") { switch(normalrank, "BLOM" = { rmod <- -3/8 nmod <- 1/4 }, "TUKEY" = { rmod <- -1/3 nmod <- 1/3 }, "VW" ={ rmod <- 0 nmod <- 1 }, "NONE" = { rmod <- 0 nmod <- 0 } ) print("This may be doing something strange with NA values! Beware!") return(scale(qnorm((rank(datasource)+rmod)/(length(datasource)+nmod)))) }