Genetics
分位數歸一化如何工作?
在使用微陣列的基因表達研究中,必須對強度數據進行標準化,以便可以比較個體之間、基因之間的強度。從概念上和算法上講,“分位數歸一化”是如何工作的,您將如何向非統計學家解釋這一點?
Bolstad 等人基於方差和偏差對高密度寡核苷酸陣列數據的歸一化方法進行了比較。介紹了數組數據的分位數歸一化並將其與其他方法進行比較。它對算法有非常清晰的描述。
概念上的理解是它是數組的變換使用函數在哪裡是一個估計的分佈函數和是估計分佈函數的倒數。結果是所有陣列的歸一化分佈都相同。對於分位數歸一化是數組的經驗分佈和是跨數組的平均分位數的經驗分佈。
歸根結底,它是一種將所有陣列轉換為具有共同強度分佈的方法。