說一個“估計”或“測量”r平方是否正確?
我正在寫一份報告,不確定說一個“測量”r 平方或是否“估計”它是否正確。我知道這兩個詞有兩種不同的語義,可能與您是否確定“真實”值有關,但作為非統計學家,我發現很難決定哪個更合適。
或者也許兩者都不合適,換一個詞更好。
我已經搜索了相當多的內容,但找不到明顯的答案。
決定係數 $ R^2 $ 是多重相關係數的平方(參見這個相關答案),它是變量之間樣本係數的函數。因此,它是您從數據中“測量”或“計算”的東西,而不是您估計的東西。但是,可以為真實多重相關係數的平方定義一個類似值,並將決定係數視為對此的估計,因此您可以合理地說您“測量”決定係數,但您“估計" 真實多重相關平方的基礎值。
這是此細分的更正式版本。假設我們首先定義問題中所有變量的真實相關值和样本相關值(使用 Pearson 係數)。我們將標記真實的相關值 $ \rho_i = \mathbb{Corr}(Y,X_i) $ 和 $ \rho_{i,j} = \mathbb{Corr}(X_i,X_j) $ 和样本相關值 $ r_i = \mathbb{Corr}(\mathbf{y},\mathbf{x}i) $ 和 $ r{i,j} = \mathbb{Corr}(\mathbf{x}_i,\mathbf{x}_j) $ ,其中後者表示觀察到的值向量之間的樣本相關性。現在分別定義擬合優度向量和設計相關矩陣的真實版本和样本版本:
$$ \mathbf{GOF} \ \mathbf{vector} \quad \quad \quad \quad \quad \quad \quad \quad \quad \mathbf{DC} \ \mathbf{matrix} \quad \quad \quad \quad \[12pt] \boldsymbol{\rho}{\mathbf{y},\mathbf{x}} = \begin{bmatrix} \rho_1 \ \rho_2 \ \vdots \ \rho_m \end{bmatrix} \quad \quad \quad \boldsymbol{\rho}{\mathbf{x},\mathbf{x}} = \begin{bmatrix} \rho_{1,1} & \rho_{1,2} & \cdots & \rho_{1,m} \ \rho_{2,1} & \rho_{2,2} & \cdots & \rho_{2,m} \ \vdots & \vdots & \ddots & \vdots \ \rho_{m,1} & \rho_{m,2} & \cdots & \rho_{m,m} \ \end{bmatrix}, \[40pt] \boldsymbol{r}{\mathbf{y},\mathbf{x}} = \begin{bmatrix} r_1 \ r_2 \ \vdots \ r_m \end{bmatrix} \quad \quad \quad \boldsymbol{r}{\mathbf{x},\mathbf{x}} = \begin{bmatrix} r_{1,1} & r_{1,2} & \cdots & r_{1,m} \ r_{2,1} & r_{2,2} & \cdots & r_{2,m} \ \vdots & \vdots & \ddots & \vdots \ r_{m,1} & r_{m,2} & \cdots & r_{m,m} \ \end{bmatrix}. $$
決定係數的參數版本和样本版本由下式給出:
$$ \begin{matrix} \text{Regression model parameter (unnamed)} \quad \quad \quad \quad \quad \phi^2 = \boldsymbol{\rho}{\mathbf{y},\mathbf{x}}^\text{T} \boldsymbol{\rho}{\mathbf{x},\mathbf{x}}^{-1} \boldsymbol{\rho}{\mathbf{y},\mathbf{x}}, \[6pt] \text{Coefficient of Determination} \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad R^2 = \boldsymbol{r}{\mathbf{y},\mathbf{x}}^\text{T} \boldsymbol{r}{\mathbf{x},\mathbf{x}}^{-1} \boldsymbol{r}{\mathbf{y},\mathbf{x}}. \[6pt] \end{matrix} $$
現在,價值 $ R^2 $ 是可以從樣本中計算出的統計量,而參數 $ \phi^2 $ 是回歸模型的一個不可觀察的方面,只能估計。我們當然可以使用決定係數 $ R^2 $ 估計未知參數 $ \phi^2 $ .