Terminology

說一個“估計”或“測量”r平方是否正確?

  • September 8, 2021

我正在寫一份報告,不確定說一個“測量”r 平方或是否“估計”它是否正確。我知道這兩個詞有兩種不同的語義,可能與您是否確定“真實”值有關,但作為非統計學家,我發現很難決定哪個更合適。

或者也許兩者都不合適,換一個詞更好。

我已經搜索了相當多的內容,但找不到明顯的答案。

決定係數 R2 是多重相關係數的平方(參見這個相關答案),它是變量之間樣本係數的函數。因此,它是您從數據中“測量”或“計算”的東西,而不是您估計的東西。但是,可以為真實多重相關係數的平方定義一個類似值,並將決定係數視為對此的估計,因此您可以合理地說您“測量”決定係數,但您“估計" 真實多重相關平方的基礎值。


這是此細分的更正式版本。假設我們首先定義問題中所有變量的真實相關值和样本相關值(使用 Pearson 係數)。我們將標記真實的相關值 ρi=Corr(Y,Xi)ρi,j=Corr(Xi,Xj) 和样本相關值 $ r_i = \mathbb{Corr}(\mathbf{y},\mathbf{x}i) r{i,j} = \mathbb{Corr}(\mathbf{x}_i,\mathbf{x}_j) $ ,其中後者表示觀察到的值向量之間的樣本相關性。現在分別定義擬合優度向量設計相關矩陣真實版本样本版本

$$ \mathbf{GOF} \ \mathbf{vector} \quad \quad \quad \quad \quad \quad \quad \quad \quad \mathbf{DC} \ \mathbf{matrix} \quad \quad \quad \quad \[12pt] \boldsymbol{\rho}{\mathbf{y},\mathbf{x}} = [ρ1 ρ2  ρm]

\quad \quad \quad \boldsymbol{\rho}{\mathbf{x},\mathbf{x}} = [ρ1,1ρ1,2ρ1,m ρ2,1ρ2,2ρ2,m  ρm,1ρm,2ρm,m ]
, \[40pt] \boldsymbol{r}{\mathbf{y},\mathbf{x}} = [r1 r2  rm]
\quad \quad \quad \boldsymbol{r}
{\mathbf{x},\mathbf{x}} = [r1,1r1,2r1,m r2,1r2,2r2,m  rm,1rm,2rm,m ]
. $$

決定係數的參數版本和样本版本由下式給出:

$$ \begin{matrix} \text{Regression model parameter (unnamed)} \quad \quad \quad \quad \quad \phi^2 = \boldsymbol{\rho}{\mathbf{y},\mathbf{x}}^\text{T} \boldsymbol{\rho}{\mathbf{x},\mathbf{x}}^{-1} \boldsymbol{\rho}{\mathbf{y},\mathbf{x}}, \[6pt] \text{Coefficient of Determination} \quad \quad \quad \quad \quad \quad \quad \quad \quad \quad R^2 = \boldsymbol{r}{\mathbf{y},\mathbf{x}}^\text{T} \boldsymbol{r}{\mathbf{x},\mathbf{x}}^{-1} \boldsymbol{r}{\mathbf{y},\mathbf{x}}. \[6pt] \end{matrix} $$

現在,價值 R2 是可以從樣本中計算出的統計量,而參數 ϕ2 是回歸模型的一個不可觀察的方面,只能估計。我們當然可以使用決定係數 R2 估計未知參數 ϕ2 .

引用自:https://stats.stackexchange.com/questions/543989