Anova

如何在設計的實驗中選擇 ANOVA 和 ANCOVA?

  • March 4, 2012

我正在進行一個實驗,它有以下內容:

  • DV:切片消耗(連續的或可能是分類的)
  • IV:健康消息、不健康消息、無消息(對照)(隨機分配人員的 3 組 - 分類) 這是關於切片健康狀況的經過處理的消息。

以下 IV 可以被視為個體差異變量:

  • 衝動性(這可以是分類的,即高與低或連續,並通過尺度來衡量)
  • 甜味偏好(這也可以通過問卷來衡量,每個問題有 3 個選項可供選擇)
  • BMI - 參與者將被相應地稱重(這也可以被認為是分類的或連續的)。

由於這些組將被隨機分配到 3 個組之一,因此我假設我正在做某種 ANOVA,並且可能會使用階乘 ANOVA,因為我對哪種 IV 對 DV 影響最大以及 IV 之間的相互作用感興趣,因為研究表明某些組合之間存在關係。

但我並不完全確定這一點,因為需要知道最好讓IV的所有類別或連續或混合。

或者 ANCOVA 是一種可能性,甚至是回歸,但我不確定這一點,因為它們被分配到組中,然後根據他們對調查的回答進行分類。

我希望這是有道理的,並期待聽到有人關於我的查詢。

作為歷史事實,回歸和方差分析是分開發展的,部分由於傳統,仍然經常分開教授。此外,人們通常認為 ANOVA 適用於設計實驗(即變量/隨機分配的操作),而回歸適用於觀察性研究(例如,從政府網站下載數據並尋找關係)。然而,所有這些都有些誤導。ANOVA一種回歸,只是所有協變量都是分類的。ANCOVA具有定性和連續協變量的回歸,但因子和連續解釋變量之間沒有交互項(即所謂的“平行斜率假設”)。至於一項研究是實驗性的還是觀察性的,這與分析本身無關。

你的實驗聽起來不錯。我會將其分析為回歸(在我看來,我傾向於將一切稱為回歸)。如果您對它們感興趣,和/或如果您正在使用的理論表明它們可能很重要,我會包括所有協變量。如果您認為某些變量的影響可能取決於其他變量,請務必添加所有必要的交互項。要記住的一件事是,每個解釋變量(包括交互項!)都會消耗一定程度的自由度,因此請確保您的樣本量足夠。我不會您的任何連續變量進行二分法或以其他方式進行分類(不幸的是,這種做法很普遍,這確實是一件壞事)。否則,聽起來你正在路上。

更新: 這裡似乎有些擔心是否將連續變量轉換為只有兩個(或更多)類別的變量。讓我在這里而不是在評論中解決這個問題。我會讓你所有的變量保持連續。避免對連續變量進行分類有幾個原因:

  1. 通過分類,您將丟棄信息——一些觀察結果離分界線更遠,而另一些則更接近分界線,但它們被視為相同。在科學領域,我們的目標是收集更多更好的信息,並更好地組織和整合這些信息。在我看來,丟棄信息與好的科學完全相反。
  2. 正如@Florian 指出的那樣,您往往會失去統計能力(感謝您的鏈接!);
  3. 正如@rolando2 指出的那樣,您失去了檢測非線性關係的能力;
  4. 如果有人閱讀您的作品並想知道如果我們在不同的地方畫出 b/t 類別線會發生什麼?(例如,考慮您的 BMI 示例,如果 10 年後,根據當時文獻中發生的情況,其他人也想了解體重不足和病態肥胖的人怎麼辦?)他們只是不走運,但是如果您將所有內容保留為原始形式,則每個讀者都可以評估自己喜歡的分類方案;
  5. 自然界中很少有“亮線”,因此通過分類無法反映所研究情況的真實情況。如果您擔心由於先驗的理論原因在某個點上可能存在一條實際的亮線,您可以擬合樣條曲線來評估這一點。想像一個變量,,從 0 到 1,並且您認為此變量和響應變量之間的關係在 0.7 處突然發生根本性變化,然後您創建一個新變量(稱為樣條曲線),如下所示:

然後添加這個新的除了您的原始模型之外,您的模型還可以修改多變的。模型輸出將在 0.7 處出現大幅突破,您可以評估這是否增強了我們對數據的理解。

在我看來,1 和 5 是最重要的。

引用自:https://stats.stackexchange.com/questions/24077

comments powered by Disqus