建立統計模型究竟是什麼?
建立統計模型究竟是什麼?
這些天來,當我申請研究工作或諮詢工作時,經常會出現“建立模型”或“建模”這個詞。這個詞聽起來很酷,但它們到底指的是什麼?你如何建立你的模型?
我查找了預測模型,其中包括 k-nn 和邏輯回歸。
儘管我無論如何都不是統計學家,但我會對此有所了解,但會做很多“建模”——統計和非統計。
首先讓我們從基礎開始:
什麼是模型?
模型是現實的表示,儘管高度簡化。想想房子的蠟/木“模型”。你可以觸摸/感覺/聞到它。現在,數學模型是使用數字來表示現實。
我聽到你問這個“現實”是什麼?好的。所以想一下這個簡單的情況:你所在州的州長實施了一項政策,說一包香煙的價格現在將在明年花費 100 美元。“目的”是阻止人們購買香煙,從而減少吸煙,從而使吸煙者更健康(因為他們會戒菸)。
一年後,州長問你——這成功了嗎?你怎麼能那樣說?好吧,您可以捕獲數據,例如每天或每年售出的數據包數量、調查響應以及您可以獲得的與問題相關的任何可測量數據。您剛剛開始為問題“建模”。現在您要分析這個“模型”的含義。這就是統計建模派上用場的地方。您可以運行一個簡單的相關/散點圖來查看模型的“外觀”。您可能會想確定因果關係,即,如果增加價格確實導致吸煙減少或是否有其他混雜因素在起作用(即,也許它完全是其他東西,您的模型可能錯過了它?)。
現在,構建這個模型是通過“一組規則”(更像是指導方針)來完成的,即,什麼是合法的/不合法的,或者什麼是有意義的/沒有意義的。你應該知道你在做什麼以及如何解釋這個模型的結果。構建/執行/解釋此模型需要基本的統計知識。在上面的示例中,您需要了解相關/散點圖、回歸(單變量和多變量)和其他內容。我建議閱讀關於直觀理解統計的絕對有趣/信息豐富的讀物:什麼是 p 值無論如何這是一個幽默的統計介紹,將教你從簡單到高級的“建模”(即線性回歸)。然後,您可以繼續閱讀其他內容。
因此,請記住模型是現實的代表,並且*“所有模型都是錯誤的,但有些模型比其他模型更有用”。模型是現實的簡化表示*,您不可能考慮所有事情,但您必須知道要考慮什麼和不考慮什麼,才能擁有一個可以給您帶來有意義結果的好模型。
它不止於此。您也可以創建模型來模擬現實!這就是一堆數字會隨著時間而變化的方式(比如說)。這些數字映射到您所在領域的一些有意義的解釋。您還可以創建這些模型來挖掘您的數據,以查看各種度量如何相互關聯(此處的統計應用可能有問題,但現在不要擔心)。示例:您查看一家商店每月的雜貨銷售情況,並意識到每次購買啤酒時都會購買一包尿布(您構建了一個貫穿數據集的模型並向您展示了這種關聯)。這可能很奇怪,但這可能意味著大多數父親會在周末讓孩子坐在孩子身邊時買這個?將尿布放在啤酒附近,您可能會增加銷售額!啊啊!建模:)
這些只是示例,絕不是專業工作的參考。你基本上建立模型來理解/估計現實將/確實如何運作,並根據輸出做出更好的決策。不管統計與否,你可能一輩子都在做建模而沒有意識到這一點。祝你好運:)