Mathematical-Statistics

每個統計學家都應該知道哪些理論?

  • February 14, 2012

我從一個非常基本的、最低要求的角度來考慮這個問題。行業(而非學術)統計學家應該定期了解、理解和利用哪些關鍵理論?

想到的一個大數是大數定律。將統計理論應用於數據分析最重要的是什麼?

坦率地說,我不認為大數定律在工業中發揮了巨大的作用。了解常用程序的漸近證明很有幫助,例如最大似然估計和測試(尤其包括非常重要的 GLM 和邏輯回歸)、引導程序,但這些是分佈問題,而不是遇到壞樣本的概率問題.

除了已經提到的主題(GLM、推理、引導程序)之外,最常見的統計模型是線性回歸,因此必須徹底了解線性模型。你可能永遠不會在你的行業生活中運行 ANOVA,但如果你不理解它,你就不應該被稱為統計學家。

有不同種類的行業。在製藥行業,沒有隨機試驗和邏輯回歸就無法謀生。在調查統計中,如果沒有 Horvitz-Thompson 估計器和無響應調整,您將無法謀生。在計算機科學相關的統計中,沒有統計學習和數據挖掘就無法謀生。在公共政策智囊團(以及越來越多的教育統計數據)中,如果沒有因果關係和治療效果估計器(越來越多地涉及隨機試驗),你就無法謀生。在營銷研究中,您需要將經濟學背景與心理測量理論結合起來(並且您無法在典型的統計部門的課程中學習它們)。工業統計使用其獨特的六西格瑪範式運作,這些範式與主流統計數據相距甚遠;在實驗材料的設計中可以找到更強的鍵。華爾街的材料將是金融計量經濟學,一直到隨機微積分。這些是非常不同的技能,“行業”一詞的定義甚至比“學術界”更難定義。我認為沒有人可以聲稱同時知道以上兩三個以上的知識。

然而,在“行業”中普遍需要的頂級技能(無論這對您意味著什麼)將是時間管理、項目管理以及與不太懂統計的客戶的溝通。因此,如果您想為行業安置做好準備,請在商學院學習這些主題的課程。

更新:原帖寫於 2012 年 2 月;這些天(2014 年 3 月),您可能應該稱自己為“數據科學家”而不是“統計學家”,以便在行業中找到一份熱門工作……並更好地學習一些 Hadoop 來遵循自我宣言。

引用自:https://stats.stackexchange.com/questions/22804

comments powered by Disqus