在沒有博士學位的情況下從事數據挖掘工作
一段時間以來,我一直對數據挖掘和機器學習非常感興趣,部分原因是我在學校主修該領域,但也因為我真的很興奮嘗試解決需要更多思考而不僅僅是編程的問題知識,其解決方案可以有多種形式。我沒有研究員/科學家背景,我來自計算機科學背景,重點是數據分析,我擁有碩士學位而不是博士學位。我目前有一個與數據分析相關的職位,即使這不是我工作的主要重點,但我至少對它有一些了解。
當我前段時間在幾家公司面試一份工作,並與一些招聘人員交談時,我發現了一個常見的模式,人們似乎認為你需要擁有博士學位才能進行機器學習,即使我可能是概括得有點過頭了(有些公司並不是特別在尋找博士)。
雖然我認為擁有該領域的博士學位很好,但我認為這不是絕對必要的。我對大多數現實世界的機器學習算法都有一些相當不錯的知識,我自己實現了大部分算法(無論是在學校還是在個人項目中),並且在處理涉及機器學習/數據挖掘和一般統計的問題時感到非常自信. 我有一些類似的朋友,他們似乎對此也很了解,但也覺得如果你不是博士,一般公司在招聘數據挖掘方面是很害羞的。
我想得到一些反饋,你認為博士學位對於從事該領域的工作是絕對必要的嗎?
(在這裡發布這個問題之前我有點猶豫,但是由於它似乎是 meta 上可以接受的話題,所以我決定發布這個我一直在思考的問題。)
我相信實際上與您的結論相反的是正確的。在The Disposable Academic中,給出了一些關於應用數學、數學和計算機科學領域的博士學位持有者相對於碩士學位持有者的低工資溢價的建議。部分原因是公司意識到碩士學位持有者通常具有同樣多的理論深度、更好的編程技能、更柔韌並且可以針對公司的特定任務進行培訓。例如,要讓 SVM 弟子欣賞貴公司依賴於決策樹的基礎架構並不容易。通常,當有人將大量時間投入到特定的機器學習範式上時,他們很難將其生產力推廣到其他領域。
另一個問題是,現在很多機器學習工作都是為了完成任務,而不是寫論文或開發新方法。您可以採取高風險的方法來開發新的數學工具、研究方法的 VC 維度方面、其潛在的複雜性理論等。但最終,您可能得不到從業者會關心的東西。
同時,看看像poselets這樣的東西。基本上沒有新的數學產生於poselets。它完全不優雅、笨拙,而且缺乏任何數學複雜性。但它可以非常好地擴展到大型數據集,並且看起來它將在未來一段時間內成為姿勢識別(尤其是計算機視覺)的主要內容。這些研究人員做得很好,他們的工作值得稱讚,但這並不是大多數人與機器學習博士相關的事情。
像這樣的問題,你會得到很多不同的意見,所以一定要考慮一下。我目前是計算機視覺專業的博士生,但我決定提前離開我的項目,獲得碩士學位,我將在一家資產管理公司工作,從事自然語言機器學習、計算統計等工作。我還考慮過幾家大型電視公司的基於廣告的數據挖掘工作,以及一些機器人工作。在所有這些領域中,對於具有數學成熟度和解決多種編程語言問題的訣竅的人來說,有很多工作。有碩士學位就好了。而且,根據《經濟學人》的那篇文章,你的報酬基本上和擁有博士學位的人一樣。如果你在學術界以外工作,
正如彼得·泰爾(Peter Thiel)曾經說過的那樣,“研究生院就像按下生活鬧鐘上的貪睡按鈕……”