Reproducible-Research

公開可用數據的託管選項

  • November 2, 2011

因此,您決定支持可重複研究的想法,並希望將您的數據在線提供給人們查看和使用。問題是,你在哪里托管它?

我的第一個傾向當然是我在大學服務器上擁有的私人網絡空間,但這些東西實際上並不是那麼持久 - 如果我離開,目錄會在很短的時間內保持打開狀態,然後它就會消失。保持數據可供人們在未來使用和工作的正確設置幾乎沒有。

你使用 GitHub 或 SourceForge 之類的東西嗎?還是其他服務?

有問題的數據是一些非常感興趣的模擬的輸出 - 所以我不一定認為像 InfoChimps 或另一個公共數據存儲庫這樣的地方是它的正確歸宿。這不是“您可以使用此代碼學習東西!” 以及更多“您可以在本文中復製圖 3”。

一個簡單的選擇是github

我用它來分享數據和數據分析代碼。這個問題上列出了一些其他人在網站上共享代碼和數據的好例子。

github的好處

  • 一旦您熟悉了 git,就可以輕鬆上傳,為什麼不使用 git 來滿足您的版本控制需求。
  • 您可以將要點用於簡單的單個文件
  • 其他人可以輕鬆下載單個或多個文件作為存檔
  • 它有大量的免費存儲空間
  • 源代碼可以在網上瀏覽
  • 和更多…

當然,github 對於數據來說並不完美。我可以看到使用更永久的機構存儲庫或其他一些專用工具進行更嚴肅歸檔的優點。

引用自:https://stats.stackexchange.com/questions/17850

comments powered by Disqus

相關問答