我們如何定義“可重複的研究”?
這已經出現在幾個問題中,我一直在想一些事情。整個領域是否已經轉向關注原始數據和相關代碼的可用性的“可重複性”?
我總是被告知,再現性的核心並不一定是,正如我所提到的,點擊運行並獲得相同結果的能力。數據和代碼方法似乎假設數據是正確的——數據本身的收集沒有缺陷(在科學欺詐的情況下通常是錯誤的)。它還關注目標人群的單個樣本,而不是發現在多個獨立樣本上的可複制性。
為什麼強調能夠重新運行分析,而不是從頭開始重複研究?
以下評論中提到的文章可在此處獲得。
“可重複性研究”作為可重複性分析
可重複性研究是一些研究領域中使用的一個術語,專門指進行分析,使得
- 代碼將原始數據和元數據轉換為處理後的數據,
- 代碼對數據進行分析,並且
- 代碼將分析合併到報告中。
共享此類數據和代碼時,其他研究人員可以:
- 執行原始研究人員未報告的分析
- 檢查原始研究人員進行的分析的正確性
這種用法可以在Sweave等技術的討論中看到。例如,Friedrich Leisch 在 Sweave 的上下文中寫道,“如果數據或分析發生變化,報告可以自動更新,從而實現真正可重複的研究。” 這也可以在CRAN 的可重複研究任務視圖中看到,該視圖指出“可重複研究的目標是將特定指令與數據分析和實驗數據聯繫起來,以便可以重新創建、更好地理解和驗證學術成果。”
更廣泛地使用術語“再現性”
可重複性是科學的基本目標。這不是新的。研究報告包括方法和結果部分,應概述數據是如何生成、處理和分析的。一般規則是所提供的詳細信息應足以使適當稱職的研究人員能夠獲取所提供的信息並複制研究。
再現性也與可複制性和泛化的概念密切相關。
因此,從字面上看,“可重複性研究”一詞應用於 Sweave 等技術是用詞不當,因為它暗示的相關性比它所涵蓋的範圍更廣。此外,當向未使用過此類技術的研究人員展示 Sweave 之類的技術時,當我將這一過程稱為“可重複性研究”時,這些研究人員通常會感到驚訝。
比“可重複研究”更好的術語
鑑於在類似 Sweave 的上下文中使用的“可重複研究”僅涉及可重複研究的一個方面,也許應該採用一個替代術語。可能的替代方案包括:
重現性分析:
可重複的數據分析
- Christophe Pouzat使用這個術語
可重複的統計分析
- Vanderbilt 的 Biostats 網站使用術語“可重複的統計分析和報告活動”
可重現的報告
以上所有術語都更準確地反映了類 Sweave 分析所需要的內容。可重現的分析簡短而有趣。添加“數據”或“統計”進一步澄清了事情,但也使術語變得更長和更窄。此外,“統計”有狹義和廣義之分,當然在狹義中,很多數據處理都不是統計的。因此,術語“可重複分析”所暗示的廣度有其優勢。
這不僅僅是關於可重複性
術語“可重複性研究”的另一個附加問題是 Sweave 類技術的目標不僅僅是“可重複性”。有幾個相互關聯的目標:
再現性
- 是否可以輕鬆地重新運行分析以將原始數據轉換為具有相同結果的最終報告?
正確性
- 數據分析是否與研究人員的意圖一致?
- 研究人員的意圖是否正確?
開放性
透明度、問責制
- 其他人可以檢查和驗證所執行分析的準確性嗎?
可擴展性、可修改性
- 其他人能否修改、擴展、重用和混合數據、分析或兩者兼而有之,以創建新的研究工作?
有一種觀點認為,可重複的分析應該促進正確的分析,因為存在可以檢查的書面分析記錄。此外,如果共享數據和代碼,它會產生問責制,從而激勵研究人員檢查他們的分析,並使其他研究人員能夠注意到更正。
可重複分析也與圍繞開放研究的概念密切相關。當然,研究人員可以只為自己使用類似 Sweave 的技術。開放研究原則鼓勵共享數據和分析代碼,以實現更多的重用和問責制。
這並不是對使用“可複制”一詞的真正批評。相反,它只是強調使用類似 Sweave 的技術是必要的,但不足以實現開放的科學研究目標。