Descriptive-Statistics

用於計算值流的基本統計數據的命令行工具 [關閉]

  • March 20, 2012

是否有任何命令行工具可以接受來自標準輸入的數字流(以 ascii 格式)並提供此流的基本描述性統計信息,例如最小值、最大值、平均值、中值、RMS、分位數等?歡迎使用命令行鏈中的下一個命令解析輸出。工作環境是 Linux,但歡迎使用其他選項。

你可以用R來做到這一點,這可能有點矯枉過正……

編輯 2:[哎呀,當我重新輸入此內容時,看起來像其他人一樣Rscript。] 我找到了一種更簡單的方法。與 R 一起安裝應該是Rscript,這意味著做你想做的事情。例如,如果我有一個包含bar數字列表的文件,每行一個:

Rscript -e 'summary (as.numeric (readLines ("stdin")))' < bar

將文件中的數字發送到 R 並在行summary上運行 R 的命令,返回如下內容:

  Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.00    2.25    3.50    3.50    4.75    6.00 

您還可以執行以下操作:

Rscript -e 'quantile (as.numeric (readLines ("stdin")), probs=c(0.025, 0.5, 0.975))'

得到分位數。您顯然可以使用以下內容切斷第一行輸出(包含標籤):

Rscript -e 'summary (as.numeric (readLines ("stdin")))' < bar | tail -n +2

我強烈建議您首先在交互式 R 中做您想做的事情,以確保您的命令正確。在嘗試這個時,我省略了右括號,Rscript 什麼也不返回——沒有錯誤消息,沒有結果,什麼也沒有。

(作為記錄,文件欄包含:

1
2
3
4
5
6

引用自:https://stats.stackexchange.com/questions/24934

comments powered by Disqus