Descriptive-Statistics
用於計算值流的基本統計數據的命令行工具 [關閉]
是否有任何命令行工具可以接受來自標準輸入的數字流(以 ascii 格式)並提供此流的基本描述性統計信息,例如最小值、最大值、平均值、中值、RMS、分位數等?歡迎使用命令行鏈中的下一個命令解析輸出。工作環境是 Linux,但歡迎使用其他選項。
你可以用R來做到這一點,這可能有點矯枉過正……
編輯 2:[哎呀,當我重新輸入此內容時,看起來像其他人一樣
Rscript
。] 我找到了一種更簡單的方法。與 R 一起安裝應該是Rscript
,這意味著做你想做的事情。例如,如果我有一個包含bar
數字列表的文件,每行一個:Rscript -e 'summary (as.numeric (readLines ("stdin")))' < bar
將文件中的數字發送到 R 並在行
summary
上運行 R 的命令,返回如下內容:Min. 1st Qu. Median Mean 3rd Qu. Max. 1.00 2.25 3.50 3.50 4.75 6.00
您還可以執行以下操作:
Rscript -e 'quantile (as.numeric (readLines ("stdin")), probs=c(0.025, 0.5, 0.975))'
得到分位數。您顯然可以使用以下內容切斷第一行輸出(包含標籤):
Rscript -e 'summary (as.numeric (readLines ("stdin")))' < bar | tail -n +2
我強烈建議您首先在交互式 R 中做您想做的事情,以確保您的命令正確。在嘗試這個時,我省略了右括號,Rscript 什麼也不返回——沒有錯誤消息,沒有結果,什麼也沒有。
(作為記錄,文件欄包含:
1 2 3 4 5 6