有比“積分的平均值”更好的名字嗎?
我正在測試我的業務銷售的節氣門位置傳感器 (TPS),並打印電壓對節氣門軸旋轉的響應圖。TPS 是一種旋轉傳感器90° 量程,輸出就像一個電位器,全開為 5V(或傳感器的輸入值),初始開度為 0 到 0.5V 之間的某個值。我用 PIC32 控制器構建了一個測試台,每 0.75° 進行一次電壓測量,黑線連接這些測量。
我的一種產品傾向於使遠離(和低於)理想線的局部低幅度變化。這個問題是關於我量化這些局部“下降”的算法;測量傾角過程的好名稱或描述是什麼?(下面是完整的解釋)在下圖中,下降發生在圖的左側三分之一處,無論我會通過還是失敗這部分都是邊緣情況:
所以我建立了一個傾角檢測器(stackoverflow qa about the algorithm)來量化我的直覺。我最初以為我在測量“面積”。該圖基於上面的打印輸出和我試圖以圖形方式解釋算法的嘗試。在 17 和 31 之間有 13 個樣本持續下降:
測試數據進入一個數組,我為從一個數據點“上升”到下一個數據點創建另一個數組,我稱之為. 我使用一個庫來獲取平均值和標準偏差.
分析數組如下圖所示,其中斜率已從上圖中移除。最初,我認為這是“標準化”或“統一”數據,因為 x 軸是相等的步長,我現在只處理數據點之間的上升。在研究這個問題時,我記得這是導數,的原始數據。
我走過找到有 5 個或更多相鄰負值的序列。藍色條是一系列低於所有數據平均值的數據點. 藍色條的值是:
他們總和,表示面積(或積分)。我的第一個想法是“我剛剛整合了導數”,這應該意味著我可以取回原始數據,儘管我確信有一個術語。
綠線是通過將面積除以傾角長度得出的這些“低於平均值”的平均值:
在對 100 多個零件進行測試期間,我發現我的綠線平均下降幅度小於是可以接受的。對整個數據集計算的標準偏差對這些下降沒有足夠嚴格的測試,因為沒有足夠的總面積,它們仍然落在我為好的零件設定的限制之內。我觀察地選擇了標準差成為我允許的最高水平。
為標準偏差設置一個足夠嚴格以使該部分失敗的截止值將是如此嚴格,以至於使原本看起來有很大情節的部分失敗。我也有一個尖峰檢測器,如果有的話,它會使零件失效.
距離 Calc 1 已經快 20 年了,所以請放輕鬆,但這感覺很像一位教授用微積分和位移方程來解釋如何在賽車中,一個加速度較小但保持較高角速度的競爭對手可以擊敗另一個選手下一個轉彎的加速度更大:通過上一個轉彎的速度更快,初始速度越高意味著他的速度(位移)下的區域越大。
將其轉化為我的問題,我覺得我的綠線就像加速度,原始數據的二階導數。
我訪問了維基百科,重新閱讀了微積分的基礎知識以及導數和積分的定義,學習了通過離散測量將曲線下面積相加的正確術語,如數值積分。對積分的平均值進行更多的谷歌搜索,我被引導到非線性和數字信號處理的主題。平均積分似乎是量化數據的流行指標。
積分的平均值有術語嗎?(,綠線)?
…或使用它來評估數據的過程?
首先,這是對您的項目和問題的一個很好的描述。而且我非常喜歡你自製的測量框架,它非常酷……那麼,你所說的“平均積分”到底有什麼關係呢?
如果您對工作的更廣泛定位感興趣,您想做的通常被稱為異常檢測。在其最簡單的設置中,它涉及將時間序列中的值與先前值的標準偏差進行比較。那麼規則是如果
在哪裡是個系列中的價值,是所有先前值之間的標準差和值,和是您選擇的一些合適的參數,例如 1 或 2,具體取決於您希望檢測器的靈敏度。您當然可以將此公式調整為僅在本地工作(在某個長度間隔上),
如果我理解正確,您正在尋找一種方法來自動測試您的設備,即在執行整個測試(繪製整個對角線)後將設備聲明為好/故障。在這種情況下,只需將上述公式視為比較針對所有值的標準偏差。
出於將設備分類為故障的目的,您可能還需要考慮其他規則:
- 如果任何偏差 (delta) 大於所有 delta 的 SD 的某個倍數
- 如果偏差的平方和大於某個閾值
- 如果正負增量之和的比率不近似相等(如果您更喜歡兩個方向上的較小誤差而不是單個方向上的強偏差,這可能很有用)
當然,您可以找到更多規則並使用布爾邏輯將它們連接起來,但我認為您可以通過上述三個方法走得更遠。
最後但並非最不重要的一點是,一旦設置好,您將需要測試分類器(分類器是將輸入映射到類的系統/模型,在您的情況下,每個設備的數據映射到“好”或“故障”)。通過手動標記每個設備的性能來創建測試集。然後查看ROC,它基本上告訴您系統從返回的設備中正確拾取的設備數量與拾取的故障設備數量之間的偏移量。