“hard-mining”,“hard examples”,… - “hard”在不應用於問題難度時是否意味著統計中的任何特定內容?
會議論文 Jean Ogier Du Terrail,Frédéric Jurie。關於使用深度神經網絡檢測正射圖像中的小型車輛。IEEE 圖像處理國際會議,2017 年 9 月,中國北京。 ( PDF ) 使用術語 “硬挖掘” (6×)、 “硬挖掘” (2×)、 “硬示例” (3×)、 “硬示例挖掘” (1×)、 “硬否定” (2 ×), “硬負樣本”(1×)和 “硬負挖掘策略”(1×)。
我不知道“硬”指定器在這種情況下的含義。正如與引導程序一起提到的那樣,我懷疑它可能是統計術語,而不是 GIS 或 AI/IR/機器學習/視覺對象檢測或(深度卷積)人工神經網絡。(當然,它可能是一個特定於遙感的術語。)
[…]
2.3. 硬挖礦策略
Bootstrapping 在如何選擇困難示例方面提供了很多自由。例如,可以為每張圖像選擇有限數量的誤報,或者可以固定一個閾值,並且僅在其分數高於固定閾值(例如 0.5)時才選擇誤報。[…]
“硬”(一般而言,或在上面列出的術語中)是否意味著統計中的任何特定內容,如果是,是什麼?從上下文來看,我不認為它指的是問題的難度。
我認為這可能是相關的“確鑿證據”,但這並沒有幫助我確定它在這裡可能意味著什麼。
@Sycorax 是正確的。“困難示例”是指訓練集中被當前版本的分類器錯誤標記的示例。通常它只用於背景類,這是一個太大的集合,任何人都無法在沒有某種策略的情況下進行挖掘(不平衡集合上的二元分類很難)。
這個術語可能是 Girshick(我認為?)在開創性文章DPM中創造的,現在廣泛用於對象檢測社區,例如在OHEM中,其中在訓練的每個步驟中使用的負窗口是根據它們當前的分數選擇的.
後一篇文章是在線硬示例挖掘的示例(因此標題),而 ICIP 文章探討了不同的離線硬示例挖掘策略。