Conv-Neural-Network

用於圖像分類的非方形圖像

  • October 17, 2016

我有一個寬圖像數據集:1760x128。我已經閱讀了教程和書籍,其中大多數都指出輸入圖像應該是方形的,如果不是,它們會被轉換為方形,以便在已經訓練的(方形圖像上)cnns 中進行訓練。有沒有辦法為非方形圖像訓練 cnn,或者我應該尋找另一個選項作為填充?

根據分類器的不同,有幾種方法可以解決該問題。滑動窗口是我最熟悉的方法,用於神經網絡方法。這種方法涉及拍攝一個小的子圖像,並在一些重疊的情況下上下移動它。一些問題包括找到最佳移位參數和多尺度問題。

最終檢測通常取決於分類器對每個子圖像屬於該類的置信度:例如多數投票、總可能性或與決策邊界的總距離。我在下面列出了一些材料,第一個是用於 HOG 分類器方法的,但概念是相同的。

  1. 對象檢測滑動窗口
  2. 對像類別檢測:滑動窗口
  3. 使用卷積網絡的 OverFeat 集成識別、定位和檢測

引用自:https://stats.stackexchange.com/questions/240690

comments powered by Disqus

相關問答