Neural-Networks
圖像格式(png、jpg、gif)是否會影響圖像識別神經網絡的訓練方式?
我知道使用深度卷積神經網絡在圖像識別、圖像分類等方面取得了很多進展。
但是,如果我在 PNG 圖像上訓練一個網絡,它是否只適用於如此編碼的圖像?還有哪些其他圖像屬性會影響這一點?(阿爾法通道,隔行掃描,分辨率等?)
簡短的回答是NO。
圖像編碼的格式與其質量有關。神經網絡本質上是執行大量操作(矩陣乘法、元素加法和映射函數)的數學模型。神經網絡將張量視為其輸入(即多維數組)。它的形狀通常是 4-D(每批次的圖像數量、圖像高度、圖像寬度、通道數)。
不同的圖像格式(尤其是有損格式)可能會產生不同的輸入數組,但嚴格來說,神經網絡在其輸入中看到的是數組,而不是圖像。