Neural-Networks

卷積神經網絡可以將不同大小的輸入圖像作為輸入嗎？

December 7, 2016

我正在研究用於圖像識別的捲積網絡，我想知道是否可以輸入不同大小的圖像（儘管差別不大）。

在這個項目上：https ://github.com/harvardnlp/im2markup

他們說：
and group images of similar sizes to facilitate batching
因此，即使經過預處理，圖像仍然具有不同的大小，這是有道理的，因為它們不會刪除公式的某些部分。

使用不同尺寸有什麼問題嗎？如果有，我應該如何解決這個問題（因為公式不適合相同的圖像大小）？

任何輸入將不勝感激

使用不同尺寸有什麼問題嗎？如果有，我應該如何解決這個問題（因為公式不適合相同的圖像大小）？

這取決於神經網絡的架構。一些架構假設所有圖像都具有相同的維度，而其他架構（例如 im2markup）則不做這樣的假設。我相信 im2markup 允許不同寬度的圖像這一事實不會帶來任何問題，因為它們使用 RNN 掃描卷積層的輸出。

將相似大小的圖像分組以方便批處理

這通常是為了通過避免添加太多填充來加快速度。

引用自：https://stats.stackexchange.com/questions/250258

相關問答

Neural-Networks

微調 CNN 時應該如何標準化輸入？

December 26, 2018

Neural-Networks

為什麼 CNN 以 FC 層結束？

September 14, 2018

Machine-Learning

在 CNN 中，我們是否在每個卷積層都學習了內核值？

August 20, 2018

Neural-Networks

池化和子採樣之間的區別

July 7, 2018

Neural-Networks

卷積層中的多個過濾器不會在訓練期間學習相同的參數嗎？

June 16, 2018

Neural-Networks

與非方形核的捲積

June 13, 2018