Classification

堆疊多個 LSTM 有什麼好處?

  • July 27, 2015

有什麼優勢,為什麼要在深度網絡中使用多個並排堆疊的 LSTM?我正在使用 LSTM 將一系列輸入表示為單個輸入。所以一旦我有了那個單一的表示——我為什麼要再次通過它?

我問這個是因為我在一個自然語言生成程序中看到了這個。

我認為您指的是垂直堆疊的 LSTM 層(假設水平軸是時間軸。

在這種情況下,堆疊 LSTM 的主要原因是允許更大的模型複雜性。在簡單的前饋網絡的情況下,我們堆疊層以創建輸入數據的分層特徵表示,然後用於某些機器學習任務。這同樣適用於堆疊 LSTM。

除了循環輸入之外,每個時間步都有一個 LSTM。如果輸入已經是 LSTM 層(或前饋層)的結果,則當前 LSTM 可以創建當前輸入的更複雜的特徵表示。

現在,在特徵輸入和 LSTM 層之間具有前饋層與具有另一個 LSTM 層之間的區別在於,前饋層(例如全連接層)不接收來自其先前時間步長的反饋,因此無法解釋某些情況模式。使用 LSTM 代替(例如使用堆疊的 LSTM 表示)可以在每一層描述更複雜的輸入模式

引用自:https://stats.stackexchange.com/questions/163304

comments powered by Disqus