Neural-Networks

深度學習可以確定兩個筆跡樣本是否是同一個人的嗎?

  • November 10, 2019

我之前曾在手寫記錄上使用過 Tesseract CNN OCR,並對準確性感到驚訝。我想知道,是否可以使用它或其他方法來確定筆跡樣本是否由同一個人書寫?

我一直在尋找解決方案,但除了手寫 OCR 識別之外,很難獲得任何結果。有沒有人嘗試過這個或者可以指出我正確的方向?謝謝你。

這篇論文似乎完全符合您的要求:即使文本不匹配,也能識別筆跡樣本的作者身份。

DeepWriter:一種用於文本無關作家識別的多流深度 CNN ” 邢林杰,於喬。2016 年。

由於書面內容的巨大差異和不同作家的寫作風格模棱兩可,獨立於文本的作家識別具有挑戰性。本文提出 DeepWriter,一種深度多流 CNN,用於學習用於識別作者的深度強大表示。DeepWriter 將本地手寫補丁作為輸入,並使用 softmax 分類損失進行訓練。主要貢獻有:1)我們為作家識別任務設計和優化了多流結構;2)我們引入數據增強學習來增強DeepWriter的性能;3)我們引入了一種補丁掃描策略來處理不同長度的文本圖像。此外,我們發現英語和漢語等不同語言可能具有共同的作者識別特徵,聯合訓練可以產生更好的性能。在 IAM 和 HWDB 數據集上的實驗結果表明,我們的模型實現了很高的識別準確率:在 301 位作者和 657 位作者中,一個英文句子輸入為 99.01%,在 300 個作者中,一個漢字輸入為 93.85%,優於之前的方法大的邊際。此外,我們的模型在僅輸入 4 個英文字母的 301 位作者上獲得了 98.01% 的準確率。

連體網絡用於比較簽名等內容;嘗試將此方法擴展到筆跡分析似乎是合理的。一個挑戰是,雖然簽名有點像“郵票”,因為作者希望一遍又一遍地複制相同的符號,但兩個手寫樣本可能不會寫相同的單詞和短語。因此,該項目的成敗取決於神經網絡能否識別出與文字不同的寫作風格。

Jane Bromley、Isabelle Guyon、Yann LeCun、Eduard Sickinger 和 Roopak Shah。“使用‘連體’時間延遲神經網絡進行簽名驗證。” AT&T 貝爾實驗室。1994

本文描述了一種用於驗證寫在筆輸入板上的簽名的算法。該算法基於一種新穎的人工神經網絡,稱為“連體”神經網絡。該網絡由兩個相同的子網絡組成,它們的輸出連接在一起。在訓練期間,兩個子網絡從兩個簽名中提取特徵,而連接神經元測量兩個特徵向量之間的距離。驗證包括將提取的特徵向量與簽名者存儲的特徵向量進行比較。接受比所選閾值更接近此存儲表示的簽名,所有其他簽名都被拒絕為偽造品。

另一種方法是使用三重損失和嵌入策略,例如在 FaceNet 中使用的策略。然後,您通過某種方式比較嵌入以確定兩個圖像是否具有相同或不同的作者。從不同角度和不同閃電條件下拍攝的面部的成功是有希望的,並且可能更適合匹配筆跡樣本。

弗洛里安·施羅夫、德米特里·卡列尼琴科、詹姆斯·菲爾賓。“ FaceNet:人臉識別和聚類的統一嵌入

儘管人臉識別領域最近取得了重大進展,但大規模有效地實施人臉驗證和識別對當前方法提出了嚴峻挑戰。在本文中,我們提出了一個稱為 FaceNet 的系統,它直接學習從人臉圖像到緊湊歐幾里得空間的映射,其中距離直接對應於人臉相似度的度量。一旦產生了這個空間,就可以使用將 FaceNet 嵌入作為特徵向量的標準技術輕鬆實現人臉識別、驗證和聚類等任務。我們的方法使用經過訓練的深度卷積網絡直接優化嵌入本身,而不是像以前的深度學習方法那樣使用中間瓶頸層。培訓,我們使用使用新穎的在線三元組挖掘方法生成的大致對齊匹配/非匹配面塊的三元組。我們的方法的好處是更高的表示效率:我們實現了最先進的人臉識別性能,每張人臉僅使用 128 字節。在廣泛使用的野外標記人臉 (LFW) 數據集上,我們的系統達到了 99.63% 的新記錄準確率。在 YouTube Faces DB 上,它達到了 95.12%。我們的系統在兩個數據集上都將錯誤率與發布的最佳結果相比降低了 30%。我們還介紹了諧波嵌入的概念和諧波三元組損失,它們描述了相互兼容並允許相互直接比較的不同版本的人臉嵌入(由不同的網絡產生)。我們的方法的好處是更高的表示效率:我們實現了最先進的人臉識別性能,每張人臉僅使用 128 字節。在廣泛使用的野外標記人臉 (LFW) 數據集上,我們的系統達到了 99.63% 的新記錄準確率。在 YouTube Faces DB 上,它達到了 95.12%。我們的系統在兩個數據集上都將錯誤率與發布的最佳結果相比降低了 30%。我們還介紹了諧波嵌入的概念和諧波三元組損失,它們描述了相互兼容並允許相互直接比較的不同版本的人臉嵌入(由不同的網絡產生)。我們的方法的好處是更高的表示效率:我們實現了最先進的人臉識別性能,每張人臉僅使用 128 字節。在廣泛使用的野外標記人臉 (LFW) 數據集上,我們的系統達到了 99.63% 的新記錄準確率。在 YouTube Faces DB 上,它達到了 95.12%。我們的系統在兩個數據集上都將錯誤率與發布的最佳結果相比降低了 30%。我們還介紹了諧波嵌入的概念和諧波三元組損失,它們描述了相互兼容並允許相互直接比較的不同版本的人臉嵌入(由不同的網絡產生)。我們的系統達到了 99.63% 的新記錄準確率。在 YouTube Faces DB 上,它達到了 95.12%。我們的系統在兩個數據集上都將錯誤率與發布的最佳結果相比降低了 30%。我們還介紹了諧波嵌入的概念和諧波三元組損失,它們描述了相互兼容並允許相互直接比較的不同版本的人臉嵌入(由不同的網絡產生)。我們的系統達到了 99.63% 的新記錄準確率。在 YouTube Faces DB 上,它達到了 95.12%。我們的系統在兩個數據集上都將錯誤率與發布的最佳結果相比降低了 30%。我們還介紹了諧波嵌入的概念和諧波三元組損失,它們描述了相互兼容並允許相互直接比較的不同版本的人臉嵌入(由不同的網絡產生)。

引用自:https://stats.stackexchange.com/questions/435443

comments powered by Disqus