是否有任何免費軟件OCR軟件(適用於Linux和/或Windows)可以將PDF掃描的文檔作為輸入,並像Adobe Acrobat一樣輸出可搜索的PDF?
對於可搜索的PDF我是說OCRed文本在原始文本上不可見,可以用鼠標選擇並複制。
我知道Linux上的 gscan2pdf可以執行類似的操作,但是該文本被放置在頁面的左上角,它太小,根本與後台掃描頁面上的文本不同步。這是因為gscan2pdf將整個頁面饋送到OCR引擎。它應該將圖像分解為帶有單行文本或小段文字的小圖像,然後發送給OCR軟件。