題:
PDF匿名器–刪除可能識別的元數據
Szabolcs
2016-05-09 23:12:24 UTC
view on stackexchange narkive permalink

我正在尋找PDF匿名器軟件,該軟件將自動刪除可能識別身份的元數據。

它必須像啤酒一樣免費,並且必須在OS X上運行。

它確實不需要是完美的;

命令行工具是可以的,只要它們不需要神秘的語法即可實現此目標。理想情況下,它應該是為此目的專用的工具。使用帶有復雜命令行選項的Ghostscript可能可以實現這一點,但是我無法牢記這些,所以這不是我想要的。

Adob​​e Acrobat可以做到這一點,但這不是免費的。

建議的工具當然可以實現預期的功能。但是,PDF有一個特殊之處,該工具未處理:私有數據。有時,私有數據也被認為是元數據,而實際上,最令人尷尬的帶有PDF的罩衫不是起源於元數據,而是起源於私有數據。私有數據是指創建應用程序將其嵌入文件中的數據。眾所周知,MS Word可以嵌入很多內容,包括更改歷史記錄和其他內容。您可以自行決定是否要解決您的問題……
@MaxWyss我絕對樂於接受更多有關更好工具的建議。 [Multivalent](http://multivalent.sourceforge.net/)過去曾能夠刪除此類數據,但它也經過重新處理,有時會破壞PDF。幾年前,其作者決定刪除此功能,並嘗試阻止人們下載仍具有該功能的舊版本軟件...
我剛想到的工具(Appligent的APSaveAs)不是免費的,很可能其他工具也都不免費。您必須嘗試一下,並且要注意在實踐中避免使用,但是“引用”應該刪除個人數據。引用是指通過PostScript打印機驅動程序傳遞PDF,然後使用Distiller(或Ghostscript)重新創建PDF。
二 答案:
#1
+6
Steve Barnes
2016-05-10 00:20:38 UTC
view on stackexchange narkive permalink

For a ready written application you can use ExifTool with a list of parameters that you would like to remove something like:

exiftool -Author= -Creator= name_of_pdf.pdf -o clean.pdf 
  • if you are doing this sort of thing regularly you can put the list of values to blank into an external file or use a bash script.

ExifTool is:

  • Free, gratis & Open Source
  • Cross Platform written in perl
  • Available as standalone OS-X package and Windows exe
  • Works on lots of other file formats
我有exiftool,但我不知道它可以處理PDF。但是`-all =`會比`-Author = -Creator =`更好嗎?
@Szabolcs--一切正常,但是可能需要保留一些數據。
專家提示:將alias pdfanon ='exiftool -Author = -Creator ='添加到您的.bashrc文件中,然後像pdfanon in.pdf -o out.pdf一樣運行它。 ;)
我想指出,exiftool確實警告說,對PDF元數據的更改是可逆的,並且可以恢復。無論如何,對於我來說,exiftool足夠好。我不需要採取重大的去匿名化措施,而只是想確保在可見的地方不會意外遺漏任何東西。
#2
+2
homocomputeris
2019-01-22 00:43:38 UTC
view on stackexchange narkive permalink

基於Python的元數據匿名化工具包2,可以清除各種文件類型的元數據:

 用法:mat2 [-h] [-v] [-l ] [--check-dependencies] [-V] [-未知成員策略] [-s | -L] [文件[文件...]]元數據匿名化工具包2位置參數:將文件歸檔以處理可選參數:-h,--help顯示此幫助消息並退出-v,--version顯示程序的版本號並退出- l-列出所有支持的文件格式--check-dependencies檢查MAT2是否具有所需的所有依賴項-V,--verbose顯示更多詳細的狀態信息--unknown-members策略如何處理存檔樣式文件的未知成員(策略應為:中止,省略,保留)-s,--show列出MAT2可檢測到的有害元數據,而無需將其刪除-L,--lightweight remove SOME  


該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...