題:
Java庫可部分轉義HTML代碼
morgano
2014-04-30 06:37:50 UTC
view on stackexchange narkive permalink

我正在實現一個電子郵件Web客戶端。有時有些電子郵件帶有HTML內容。出於安全原因,我不想呈現原始來源的HTML代碼,而是轉義甚至更改某些不安全元素或屬性的值。我本來打算開始做一個庫來做這個的,但是我想也許已經做了一些工作。

有沒有Java庫已經在做這個呢?

我正在尋找的一些功能示例:

  • 更改元素“ img”中的屬性“ src”以獲取涉眾圖像
  • 刪除“ stript”元素。
  • 刪除“導入”規則。

我不介意此類庫是開源的還是專有的,只是想知道是否已經做過一些事情它。

一 回答:
morgano
2014-05-05 05:12:30 UTC
view on stackexchange narkive permalink

幾天后,我發現 Jsoup可以做到這一點,他們甚至有一種特殊的方法可以做到: http://jsoup.org/cookbook/cleaning-html/whitelist- sanitizer

但是,該庫首先加載所有內容(它使用的模型類似於XML的DOM),所以這不是一個完美的解決方案。

我是將在這裡留下我的答案,但我不會立即“接受”,希望其他人提出更好的解決方案(類似於XML的SAX)



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...