題:
打印整個網站的軟件
Zaid Amir
2014-06-10 19:11:06 UTC
view on stackexchange narkive permalink

我有我要打印的在線用戶指南。問題是它作為網站上傳,每個部分都放在單獨的鏈接中,並且逐頁打印非常耗時。是否有任何應用程序或瀏覽器擴展使我能夠拉動整個內容並將其打印在紙或PDF上?

此處是該指南的鏈接: http://download.brainvoyager。 com / tbv / TBVUsersGuide / TurboBrainVoyagerUsersGuide.html

如果起始頁麵包含所有後續鏈接,那麼Caliber可能值得一試(請參閱[此處我的回答](http://softwarerecs.stackexchange.com/q/1418/185#1427))。不過,我尚未在類似的在線資源上嘗試過,因此僅是評論而不是答案(不過,這種方式在本地資源上效果很好)。
墨水和紙張的閱讀成本可能會比電子閱讀器或便宜的平板電腦高
相關:[網頁到PDF轉換器](https://softwarerecs.stackexchange.com/q/35963/3474)
三 答案:
Franck Dernoncourt
2014-06-10 19:35:06 UTC
view on stackexchange narkive permalink

上次必須執行此操作時,我分兩個步驟進行了操作:

步驟1:使用 GNU wget(免費,Linux,Windows)將頁面檢索為HTML 。 (例如,使用 wget --mirror http://softwarerecs.stackexchange.com

步驟2:獲取CLI,將HTML轉換為PDF,例如 wkhtmltopdf(免費和開放源代碼,可用於Windows,Mac和Linux的二進製文件)。

enter image description here

如果您要手動選擇感興趣的網站鏈接,在下載它們之前,您可以使用諸如 linkchecker之類的專用工具獲取網站上的所有鏈接/頁面(或者在可能的情況下,從源代碼的grep中獲取grep鏈接)。菜單)。

enter image description here

您假設所有內容都是靜態下載的HTML ...如果站點通過Java腳本生成其部分內容,或者通過Ajax下載其他內容並動態修改DOM怎麼辦?使用wget時,這些都不可用。
@JimGarrison是的,在某些情況下,您可能想繞過wget並直接使用wkhtmltopdf,因為後者可以將URL作為輸入並依賴QT Webkit呈現引擎,該引擎應處理大多數Javascript(我不確定如果網站通過Ajax下載其他內容並動態修改DOM(我還沒有嘗試過)。
Steve Barnes
2014-06-10 19:38:11 UTC
view on stackexchange narkive permalink

使用 python + Scrapy + BeautifulSoup來獲取網站,然後您就可以使用python pdf庫或 pandoc將其轉換為您所需的任何內容。

以上所有內容都是免費的,跨平台的和開源的。

kenorb
2019-08-28 20:10:47 UTC
view on stackexchange narkive permalink

WeasyPrint

免費(已獲得BSD許可)和開源解決方案,可幫助Web開發人員創建PDF文檔。它將簡單的HTML頁面(帶有CSS,SVG)轉換為PDF格式。它旨在支持用於打印的Web標準。

它基於各種庫,但不基於WebKit或Gecko之類的完整呈現引擎。 CSS佈局引擎是用Python編寫的,專為分頁而設計,旨在易於破解。

相關:網頁到PDF轉換器



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...