題:
有免費的PDF到HTML轉換軟件嗎?
Switch
2015-04-28 10:54:29 UTC
view on stackexchange narkive permalink

我正在從事一個需要同時處理HTML和PDF文件的項目。這就需要很多HTML到PDF以及PDF到HTML的轉換。

要求是:

  1. 它必須是免費的,最好是開源的
  2. 它必須完全脫機
  3. 它必須穩定,可靠且信譽良好
  4. ol>

    是否有這樣的軟件,如果可以,請推薦。

哪個操作系統?一次單個文件,還是需要批處理模式?您可以提供給我們的信息越多,我們可以為您提供的幫助就越多。
查看最受歡迎的電子書管理器http://calibre-ebook.com/,它可以雙向轉換,但是使用了稱為HTMLZ的東西,HTMLZ是帶有一些附加信息的壓縮(壓縮)HTML。參見http://www.mobileread.com/forums/showthread.php?t=128076和http://htmlz.topdf.com/和http://www.goodreads.com/topic/show/734946-convert- to-html我沒有發布答案,因為這將需要您進行一些工作,但是應該不多,我相信這可以滿足您的要求。讓我們知道怎麼回事。
另請參見:[尊重CSS @font-face的HTML到PDF批處理模式轉換器(或庫)?](https://softwarerecs.stackexchange.com/q/14437/185)關鍵字:Prince(HTML-> PDF;質量很好,我自己用這個),潘多克。還要檢查[這些問題](https://softwarerecs.stackexchange.com/search?q=html+pdf+is%3Aquestion)。和[PDF內容提取軟件](https://softwarerecs.stackexchange.com/q/18728/185)(關鍵字:Poppler,雙向運行)。
嘗試[Print2Flash]的免費版(http://print2flash.com/download.php)。它不僅可以轉換PDF文檔,還可以轉換Office /文本/圖像文件等。
八 答案:
Kurt Pfeifle
2015-05-17 22:23:48 UTC
view on stackexchange narkive permalink

查看 mudraw 的最新版本。它是 MuPDF 工具系列中的命令行工具。

  mudraw -o out.html -F html in。 pdf  

盡可能使用最新版本。它獲得了許多新的附加功能(它不僅可以完成PDF-> HTML轉換),還可以:

  $ mudraw用法:mudraw [選項]文件[頁面] -p-密碼-o-輸出文件名(%d為頁碼)-F-輸出格式(默認為從輸出文件名推斷)柵格:png,tga,pnm,pam,pbm,pwg,pcl矢量:svg,pdf,跟踪文本: txt,html,stext -s-顯示額外信息:m-顯示內存使用情況t-顯示定時f-顯示頁面功能5-顯示渲染圖像的md5校驗和-R-順時針旋轉(默認值:0度)-r-分辨率為dpi(默認值:72)-w-寬度(以像素為單位)(如果指定了-r,則為最大寬度)-h-高度(以像素為單位)(如果指定了-r,則為最大高度)-f-精確地適合寬度和/或高度;忽略原始寬高比-B-最大帶寬(僅pgm,ppm,pam,png輸出)-W-EPUB佈局的頁面寬度-H-EPUB佈局的頁面高度-S-EPUB佈局的字體大小-c-色彩空間(單色,灰色,grayalpha,rgb,rgba,cmyk,cmykalpha)-G-應用伽瑪校正-I反轉顏色-A-抗鋸齒的位數(0到8)-D禁用顯示列表的使用-i忽略錯誤頁面,以逗號分隔頁碼和範圍的列表 

更新(2016年4月)

該工具的調用約定已更改。它仍然是MuPDF系列的一部分,但是您現在可以像這樣運行它:

  mutool draw  
nvillalobos
2016-12-02 22:42:36 UTC
view on stackexchange narkive permalink

如果您想使用商業產品,則應簽出 LEADTOOLS SDK。您只需將幾行代碼即可將PDF轉換為HTML,反之亦然。您需要做的就是使用

  // 加載 PDF文件//加載源文件(確保以24位/像素加載)RasterImage image = codecs .Load(“ PATH TO FILE”,24,CodecsLoadByteOrder.Bgr,1,1);  

,然後使用 p 將該文件另存為HTML >

  //將其另存為HTMLcodecs.Save(image,“ DESTINATION PATH”,RasterImageFormat.Htm,0);  

免責聲明:我是該產品的僱員

user9811991
2018-05-20 20:50:54 UTC
view on stackexchange narkive permalink

pdf2htmlEX可以準確地將PDF轉換為HTML並保留格式。但是,生成的HTML代碼很難以編程方式讀取和解析。它是免費的開放源代碼,並且可以在各種平台上離線工作。

https://github.com/coolwanglu/pdf2htmlEX

https://github.com/coolwanglu/pdf2htmlEX/wiki/下載

SeanPercy42
2015-05-12 04:21:14 UTC
view on stackexchange narkive permalink

某些PDF到HTML轉換器是我能夠找到的唯一免費的離線PDF到HTML轉換器。希望這對您有用!

admiralchip
2015-08-19 20:23:20 UTC
view on stackexchange narkive permalink

“免費PDF至HTML轉換器”軟件(您可以在這裡找到: http://www.free-pdf-to-word.org/tutorials/freepdftohtmlconverter01_how_to_convert_pdf_to_html.html)很好。我已經使用它將多個PDF轉換為HTML文件,到目前為止,我對輸出非常滿意。它可以很好地維護PDF的佈局,您可以選擇是否要將PDF中的圖像存儲在單獨的文件夾中。

P.S。下載鏈接位於右側的“必需資源”。

ivanivan
2017-11-29 22:34:46 UTC
view on stackexchange narkive permalink

您是否在Linux中嘗試過 pdf2html ?免費版和免費版都可以離線運行,許多發行版已經打包了很長時間了。

https://linux.die.net/man/1/pdftohtml

karel
2017-11-29 16:38:19 UTC
view on stackexchange narkive permalink

Calibre是Windows / Mac / Linux的免費開源程序,能夠將PDF文件快速轉換為HTMLZ存檔。 HTMLZ存檔包含一個index.html文件,其中是轉換後的.html文件。它也包含用於格式化的style.css文件,有時可能包含其中包含圖像的images文件夾。

當我嘗試使用Calibre將PDF圖書轉換為.html時,我感到非常驚訝它。它保留了文本格式,並且在保留行尾方面沒有任何錯誤。當我在一本格式不佳的雜誌或文本文檔上嘗試Calibre時,除非將PDF文件轉換為純文本然後在字處理器中手動編輯並另存為.html文件,否則結果是不可接受的。這樣可以得到完美的結果,但是非常耗時。 Calibre不能很好地轉換每個PDF文件,但是大多數時候它都能很好地完成工作,因此值得一試。

dwjohnston
2017-11-29 16:46:08 UTC
view on stackexchange narkive permalink

我知道您說的是獨立的-但是如果您可以使用節點-這是我發現的最好的節點模塊:

https://github.com/peterdemartini/html5-to- pdf

為了使事情變得更簡單-這是我創建的一個節點/ webpack項目,用於使用HTML創建我的CV

https://github.com/dwjohnston / cv



該問答將自動從英語翻譯而來。原始內容可在stackexchange上找到,我們感謝它分發的cc by-sa 3.0許可。
Loading...