我正在從事一個需要同時處理HTML和PDF文件的項目。這就需要很多HTML到PDF以及PDF到HTML的轉換。
要求是:
- 它必須是免費的,最好是開源的
- 它必須完全脫機
- 它必須穩定,可靠且信譽良好 ol>
是否有這樣的軟件,如果可以,請推薦。
我正在從事一個需要同時處理HTML和PDF文件的項目。這就需要很多HTML到PDF以及PDF到HTML的轉換。
要求是:
是否有這樣的軟件,如果可以,請推薦。
查看 mudraw
的最新版本。它是 MuPDF 工具系列中的命令行工具。
mudraw -o out.html -F html in。 pdf
盡可能使用最新版本。它獲得了許多新的附加功能(它不僅可以完成PDF-> HTML轉換),還可以:
$ mudraw用法:mudraw [選項]文件[頁面] -p-密碼-o-輸出文件名(%d為頁碼)-F-輸出格式(默認為從輸出文件名推斷)柵格:png,tga,pnm,pam,pbm,pwg,pcl矢量:svg,pdf,跟踪文本: txt,html,stext -s-顯示額外信息:m-顯示內存使用情況t-顯示定時f-顯示頁面功能5-顯示渲染圖像的md5校驗和-R-順時針旋轉(默認值:0度)-r-分辨率為dpi(默認值:72)-w-寬度(以像素為單位)(如果指定了-r,則為最大寬度)-h-高度(以像素為單位)(如果指定了-r,則為最大高度)-f-精確地適合寬度和/或高度;忽略原始寬高比-B-最大帶寬(僅pgm,ppm,pam,png輸出)-W-EPUB佈局的頁面寬度-H-EPUB佈局的頁面高度-S-EPUB佈局的字體大小-c-色彩空間(單色,灰色,grayalpha,rgb,rgba,cmyk,cmykalpha)-G-應用伽瑪校正-I反轉顏色-A-抗鋸齒的位數(0到8)-D禁用顯示列表的使用-i忽略錯誤頁面,以逗號分隔頁碼和範圍的列表
該工具的調用約定已更改。它仍然是MuPDF系列的一部分,但是您現在可以像這樣運行它:
mutool draw
如果您想使用商業產品,則應簽出 LEADTOOLS SDK。您只需將幾行代碼即可將PDF轉換為HTML,反之亦然。您需要做的就是使用
// 加載 PDF文件//加載源文件(確保以24位/像素加載)RasterImage image = codecs .Load(“ PATH TO FILE”,24,CodecsLoadByteOrder.Bgr,1,1);
,然後使用 p 將該文件另存為HTML >
//將其另存為HTMLcodecs.Save(image,“ DESTINATION PATH”,RasterImageFormat.Htm,0);
免責聲明:我是該產品的僱員
pdf2htmlEX可以準確地將PDF轉換為HTML並保留格式。但是,生成的HTML代碼很難以編程方式讀取和解析。它是免費的開放源代碼,並且可以在各種平台上離線工作。
某些PDF到HTML轉換器是我能夠找到的唯一免費的離線PDF到HTML轉換器。希望這對您有用!
“免費PDF至HTML轉換器”軟件(您可以在這裡找到: http://www.free-pdf-to-word.org/tutorials/freepdftohtmlconverter01_how_to_convert_pdf_to_html.html)很好。我已經使用它將多個PDF轉換為HTML文件,到目前為止,我對輸出非常滿意。它可以很好地維護PDF的佈局,您可以選擇是否要將PDF中的圖像存儲在單獨的文件夾中。
P.S。下載鏈接位於右側的“必需資源”。
您是否在Linux中嘗試過 pdf2html
?免費版和免費版都可以離線運行,許多發行版已經打包了很長時間了。
Calibre是Windows / Mac / Linux的免費開源程序,能夠將PDF文件快速轉換為HTMLZ存檔。 HTMLZ存檔包含一個index.html文件,其中是轉換後的.html文件。它也包含用於格式化的style.css文件,有時可能包含其中包含圖像的images文件夾。
當我嘗試使用Calibre將PDF圖書轉換為.html時,我感到非常驚訝它。它保留了文本格式,並且在保留行尾方面沒有任何錯誤。當我在一本格式不佳的雜誌或文本文檔上嘗試Calibre時,除非將PDF文件轉換為純文本然後在字處理器中手動編輯並另存為.html文件,否則結果是不可接受的。這樣可以得到完美的結果,但是非常耗時。 Calibre不能很好地轉換每個PDF文件,但是大多數時候它都能很好地完成工作,因此值得一試。
我知道您說的是獨立的-但是如果您可以使用節點-這是我發現的最好的節點模塊:
https://github.com/peterdemartini/html5-to- pdf
為了使事情變得更簡單-這是我創建的一個節點/ webpack項目,用於使用HTML創建我的CV