原创 阅读 [EPUB]第一次完整整理一本电子书 只找到pdf扫描版本,进行整理1.pdf扫描工具现在OCR识别已经有长足进展,直接将pdf转为图片,图片批量上传上去识别,2.整理格式为markdown我下载了导出结果txt,其他内容使用回车即可,其他的需要调整的内容基本都是标点,这个最后面处理3.整理为xhtml当从txt整理好,就可以开始依照pdf内容,开始进行格式的转换,主标题使用标签,直接采用标签即可。因为我们使用标准的标题标签。 2023-02-19 浏览(3,986) 评论(1) 阅读全文
原创 Java 【Java】PDFBox 一个开源的PDF支持库 故而有了这次的改造之旅示例···java/** 合并pdf @return*/privatestaticintmergePDF(Stringpath)throwsIOException{PDFMergerUtilitypdfMerger=newPDFMergerUtility();Filef=newFile(path);File[]pdffiles=f.listFiles(); 2022-09-30 浏览(1,256) 评论(0) 阅读全文