使用JAVA中的Apache POI和iText从Word(DOC)创建PDF
我试图从* .doc文档生成PDF文档.
直到现在,由于stackoverflow,我已成功生成它但有一些问题. 我的下面的示例代码生成的pdf没有格式和图像,只有文本. 这是代码: in = new FileInputStream(sourceFile.getAbsolutePath()); out = new FileOutputStream(outputFile); WordExtractor wd = new WordExtractor(in); String text = wd.getText(); Document pdf= new Document(PageSize.A4); PdfWriter.getInstance(pdf,out); pdf.open(); pdf.add(new Paragraph(text)); 解决方法
docx4j包含
code,用于使用iText从docx创建PDF.它还可以使用POI将doc转换为docx.
曾经有一段时间我们平等地支持这两种方法(以及通过XHTML的PDF),但我们决定专注于XSL-FO. 如果它是一个选项,你最好使用docx4j通过XSL-FO和FOP将docx转换为PDF. 像这样使用它: wordMLPackage = WordprocessingMLPackage.load(new java.io.File(inputfilepath)); // Set up font mapper Mapper fontMapper = new IdentityPlusMapper(); wordMLPackage.setFontMapper(fontMapper); // Example of mapping missing font Algerian to installed font Comic Sans MS PhysicalFont font = PhysicalFonts.getPhysicalFonts().get("Comic Sans MS"); fontMapper.getFontMappings().put("Algerian",font); org.docx4j.convert.out.pdf.PdfConversion c = new org.docx4j.convert.out.pdf.viaXSLFO.Conversion(wordMLPackage); // = new org.docx4j.convert.out.pdf.viaIText.Conversion(wordMLPackage); OutputStream os = new java.io.FileOutputStream(inputfilepath + ".pdf"); c.output(os); 2016年7月更新 从docx4j 3.3.0开始,Plutext的商业PDF渲染器是docx4j的docx到PDF转换的默认选项.您可以在converter-eval.plutext.com尝试在线演示 如果要使用现有的docx到XSL-FO到PDF(或Apache FOP支持的其他目标)方法,那么只需将docx4j-export-FO jar添加到类路径中. 无论哪种方式,要将docx转换为PDF,您都可以使用Docx4J facade的toPDF方法. 通过iText代码的旧docx到PDF可以在https://github.com/plutext/docx4j-export-FO/…/docx4j-extras/PdfViaIText/找到 (编辑:李大同) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
- java-如何使用toString方法轻松整齐地打印多个对
- Java对日期Date类进行加减运算、年份加减月份加减
- java – Intellij IDEA完全不会识别测试文件夹中
- java – 为什么jsoup删除内联样式表?
- java实现无符号数转换、字符串补齐、md5、uuid、
- 使用java的Calendar对象获得当前日期
- Java&RabbitMQ – 排队和多线程 – 或Couchb
- javax.inject.Singleton和javax.ejb.Singleton之
- Java实现文件压缩与解压的示例[zip格式,gzip格式
- 运行java -jar时的java.lang.ClassNotFoundExcep