使用java将.pdf doc或.png图像内容插入到.docx文件中

时间:2015-01-17 12:21:19

标签: java pdf png apache-poi docx

如何使用java将pdf或png内容插入docx文件?

我已尝试以下列方式使用Apache POI API,但它无效(它会生成一些垃圾doc文件):

XWPFDocument doc = new XWPFDocument();  
String pdf = "D://capture1.pdf"; 
PdfReader reader = new PdfReader(pdf); 
PdfReaderContentParser parser = new PdfReaderContentParser(reader); 
for (int i = 1; i <= reader.getNumberOfPages(); i++) { 
  TextExtractionStrategy strategy = parser.processContent(i,new SimpleTextExtractionStrategy());    
  String text = strategy.getResultantText();        
  XWPFParagraph p = doc.createParagraph();  
  XWPFRun run = p.createRun();     
  run.setText(text);        
  run.addBreak(BreakType.PAGE);   
} 
FileOutputStream out1 = new FileOutputStream("D://javadomain1.docx");    
doc.write(out1);   
out1.close();   
reader.close();   
System.out.println("Document converted successfully"); 

1 个答案:

答案 0 :(得分:2)

你应该可以用POI来做,你当然可以使用docx4j来做。

Here's sample code用于使用docx4j插入图像。

请注意,要&#34;插入PDF&#34;,您需要OLE嵌入它。这比较困难,因为您需要将PDF转换为合适的二进制OLE对象。在docx4j中,执行此操作的帮助程序代码是商业企业版的一部分。