如何将.doc文件读入byte []数组?

时间:2012-03-21 13:41:41

标签: java

如何从.doc或word文件中获取byte[]值?

我尝试使用输入流并将其转换为byte[],但是当我将其写回.doc文件时,它会损坏。

有没有更好的方法?

2 个答案:

答案 0 :(得分:1)

File file = new File("filename");//filename should be with complete path
      FileInputStream fis = new FileInputStream(file);
      byte[] b = new byte[ (int) file.length()];
      fis.read(b);

答案 1 :(得分:0)

以下是ReadDoc / docx.java的代码:这将读取dox / docx文件并将其内容打印到控制台。你可以按自己的方式自定义。要运行这个程序,你需要apache的poi jar ......

这个程序可以给你一串字符串......

import java.io.*;
import org.apache.poi.hwpf.HWPFDocument;
import org.apache.poi.hwpf.extractor.WordExtractor;

public class ReadDocFile {
public static void main(String[] args) {
File file = null;
WordExtractor extractor = null ;
try {

   file = new File("c:\\New.doc");
   FileInputStream fis=new FileInputStream(file.getAbsolutePath());
   HWPFDocument document=new HWPFDocument(fis);
   extractor = new WordExtractor(document);
   String [] fileData = extractor.getParagraphText();
   for(int i=0;i<fileData.length;i++){
     if(fileData[i] != null)
       System.out.println(fileData[i]);
   }
}
catch(Exception exep){}
  }
}