Apache Tika:仅解析元数据而不提取内容

时间:2012-02-08 10:43:34

标签: java metadata apache-tika

我正在使用Apache Tika从文档中提取元数据。我最感兴趣的是建立一个基本的都柏林核心,如作者,标题,日期等。我根本不对文档的内容感兴趣。目前我只是在做通常的事情:

 FileInputStream fis = new FileInputStream( uploadedFileLocation );
 // Tika parsing
 Metadata metadata = new Metadata();
 ContentHandler handler = new BodyContentHandler();
 AutoDetectParser parser = new AutoDetectParser();
 parser.parse(fis, handler, metadata);

有没有办法告诉Tika 解析内容?我希望这会加快速度并节省内存。

0 个答案:

没有答案