Solr - Tika - 解析内容以启用突出显示

时间:2012-10-09 16:13:46

标签: solr highlighting apache-tika

我的理解是通过Solr索引PDF,Word,Excel等文档将允许搜索但不能突出显示。我有这段代码来执行索引:

        String urlString = "http://localhost:8983/solr"; 
        SolrServer solr = new HttpSolrServer(urlString);
        ContentStreamUpdateRequest up = new ContentStreamUpdateRequest("/update/extract");

        for (MultipartFile file : files) {
            if (file.getOriginalFilename().equals("")) {
                continue;
            }
            File destFile = new File(destPath, file.getOriginalFilename());
            file.transferTo(destFile);
            up.addFile(destFile);

            up.setParam("literal.id", destFile.getAbsolutePath());
            up.setAction(AbstractUpdateRequest.ACTION.COMMIT, true, true);

            try {
                solr.request(up);

            } catch (SolrServerException sse) {
                sse.printStackTrace();
            }

        }

    }
    } catch (IOException ioe) {
      ioe.printStackTrace();   
    }

我已经读过为了启用突出显示,我需要“存储/解析内容?”如何才能做到这一点?谢谢你的帮助。

1 个答案:

答案 0 :(得分:2)

您需要修改Solr实例的Schema文件,并为stored="true"字段设置content。我假设您正在使用ExtractingRequestHandler的默认字段设置,希望针对该字段返回突出显示结果。

请参考Field Options By Use Case获取矩阵,并注明必须启用哪些字段选项才能突出显示以及其他功能才能正常工作。

相关问题