在Solr 4中 - 如何在索引中包含文件名?

时间:2014-06-26 20:36:45

标签: solr lucene schema xsd solr-schema

我正在使用Solr 4.8.1构建搜索引擎 - 这样做,我试图在我的GUI搜索结果中显示每个索引文档的文件名。

我可以成功显示Solr的Schema.xml文件中的任何字段(标题,作者,id,资源名last_modified等)。但是,我无法在schema.xml中找到包含文件名称的字段(例如,文件Test.pdf名称为“Test”,或者Example.docx中的字段为“Example”)

我能找到的最近的字段是“resourcename”,它显示了我系统中的整个文件路径(例如C:\ Users \ myusername \ Documents \ solr-4.8.1 \ example \ exampledocs \ filename.docx)想显示的是filename.docx)

(1)如何告诉solr索引文件名? 要么 (2)是否有一个字段覆盖我刚丢失的文件名?

真诚的感谢!

---研究更新--- 似乎这个问题要求同样的事情 - Solr return file name - 但是,我不相信简单地添加一个名为“filename”的字段会导致Solr索引文件名!我知道我需要在Schema.xml文件中添加一个字段 - 现在我该如何将该字段指向文件名?

1 个答案:

答案 0 :(得分:0)

这不是关于solr功能的问题,而是关于您用来发布到solr的工具。向solr添加名为fileName的新字段将解决部分问题,修改发布工具以向每个字段添加testPDF.pdf值。我想我会注意Tikahttp://tika.apache.org/,看看你如何提及pdfdoc个文件。