如何逐行索引文件文件在solr中

时间:2013-01-27 07:28:25

标签: solr indexing

我有一个包含推文的大型阿拉伯语文本文件,每行包含一条推文, 我想在solr中索引,这样本文档的每一行都应该在一个单独的solr文档中编入索引

到目前为止我尝试了什么:

  • 我知道如何在solr中使用SQL数据库记录
  • 我知道如何改变solr 架构以适应数据并使用数据导入处理程序
  • 我知道查询如何用于索引solr中的数据

我想要的是:

知道如何索引solr中的文本文件,以便将每一行视为solr文档

1 个答案:

答案 0 :(得分:1)

我认为您应该查看DataImportHandler功能的LineEntityProcessor。这将在下面的链接中详细解释。

LineEntityProcessor 此EntityProcessor逐行读取数据源中的所有内容,并为每行读取返回一个名为rawLine的字段。内容未以任何方式解析;但是,您可以添加变换器来处理rawLine字段中的数据,或者创建其他附加字段。

http://lucidworks.lucidimagination.com/display/solr/Uploading+Structured+Data+Store+Data+with+the+Data+Import+Handler

希望信息有所帮助。祝你好运!

相关问题