在elasticsearch中映射openNLP或StanfordNLP

时间:2015-10-22 15:14:18

标签: elasticsearch opennlp

我正在尝试映射openNLP以启用文档中的字段解析。使用以下代码:

"article":
"properties":
"content" : { "type" : "opennlp" }

在创建映射之前,我从sourceforge.net下载了命名实体提取二进制文件,并使用elasticsearch插件文件夹中的cURL安装/解压缩。

当我尝试运行上面的映射代码时,收到以下错误消息。

  

“error”:“MapperParsingException [没有类型[opennlp]的处理程序   在字段[内容]]上声明“”状态“:400

1 个答案:

答案 0 :(得分:0)

快速搜索谷歌后,我发现了这个:https://github.com/spinscale/elasticsearch-opennlp-plugin

我假设您正在尝试安装它。但是 - 它已经过时,甚至可能都不受最近的Elasticsearch版本的支持。

它的目的似乎是从文件中提取数据并将它们作为标记索引。 Elasticsearch Mapper Attachments Type插件就是这么做的。我鼓励你使用它而不是OnenNLP。从文档中快速摘录:

  

映射器附件插件会将附件类型添加到   Elasticsearch使用Apache Tika。附件类型允许索引   不同的“附件”类型字段(编码为base64),例如,   microsoft office格式,打开文档格式,ePub,HTML等   (可以找到完整列表here)。

如何使用地图字段的示例:

PUT /test/person/_mapping
{
  "person" : {
    "properties" : {
      "my_attachment" : {
        "type" : "attachment"
      }
    }
  }
}
相关问题