使用预定义标签标记文档

时间:2013-02-28 16:39:15

标签: indexing

我正在处理大量文档,并且有一组预定义的类别/标签(可能是短语),这些类别/标签将以精确或不精确的形式出现在文档的文本中。 我想将每个文档分配给最接近其文本的标记中的一个标记。

请告诉我如何解决这个问题。

1 个答案:

答案 0 :(得分:-1)

您可以查看在索引时标记文档的lucene搜索引擎。 Northernlight搜索引擎用于执行您在搜索方法中提到的类似任务。您可以查看其实现以获得一个想法。