使用NLP从非结构化文本中提取特定于域的数据

时间:2014-07-05 11:56:10

标签: java nlp data-mining pos-tagger information-extraction

我正在寻找一种从Java中的非结构化文本中自动提取特定于域的知识的方法。我们将拥有一个手动注释的训练集,其中包含以下内容:

文字:该公寓包含2间卧室和一间浴室。 结构化的 - 类型:公寓 - 卧室:2 - 浴室:1

知道什么是培养能够完成这项工作的模型的最佳方法?可能是我们使用自定义标签扩展的POS标签?

谢谢!

0 个答案:

没有答案