从文本中提取个人属性

时间:2017-10-25 11:59:09

标签: python nlp nltk named-entity-extraction

我想从一个人写的文字中提取个人属性。如,

  

我一直对职业自行车感兴趣。作为一个单身母亲,找到足够的时间专业地进行体育运动从来都不容易。我能做的最好的事情就是去墨尔本美丽的海滩短途旅行......

理想情况下,我想提取类似骑行:兴趣,女性:性别,体育:兴趣,墨尔本:位置。我认为这被称为命名实体提取,但我不确定。我试过Stanford Named Entity Recognizer并没有给我我想要的东西。最重要的是个人属性,如性别,年龄,兴趣等,并且在不同的样本中错过了大部分内容。

是否有任何工具/库(最好是Python)可以帮助我这样做?我知道NLTK,但我不知道如何在这里使用它。

1 个答案:

答案 0 :(得分:0)

通常,Stanford Named Entity Tagger有一些默认分类器,它只有'Name','Location','Organizations'这样的常规标记。如果您需要其他标记,则必须训练自己的分类器。您可以参考this for create new classifier。我已经创建了自定义模型并且工作正常。

相关问题