将单词分段成其子单词/子概念

时间:2019-03-07 13:01:33

标签: python nlp text-mining spacy

查找和替换串联词的常用方法有哪些:

brokenleg -> (broken,leg)

该方法应该在数千行上运行,而无需事先知道那里是否存在串联词。

我大多数情况下都使用SpaCy库处理字符串,因此最好的方法是与SpaCy一起很好地工作。

0 个答案:

没有答案