用spacy获取单词在句子中的位置

时间:2017-09-05 07:48:36

标签: spacy

我知道从文档中获取各种属性的基本spacy工作流程,但是我无法找到内置函数来返回单词的位置(开始/结束)一句话。

有人知道Spacy可以做到这一点吗?

1 个答案:

答案 0 :(得分:16)

这些可用作句子中标记的属性。 Doc说:

  

idx int父文档中令牌的字符偏移量。

     

i int父文档中令牌的索引。

>>> import spacy
>>> nlp = spacy.load('en')
>>> parsed_sentence = nlp(u'This is my sentence')
>>> [(token.text,token.i) for token in parsed_sentence]
[(u'This', 0), (u'is', 1), (u'my', 2), (u'sentence', 3)]
>>> [(token.text,token.idx) for token in parsed_sentence]
[(u'This', 0), (u'is', 5), (u'my', 8), (u'sentence', 11)]