将TfidfVectorizer(SciPy稀疏矩阵)放入2D列表

时间:2020-07-27 21:04:26

标签: python pandas machine-learning scikit-learn data-science

我目前正试图将TfIdfVectorizer的输出输出到2D列表中,以用于其他sklearn。

    tfidf_vectorizer = TfidfVectorizer(use_idf=True)
    fitted_vectorizer = tfidf_vectorizer.fit(documents)
    tfidf_vectors = fitted_vectorizer.transform(documents)

文档是一维字符串列表(长度:101),每个字符串都包含我希望获得每个单词的TF-IDF矢量的句子。上面代码的输出如下所示。

  (0, 8408) 0.020644758912370765
  (0, 8260) 0.005503036918539544
  (0, 8226) 0.010322379456185382
  (0, 7980) 0.010322379456185382
  : :
  (100, 238)    0.018086253619277102
  (100, 219)    0.018086253619277102
  (100, 199)    0.013696461782315357
  (100, 146)    0.01693674489239031

还有更多的输出行。我只想获取数字的第二列,并将其放入2D数组中,而左列中没有索引。有什么建议吗?

0 个答案:

没有答案
相关问题