我目前正试图将TfIdfVectorizer的输出输出到2D列表中,以用于其他sklearn。
tfidf_vectorizer = TfidfVectorizer(use_idf=True)
fitted_vectorizer = tfidf_vectorizer.fit(documents)
tfidf_vectors = fitted_vectorizer.transform(documents)
文档是一维字符串列表(长度:101),每个字符串都包含我希望获得每个单词的TF-IDF矢量的句子。上面代码的输出如下所示。
(0, 8408) 0.020644758912370765
(0, 8260) 0.005503036918539544
(0, 8226) 0.010322379456185382
(0, 7980) 0.010322379456185382
: :
(100, 238) 0.018086253619277102
(100, 219) 0.018086253619277102
(100, 199) 0.013696461782315357
(100, 146) 0.01693674489239031
还有更多的输出行。我只想获取数字的第二列,并将其放入2D数组中,而左列中没有索引。有什么建议吗?