如何将文件列表转换为TF-IDF矢量?

时间:2012-01-20 08:48:55

标签: dataset tf-idf

我想从存储在许多文件夹中的文档列表中构建文档x Word 矩阵。矩阵中的特定条目 x 表示 word_j document_i 中出现 x 次。要考虑的单词列表在Vocabulary.txt文件中给出 是否有任何已经存在的包逐个扫描文档,删除停用词并构造文档向量?

0 个答案:

没有答案