如何将文件导入到mallet以进行主题建模

时间:2013-09-08 21:42:16

标签: mallet

我想使用mallet进行主题建模,我有一个问题。我的数据在每行一个文件的文件中。但我没有考虑任何标签或实例名称。所以每行都以文本开头。是否需要有那些标签或实例名称?

1 个答案:

答案 0 :(得分:0)

我不确定你到底想要什么。 对我来说,在Windows中,我将所有数据放在" D:\ Data \ test1"等文件夹中," test1"文件夹,有一些.txt文件,每个文件都是一个实例。 然后我使用bin\mallet import-dir --input D:\Data\test1 --output test1.mallet --keep-sequence --remove-stopwords --extra-stopwords extra.txt生成模型。

我希望这可以提供帮助。顺便说一句,您可以使用Word或Excel宏生成单独的.txt文件。