如何在文本分类中使用多个功能的文本?

时间:2016-10-21 08:53:49

标签: machine-learning text-classification

所以,我将推文标记为转发或未转发,我必须使用逻辑回归来构建模型,以预测推文是否会被转发。

我面临的问题是我不知道如何使用多个特征与逻辑回归。我必须使用的功能是tf-idf,lda,是否转发了推文,过去转发过某个用户的推文的次数。

如何在二进制分类中使用4个功能?任何帮助将不胜感激。

1 个答案:

答案 0 :(得分:1)

这是使用clasiffier默认参数的一个例子,想法是如果你有两个,或者如果你有更多的功能,则使用相同的程序:

dataset = np.ndarray(shape=(num_rows,3),dtype=np.float32) ;
retweeted_output = np.ndarray(shape=(num_rows,1),dtype=np.float32)
#perform some actions to fill your data structures
model = LogisticRegression(); 
model.fit(dataset,retweeted_output);
相关问题