有问题适合随机森林分类器

时间:2015-11-11 04:36:58

标签: python scikit-learn

我正在使用IPython的UI和相应的库(Anaconda,pandas,numpy)

我已经声明了一个pandas对象df,我已经改变它,所以第一列是我想要预测的所需值,但我的代码仍然继续在第10行停止。第11行不运行。相反,终端IPython窗口退出并显示此错误:

~/anaconda/bin/python.app: line 3: 45581 Killed: 9               ~/anaconda/python.app/Contents/MacOS/python "$@"

代码开始

In [1]: import pandas as pd

In [2]: import numpy as np

In [3]: df = pd.read_csv('train.csv', header=0)

In [4]: cols = list(df)

In [5]: cols.insert(0, cols.pop(cols.index('Cover_Type'))) %Cover type is column I wanted to bring to column position 1 or value I'm predicting

In [6]: cols

In [7]: df = df.ix[:, cols]

In [8]: df

In [9]: forest = RandomForestClassifier(n_estimators = 100)

In [10]: forest = forest.fit(train_data[0::,1::],train_data[0::,0])

In [11]: output = forest.predict(test_data)

In [12]: train_data = df.values

In [13]: train_data

1 个答案:

答案 0 :(得分:1)

您正在使用第10行中没有的列车数据。您稍后再分配。

首先分配火车数据,然后在forest.fit中使用它