在Pandas DataFrame中测试和训练数据

时间:2014-01-30 20:47:50

标签: python pandas sample-data

我的DF分为测试和培训尺寸:

testSampleSize = 2573.0 
trainingSampleSize = 7719.0

我使用:

计算测试样本的行数
rows = random.sample(df.index, int(testSampleSize)) 

其中df是我的数据框。

为了获得我使用的测试数据:

df_test = bothDF.ix[rows]

但是这个df_test的长度为2604,而不是testSampleSize。

现在我从训练数据的初始DF中删除这些行:

df_training = bothDF.drop(rows)

此df_training的长度为7698。

为什么长度与创建的样本量不同?

0 个答案:

没有答案