pandas - 来自带有pandas

我在CSV文件中有一个数据集，并使用pandas通过data = pd.read_csv(filename)阅读。然后加载文字和得分列。

我不确定将文本/分数作为kera神经网络模型的x_train / y_train提供的合适方法。我这样做：

max_fatures = 2000
tokenizer = Tokenizer(num_words=max_fatures, split=' ')
tokenizer.fit_on_texts(data['Text'].values)
X = tokenizer.texts_to_sequences(data['Text'].values)
X = pad_sequences(X)
model.fit(x_train, y_train, epochs = nb_epochs, batch_size = nb_batch_size, validation_data=(x_val, y_val))

但我在X = pad_sequences(X)中收到内存错误。

我应该如何喂养模型？

来自带有pandas

0 个答案: