如何在机器学习中将String数据类型转换为整数?

时间:2019-08-14 20:05:58

标签: python machine-learning label encoder

我一直在尝试使用机器学习来预测一些数据,但是它表明我无法将str转换为int错误,我什至尝试了标签编码器,但仍然无法成功运行该程序。

我尝试过标签编码

import pandas as pd 
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import LabelEncoder



gender_data = pd.read_csv('gender.csv')

le = LabelEncoder()


X = gender_data.drop(columns=['Gender'])
y = gender_data['Gender']
Xv = X.values
yv = y.values

le_encoder_X = le.fit(Xv)
le_encoded_X = le.transform(Xv)


le_encoder_y = le.fit(yv)
le_encoded_y = le.transform(yv)

X_train, X_test, y_train, y_test = train_test_split(le_encoded_X, le_encoded_y, test_size=0.2)



model = DecisionTreeClassifier()
model.fit(X_train, y_train)

ValueError跟踪(最近一次通话最近)  在()中      17 yv = y.values      18岁 ---> 19 le_encoder_X = le.fit(Xv)      20 le_encoded_X = le.fit(Xv)      21

F:\ Anaconda \ lib \ site-packages \ sklearn \ preprocessing \ label.py in fit(self,y)      93 self:返回self的一个实例。      94“”“ ---> 95 y = column_or_1d(y,warn = True)      96 self.classes_ = np.unique(y)      97返回自我

column_or_1d中的F:\ Anaconda \ lib \ site-packages \ sklearn \ utils \ validation.py(y,警告)     612返回np.ravel(y)     613 -> 614提高ValueError(“错误的输入形状{0}”。format(shape))     615     616

ValueError:输入形状错误(66,4)

0 个答案:

没有答案