我可以应用哪种模型,在应用模型之间混淆

时间:2017-11-20 20:19:50

标签: python machine-learning prediction

以下是我的数据集中的3列,任何人都可以指导我应用以下任何模型。 所以我可能希望根据国家和品种栏预测区域。 我对此非常陌生,如果有人可以建议我或指导我应用模型

,我将不胜感激
 col1(country)   col2(variety)             col3(region)
 Argentina       Chasselas                   r1 
 Israel          Gamay                       r2
 Mexico          Grenache                    r3
 Chile           Kalecik Karasi              r4
 China           Kallmet                     r5

我正在尝试一种名为DecisionTreeClassifier的东西,但如果有人给我其他想法,我会很高兴

1 个答案:

答案 0 :(得分:0)

可以说,我认为多重逻辑回归是可能的工具,因为你为此处理了一个名义因变量。

基本上,(简单)线性回归是一种预测连续值的算法;逻辑回归被认为是二元分类器算法,它输出属于标签(0或1)的输入的“概率”。

  

如果您有一个名义变量,请使用多重逻辑回归   和两个或多个测量变量,你想知道如何   测量变量影响名义变量。你可以用它来   预测从属名义变量的概率,或者如果你是   小心,你可以用它来提出哪些独立的建议   变量对因变量有重大影响。参考Handbook of Biological Statistics