以下是我的数据集中的3列,任何人都可以指导我应用以下任何模型。 所以我可能希望根据国家和品种栏预测区域。 我对此非常陌生,如果有人可以建议我或指导我应用模型
,我将不胜感激 col1(country) col2(variety) col3(region)
Argentina Chasselas r1
Israel Gamay r2
Mexico Grenache r3
Chile Kalecik Karasi r4
China Kallmet r5
我正在尝试一种名为DecisionTreeClassifier的东西,但如果有人给我其他想法,我会很高兴
答案 0 :(得分:0)
可以说,我认为多重逻辑回归是可能的工具,因为你为此处理了一个名义因变量。
基本上,(简单)线性回归是一种预测连续值的算法;逻辑回归被认为是二元分类器算法,它输出属于标签(0或1)的输入的“概率”。
如果您有一个名义变量,请使用多重逻辑回归 和两个或多个测量变量,你想知道如何 测量变量影响名义变量。你可以用它来 预测从属名义变量的概率,或者如果你是 小心,你可以用它来提出哪些独立的建议 变量对因变量有重大影响。参考Handbook of Biological Statistics。