这是过度拟合吗

时间:2019-03-01 20:15:05

标签: data-science

我正在运行一种机器学习算法来回答对/错问题。 假设我使用分类算法。 运行1200个数据后,我获得了30%的准确性。

但是后来,我提出了第二种算法,总是否定第一种算法的答案 因此它的准确度是70%

这是否适合第二种算法?假设我的第一个算法一致地预测了30%的准确性

1 个答案:

答案 0 :(得分:0)

对您的问题。 我觉得这个答案取决于您选择的机器学习模型和训练集。大多数ML模型最初都会犯错误。在您的情况下,如果算法2的训练集为70%,可能意味着它擅长预测错误的事情?如果我正确理解这一点?尽管这在数据开头否定ML答案可能是正确的,但这不是一个好主意。更好的主意是正确准备数据并在最适合您模型的数据集上进行训练。

大多数机器学习模型都会犯错误,这注定会发生。但是培训集和所有这些数据可以帮助您选择正确的模型。数据准备是正确设置培训的关键。我知道我到处弹跳。对此我深表歉意

例如,我们可能有一个逻辑回归模型,我们想确定有一定条件的人与没有条件的人。我们要做的第一件事是正确准备我们的数据,然后对其进行训练(这是简短版本),但我的观点是训练模型非常重要,它允许您的ML模型能够预测其准确性。

我应该说我真的很喜欢机器学习/深度学习,但我绝不是专家。我强烈推荐这门课,尽管这是我开始了解基础知识的方式。

Coursera Andrew Ng course