回归与分类的准确一般描述

时间:2018-08-22 11:19:53

标签: machine-learning classification regression infinite

所以我有以下问题:在写硕士论文时,我意识到我仍然不确定/对某些机器学习原理的描述不明确。

例如,我隐约记得在某个时候我听到了以下描述:

  

分类任务的输出(标签)为离散有限,而回归任务的输出(标签)为连续和可以是 infinite

在这个描述中,我不确定的一个词是无限

例如,如果您假设(无论出于何种原因),您都拥有几乎像正弦波(带有一些噪声)那样分布的2D数据点,并且可以使用polyfit在其上拟合k度多项式(请参见图2)。 here,这里k = 8)。现在您有了一些特定范围内的数据,例如,此处x方向上的可用点范围是[0,12],用于拟合多项式。

但是,由于您具有多项式的一般形状,因此您无法快速获得值x = 1M(或任意大的数字)的y结果吗?那不是无限标签的意思吗?

也许我只是错误地想起了我几年前学到的东西;)。

最好的问候

1 个答案:

答案 0 :(得分:2)

首先,这个问题更适合于StackExchange的理论上更倾斜的站点,例如Stats Stackexchange Math StackexchangeData Science Stackexchangeconveniently also provide answers to your question
但不完全是。无论如何,您的问题似乎在于 input output 之间的区别。任务的类型(即分类或回归)仅基于模型的输出,而与输入无关。

您可能会有大量的“连续输入变量”(甚至是带有不同变量的混合变量),并且如果它的输出值数量不同,仍可以将其称为分类任务。

此外, infinite 仅指这些值不受限制的事实,即您不能轻松地将回归任务限制在特定范围内。如果您突然输入的值完全超出训练值范围(如您的示例),则可能会获得“无限” y值,因为您的网络只会在此特定范围内训练;多项式拟合也会发生一个问题,如以下示例所示: enter image description here

红线可能是您网络的学习功能,因此,如果您突然超出已知值,则可能会获得一些极高的价值(除非您训练得很好)。
与此相反,分类网络仍将预测任何给定的类别。我想像一个Voronoi diagram:即使您的观点与先前的观点任意偏离,它仍然属于某个类别。

相关问题