machine-learning - 回归与分类的准确一般描述

所以我有以下问题：在写硕士论文时，我意识到我仍然不确定/对某些机器学习原理的描述不明确。

例如，我隐约记得在某个时候我听到了以下描述：

分类任务的输出（标签）为离散和有限，而回归任务的输出（标签）为连续和可以是 infinite

在这个描述中，我不确定的一个词是无限。

例如，如果您假设（无论出于何种原因），您都拥有几乎像正弦波（带有一些噪声）那样分布的2D数据点，并且可以使用polyfit在其上拟合k度多项式（请参见图2）。 here，这里k = 8）。现在您有了一些特定范围内的数据，例如，此处x方向上的可用点范围是[0,12]，用于拟合多项式。

但是，由于您具有多项式的一般形状，因此您无法快速获得值x = 1M（或任意大的数字）的y结果吗？那不是无限标签的意思吗？

也许我只是错误地想起了我几年前学到的东西；）。

最好的问候

首先，这个问题更适合于StackExchange的理论上更倾斜的站点，例如Stats Stackexchange Math Stackexchange或Data Science Stackexchange，conveniently also provide answers to your question。
但不完全是。无论如何，您的问题似乎在于 input 和 output 之间的区别。任务的类型（即分类或回归）仅基于模型的输出，而与输入无关。

您可能会有大量的“连续输入变量”（甚至是带有不同变量的混合变量），并且如果它的输出值数量不同，仍可以将其称为分类任务。

此外， infinite 仅指这些值不受限制的事实，即您不能轻松地将回归任务限制在特定范围内。如果您突然输入的值完全超出训练值范围（如您的示例），则可能会获得“无限” y值，因为您的网络只会在此特定范围内训练；多项式拟合也会发生一个问题，如以下示例所示：

红线可能是您网络的学习功能，因此，如果您突然超出已知值，则可能会获得一些极高的价值（除非您训练得很好）。
与此相反，分类网络仍将预测任何给定的类别。我想像一个Voronoi diagram：即使您的观点与先前的观点任意偏离，它仍然属于某个类别。