machine-learning - 构建用于对象检测的神经网络最重要的步骤是什么？（不分类）

一般来说，你所谓的＆＃39;检测＆＃39;通常通过回归任务来解决（因此，回归的神经网络＆＃39;）。例如，您想要识别图片上的鼻尖（而不是其他任何东西）。您标记了训练图像，以便：

X（输入） - 只是大小的图像，比如256x256像素，灰度 Y（输出） - 一对数字，显示此图像上鼻尖位置的X，Y坐标。

然后你构建了一个DNN来解决这个问题的回归任务。对于该NN，应用与分类相同的原理。你可以随意使用max-pooling图层，卷积图层，ReLU。您只需要记住，您的输出层应该能够输出所需范围内的数字。

使用人工神经网络解决此任务的好教程是here

P.S。您想要检测对象所在的 region （如将其包含在图像中的彩色框中）？没问题，一个解决方案是解决回归任务的次数，找到对象的左上角，右上角，左下角，右下角。或者如果你愿意，可以使用推拉窗。