machine-learning - 使用机器学习对图像文档进行分类

时间：2019-03-08 18:13:38

标签： machine-learning deep-learning

我想使用机器学习对图像文档（例如护照，驾驶执照等）进行分类。没有人有任何链接或文档，我可以从中获得执行此任务的想法。

我想做的是先将文档转换为文本格式，然后再从文本文件中提取信息。但是我一次只能处理一个文件。我想知道如何在数百万个文档中执行此操作。

答案 0 :(得分：1)

您不需要将文档转换为文本，可以直接使用图像来实现。

要进行图像分类，您可以使用Keras库构建基本的CNN。

这个基本的CNN足以让您训练图像分类器。但是，您想获得最先进的精度，我建议您获得预训练的resnet50并对其进行训练以构建图像分类器。除了准确性外，使用预先训练的网络还有另一个主要优点，那就是需要更少的数据来训练鲁棒的图像分类器。

您唯一需要更改的是将输出类的数量从1000更改为所需的类数。