使用机器学习对图像文档进行分类

时间:2019-03-08 18:13:38

标签: machine-learning deep-learning

我想使用机器学习对图像文档(例如护照,驾驶执照等)进行分类。 没有人有任何链接或文档,我可以从中获得执行此任务的想法。

我想做的是先将文档转换为文本格式,然后再从文本文件中提取信息。但是我一次只能处理一个文件。 我想知道如何在数百万个文档中执行此操作。

1 个答案:

答案 0 :(得分:1)

您不需要将文档转换为文本,可以直接使用图像来实现。

要进行图像分类,您可以使用Keras库构建基本的CNN。

https://towardsdatascience.com/building-a-convolutional-neural-network-cnn-in-keras-329fbbadc5f5

这个基本的CNN足以让您训练图像分类器。但是,您想获得最先进的精度,我建议您获得预训练的resnet50并对其进行训练以构建图像分类器。除了准确性外,使用预先训练的网络还有另一个主要优点,那就是需要更少的数据来训练鲁棒的图像分类器。

https://engmrk.com/kerasapplication-pre-trained-model/?utm_campaign=News&utm_medium=Community&utm_source=DataCamp.com

您唯一需要更改的是将输出类的数量从1000更改为所需的类数。