我想使用机器学习对图像文档(例如护照,驾驶执照等)进行分类。 没有人有任何链接或文档,我可以从中获得执行此任务的想法。
我想做的是先将文档转换为文本格式,然后再从文本文件中提取信息。但是我一次只能处理一个文件。 我想知道如何在数百万个文档中执行此操作。
答案 0 :(得分:1)
您不需要将文档转换为文本,可以直接使用图像来实现。
要进行图像分类,您可以使用Keras库构建基本的CNN。
https://towardsdatascience.com/building-a-convolutional-neural-network-cnn-in-keras-329fbbadc5f5
这个基本的CNN足以让您训练图像分类器。但是,您想获得最先进的精度,我建议您获得预训练的resnet50并对其进行训练以构建图像分类器。除了准确性外,使用预先训练的网络还有另一个主要优点,那就是需要更少的数据来训练鲁棒的图像分类器。
您唯一需要更改的是将输出类的数量从1000更改为所需的类数。