RNN / LSTM可以用于非标准文本OCR吗?

时间:2018-12-17 13:41:02

标签: ocr lstm rnn ctc

我已经阅读了有关LSTM和RNN,甚至CTC的文章。据我了解,RNN用于计算序列中丢失的令牌(例如,句子中的单词)。但是,我的问题是读取用草书写的人的名字。许多名字并不流行,并且在语言模型中找不到,所以如果RNN仅预测缺少的单词,因为我没有可能的人名的完整数据集,它不会成功,对吧?

1)我可以使用RNN识别非标准单词吗? (例如稀有/不受欢迎的人名)

2)如果否,是否还有其他替代项。 ?还是我必须使用OCR的传统方法(尝试对字符进行细分然后分类)?

1 个答案:

答案 0 :(得分:1)

基于CNN + RNN + CTC构建的神经网络在字符级上运行。 他们学会预测字符串,并且不在乎单词或底层语言。 您当然可以将字典和/或语言模型集成到CTC解码器中,但不必这样做。 这样,这样的网络仅通过查看字符就可以读取任意人的名字。 有关使用这种神经网络模型进行文本识别的高级介绍,请参见https://towardsdatascience.com/2326a3487cd5

仅需注意一点: RNN 用于沿序列传播信息,例如找出一个模棱两可的角色可能取决于周围的环境。