c++ - 非英语语言识别

时间：2015-03-31 06:31:46

标签： c++ opencv image-processing machine-learning neural-network

我已经在印地语中实现了一个文本检测算法，它运行得非常好，并且已经对文本区域进行了本地化。现在我正在寻找将文本区域转换为Google翻译API可以使用的数字格式。有关如何将其转换为数字格式的任何帮助？（我已经研究过SVM，ANN等）

答案 0 :(得分：0)

我会调查OCR。

Tesseract OCR引擎（开源）具有包括印地语在内的多种语言的语言数据，因此这可能是一个很好的起点。它也可以集成到OpenCV中。

如果您只想使用OpenCV，那么其中一种机器学习方法（KNN，SVM）可能是最好的，您需要自己训练以识别角色。

很少有链接：