java - 是否可以通过编程方式从视频中提取文本？

时间：2017-07-15 07:00:48

标签： java ocr

我知道我们可以使用ocr从图像中提取文本。但我需要提取视频中的文字，就像视频讲座中那样。或者换句话说，是否可以将视频转录为文本。那可能吗？如果是这样，请建议我如何用java或任何其他语言来做。

答案 0 :(得分：2)

我天真的Linux驱动方法是：

检查：OCR是否在我的操作系统中工作？
使用普通跑步者从视频中提取一些样本。每个跑步者（例如VLC）都具有这样的功能。
检查：OCR从图像文件中提取文本有多好？
检查：OCR从视频提供背景的图像文件中提取文本有多好？
获取软件以批量提取视频中的帧 - ＆gt;有各种软件允许创建联系表，这也应该能够在视频的时间点提取全分辨率的图像。可能需要完整的解决方案才能使OCR正常工作。如果您知道，也许您可以先剪切图像，然后将文本定位在固定的矩形中。
最糟糕的情况是，让OCR分析电影的每一帧。

这主要取决于你的OCR工作的好坏和速度。对我来说，其他一切都是经过验证的软件。该语言可能是bash-shell-script，因为组件可能是单独的linux程序。正如我所提到的，它取决于OCR的质量，性能和运行时环境。

答案 1 :(得分：1)

这主要取决于你的OCR工作的好坏和速度。

同意。作为起点，Google Cloud vision OCR或OCRspace online OCR在“背景文字”情况下工作得非常好。我自己用它来提取字幕。

要测试OCR质量是否足以满足您的使用需求，您可以使用Copyfish Chrome/Firefox插件（来自ocr.space）。

答案 2 :(得分：0)

是的，您可以做到这一点，有3种方法可以实现它。

自行拆分，分类和训练。
获取性能服务器， A.从视频中提取图像 B.开发和训练您的机器学习模型。您可以使用张量流执行相同的操作。注意：如果您希望自己训练模型，请确保您有足够的时间，因为有时开发和训练需要几个月的时间，并且您应该掌握训练数据。
Use an OCR framework
USE API（免费增值模型）。市场上有很多。只是谷歌他们，你将有很多在手。