是否可以通过编程方式从视频中提取文本?

时间:2017-07-15 07:00:48

标签: java ocr

我知道我们可以使用ocr从图像中提取文本。但我需要提取视频中的文字,就像视频讲座中那样。或者换句话说,是否可以将视频转录为文本。那可能吗?如果是这样,请建议我如何用java或任何其他语言来做。

3 个答案:

答案 0 :(得分:2)

我天真的Linux驱动方法是:

  • 检查:OCR是否在我的操作系统中工作?
  • 使用普通跑步者从视频中提取一些样本。每个跑步者(例如VLC)都具有这样的功能。
  • 检查:OCR从图像文件中提取文本有多好?
  • 检查:OCR从视频提供背景的图像文件中提取文本有多好?
  • 获取软件以批量提取视频中的帧 - >有各种软件允许创建联系表,这也应该能够在视频的时间点提取全分辨率的图像。可能需要完整的解决方案才能使OCR正常工作。如果您知道,也许您可​​以先剪切图像,然后将文本定位在固定的矩形中。
  • 最糟糕的情况是,让OCR分析电影的每一帧。

这主要取决于你的OCR工作的好坏和速度。对我来说,其他一切都是经过验证的软件。该语言可能是bash-shell-script,因为组件可能是单独的linux程序。正如我所提到的,它取决于OCR的质量,性能和运行时环境。

答案 1 :(得分:1)

  

这主要取决于你的OCR工作的好坏和速度。

同意。作为起点,Google Cloud vision OCR或OCRspace online OCR在“背景文字”情况下工作得非常好。我自己用它来提取字幕。

要测试OCR质量是否足以满足您的使用需求,您可以使用Copyfish Chrome/Firefox插件(来自ocr.space)。

答案 2 :(得分:0)

是的,您可以做到这一点,有3种方法可以实现它。

  1. 自行拆分,分类和训练。
    获取性能服务器, A.从视频中提取图像 B.开发和训练您的机器学习模型。您可以使用张量流执行相同的操作。 注意:如果您希望自己训练模型,请确保您有足够的时间,因为有时开发和训练需要几个月的时间,并且您应该掌握训练数据。

  2. Use an OCR framework

  3. USE API(免费增值模型)。市场上有很多。只是谷歌他们,你将有很多在手。

相关问题