视频格式入门?

时间:2013-11-28 00:51:50

标签: video computer-vision video-processing

我是一名从事计算机视觉研究和工作的初级工程师。越来越多我发现我陷入困境或陷入项目困境,因为我对视频格式缺乏足够的低级知识。我在谈论编解码器,容器,压缩,颜色格式,传输协议等。缩略语和术语,如PAL,NTCS,DVB-T,YUV,YCbCr,H.264,MPEG,隔行扫描,逐行扫描等等。例如,我很想通过浏览一个视频帧来达到this之类的答案。

在我看来,这是一个难以闯入的知识领域。对于计算机图形,有OpenGL Super Bible,对于AI,有Russel and Norvig; 是否有一些权威的,介绍性的书或知识来源,这个行业的人可以推荐?理想情况下包括编程示例(例如如何手动实现H.264解码例程?)。在未来五年阅读官方规范时,我不确定如何扩展我在这方面的知识。

2 个答案:

答案 0 :(得分:1)

不是我知道的。我花了很多时间阅读官方规格(此时超过5年)。具有讽刺意味的是,我一直在考虑写这个坟墓。我只是不确定市场潜力。

我可以指出一些我最喜欢的资源:

首先是ITU-T的出版物。这些是官方标准。 http://www.itu.int/en/ITU-T/publications/Pages/default.aspx

我似乎经常参考这本书video demystified。对于基本的编解码器介绍,我喜欢An Introduction to Video Compression in C/C++。我认为videos at xiph.org非常棒。

答案 1 :(得分:1)

几年前,我写了这个名为Multimedia Technology Basics的基本介绍。至少,这应该可以帮助您进行YUV / YCbCr格式识别。

您想要学习的内容取决于您想要(或需要)完成的内容。你需要编写编码器或解码器吗?实现一个H.264解码器并不是一个微不足道的,甚至是一个中间的多媒体任务 - 我怀疑你想尝试这样做,除非你真的好奇解码算法背后的低级细节(我绝对是 - - 看我的手柄)。一种更加温和的编程多媒体压缩方案的方法是解决JPEG解码器问题。这是我写的一篇博文:Learn Multimedia Programming By Writing A JPEG Decoder

有很多文学和视频可以直接进入多媒体的核心数学重点细节,但我不鼓励这种方法(因为它往往会吓跑很多人)。所以要小心。不要害怕在这里发布关于更精致的视频和多媒体主题的更具体的问题。