行业新闻

视频压缩标准简史:从1929到2020 (2021-07-23)


多年以来,人们设计出许多不同的算法来压缩视频。视频压缩虽然听起来是一个很现代的词,但其实它从模拟视频开始,已经有很长的历史了。在本篇文章中,我会向大家一一介绍视频压缩史上的里程碑事件,正是这些事件的发生才有了今天的视频压缩。从过去到现在,各类视频压缩方法由最初的概念最终演化成现今的标准。很多压缩标准今天还在使用,人们也一直在继续开发和完善新的标准。

 

1929:首次出现帧间压缩

 

帧间压缩是指仅保留一张关键图像,以及后面帧与此图像之间的差异,这张关键图像被称为关键帧(Keyframe)。令人惊讶的是,关于帧间压缩的讨论可以追溯到1929年。英国的R.D. Kell提出将帧间压缩用于模拟视频,这一概念随后便延续下来并应用在今天的数字视频上。

 

1952:差分脉冲编码调制

 

下一个视频压缩的里程碑事件发生在1952年。贝尔实验室的B.M. Oliver 和 C.W. Harrison提出可以在视频编码中使用差分脉冲编码调制(DPCM)。在此之前,DPCM一直被用于音频(今天依然如此)。DPCM技术是指你可以从图像中采样,并据此推测未来的样本值。因为可以通过推测准确地重建图像,所以不需要存储太多图像数据。

 

1959:使用时间压缩的帧间预测编码

 

1959年,使用时间压缩的预测性帧间视频编码第一次被提出。时间压缩是指在一段视频中选择一组间隔的关键帧,只对这些关键帧的变化进行编码。作为其他帧的参考点,关键帧是唯一被记录下来的帧。这一概念由日本广播公司(NHK)的研究人员Y. Taki、M. Hatori和S. Tanaka提出。

 

1967:行程长度编码


行程长度编码(Run-length encoding,RLE)是指将连续出现的同一个数据值存储为单一值和出现次数,如输入数据流“AAABBCCCC”,输出的是连续数据值的计数序列“3A2B4C”。之后你可以利用这些信息准确地重建同一张图像!伦敦大学的研究人员A.H. Robinson C. Cherry提出这一概念,最初用于降低模拟电视信号的传输带宽。今天,行程长度编码仍在数字视频中使用。

 

20世纪70年代:早期数字视频算法


数字视频在70年代出现。发送视频时使用了和电信相同的技术——PCM(脉冲编码调制)。是不是有些眼熟?PCM就来自上文提到的DPCM。PCM以数字形式表示采样的模拟信号。它最初是音频标准,在70 年代被用来压缩数字视频。虽然可以传输视频,但它需要大码率且传输效率较低。

 

1972:数字视频的首次压缩

 

Nasir Ahmed,印裔美国电气工程师、计算机科学家


1972年左右,堪萨斯州立大学的Nasir Ahmed提出使用DCT编码压缩图像。DCT代表离散余弦变换(Discrete Cosine Transform),它将图像分成由不同频率组成的小块。在量化过程中,舍弃高频分量,剩下的低频分量被保存下来并用于后面的图像重建。由于舍弃了某些频率的图像,所以最终呈现出来的图像不会完全相同,但大多时候,这种差异不会被人们察觉。


1973:DCT技术成为一种图像压缩算法

 

DCT

 

Nasir Ahmed 与德克萨斯大学的 T. Natarajan  K.R. Rao 合作,实现了DCT图像压缩算法。1974年,他们发表了自己的工作成果。

 

1974:混合编码的发展过程

 

1974年,南加州大学的Ali Habibi将预测编码和DCT编码组合在一起使用。我们在上文提到过,预测编码是指猜测当前图像出现前后的数值。Habibi的算法只能应用于帧内图像,无法预测帧间图像。

 

1975:混合编码的进一步发展


John A. Roesse 和Guner S. Robinson进一步发展了Habibi的算法,使它可以应用于帧间,为此,他们尝试了各种方法,最终发现Ahmed的DCT技术和预测编码结合起来使用是最高效的。

 

1977:更快的DCT算法


陈文雄 C.H. Smith S.C. Fralick一起优化了DCT算法,他们创立了Compression Labs公司,将DCT商业化。

 

1979~1981:运动补偿DCT视频压缩

 

Anil K. Jain 和Jaswant R. Jain 继续发展运动补偿DCT视频压缩技术。陈文雄使用他们的成果创造出一种结合了所有研究的视频压缩算法。运动补偿DCT上的持续研究工作使它最终成为了标准的压缩技术,从20世纪80年代一直使用到现在。


1984:首个数字视频压缩标准——H.120

 

前期的所有研究最终取得成果——第一个视频压缩标准H.120问世。该标准对于单个图像非常有用,但在维持帧间图像质量方面效果不佳,于1988年被修订。H.120是首个国际视频压缩标准,主要用于视频会议。这是一次伟大的成就,但由于H.120多方面的低效,许多公司不得不试验各种方法来完善这个标准。

 

1988:用H.261举行视频会议


 H.261很可能是你见过或者使用过的一系列编解码器中的第一个。它是第一个有效使用帧内和帧间压缩技术的数字视频压缩标准。H.261 也是第一个在商业上成功的数字视频编码标准。它被用于全世界的视频会议,并引入混合的基于块的视频编码,该编码今天仍在许多视频标准(MPEG-1 第 2 部分、H.262/MPEG-2 第 2 部分、H.263 MPEG-4 第 2 部分、H.264/MPEG-4 第 10 部分和 HEVC)中使用。创建H.261标准的方法今天依然被广泛使用。它支持的最大分辨率是352x288。

 

虽然这个标准在国际上很受欢迎,但它在刚发布时并不完整。该标准分别在 1990 年和 1993 年进行了修订。H.261不包括处理编码的细节,仅用于解码视频。

 

1992:使用Motion JPEG(MJPEG)的PC多媒体应用


1992年,Motion JPEG被创建出来用于计算机上的多媒体应用。这种视频压缩技术将视频每一帧都分别压缩成JPEG图像。

 

1993:使用MPEG-1的视频CD

 

<p line="LbpO" style="margin-top: 0pt; margin-bo