U8.COM·(中国区)有限公司官网-视频编码可以说是一代又一代工程师智慧的结晶,但复杂算法背后的目的都是去除冗余,除了帧内预测去除了空间冗余、帧间预测去除的时间冗余,还有一种视觉冗余,如何去掉这部分呢?就要用到变换和量化。
先来说说什么是视觉冗余,根据对人类视觉系统(HVS)的研究,人眼对图像中的高频信息是不敏感的,因此去除一些高频信息的图像看起来和原始图像差别不大,而这些高频信息就是视觉冗余。
想要去掉视觉冗余,首先就要分离图片中高频和低频部分,这个过程就要用到变换。变换可以利用算法将人眼看得到的像素信息转换为人眼看不到的频域信息,并且使大部分能量集中到低频区域。
变换的方法不止一种,比如最常用的,也是H.264标准中所使用的DCT离散余弦变换、JPEG2000标准中使用的DWT离散小波变换、H.265标准使用的DST离散正弦变换等。
以DCT为例,图片经过DCT变换之后,低频信息集中在左上角,而高频信息则分散在其它的位置,那么用什么样的标准来判断哪些信息应该被去掉呢?这就要用到量化。
量化就是做除法的过程,用变换后的系数除以量化参数,四舍五入取整就得到了量化后的数值,通常高频信息的值比较小,量化后更容易变成0。
这其中量化参数是一个重要的参考值,值越小,量化越精细,图像质量越高,但压缩之后的码流也会更大。
变换和量化结束后,就需要扫描获取这些数值,通过熵编码对数据进行最终的压缩,这里我们是用之字形(Zigzag)扫描,得到一串数字,重排后的数字会进行编码,压缩后形成最终的码流。
总结一下,通过变换将低频和高频信息分离开来,再对变换后的系数进行量化,将高频信息量化为0,再对数值进行重新排序,最后用熵编码把图像压缩成比较小的数据,再配合之前提到过的帧内或帧间预测去除空间和时间冗余,以此达到视频压缩的目的。这就是视频编码的基本原理。
很多人会问,了解这些有什么用呢?如今视频已经成为我们生活中重要的组成部分,尤其随着AI的发展,大多数新功能、新应用都和图像息息相关,也都有编码技术的存在,希望通过我们的视频,可以让你更了解身边这些图像和视频背后的工作流程,提升日常的视频体验,也能更好地面向未来的技术发展
Copyright © 2002-2024 U8国际电子监控有限公司 版权所有 Powered by EyouCms TEL: 025-83700868
地址:南京市鼓楼区三步两桥145号 邮箱:chuiniubi@126.com