音视频处理的知识补充
像素
像素就是分辨率的长宽相乘
如1920*1080就是200万像素(2083600)
音视频处理中,不需要关注像素多少
多少像素是清晰的取决于dpi
DPI
DPI是每英寸的像素多少
实际DPI取决于显示设备和视频分辨率音视频处理中,不需要关注DPI
只需要根据实际场景选用足够的分辨率
色彩空间模型:
色彩空间模型是记录像素点色彩数据的方式有RGB、YUV420、YUV422、YUV444、HSV、CMYK
网络视频一般采用YUV420的色彩空间模型虽然颜色有所失真,但是数据量少文件小。
帧率
帧率是一秒的视频帧数(FPS)
网络视频的帧率一般是25FPS、30FPS
过高的帧率在感官上不会有所提升,反而会因为播放端性能问题而出现一些问题
码率
一秒的数据量大小,单位Mbps码率的限制实质上是限制数据量大小
直播等流媒体一般设置最大码率以限制视频大小
防止正常情况下,客户端带宽不足而卡顿
编码器会根据最大码率对视频进行有损压缩
I帧 P帧 B帧
I帧:能独立播放、是完整的视频帧(数据量大)
P帧:需要根据前一个I帧或P帧才能计算出最终图像
B帧:需要根据前一个和后一个I帧或P帧才能计算出最终图像(数据量小)
I帧、P帧、B帧是H264、H265等编码格式的压缩手段,其他编码格式不一定存在这样的概念
直播一般不开B帧,因为它需要后一个帧来做压缩,不适合直播这种场景
GOP
GOP (Group of Pictures) :一组完整的视频帧,开头必为I帧
如GOP设置为25,则每25帧的第一帧必为I帧
除了第一帧,其他帧也可能存在I帧
GOP一般是对直播流等流媒体设置的,为了缓解网络因素造成的花屏
直播一般GOP设置帧率的1-2倍