本文僅從工程和實(shí)施角度幫助用戶理解視頻壓縮技術(shù),不涉及過(guò)深的算法原理和代碼實(shí)現(xiàn)。本文由裕瀚科技研發(fā)部原創(chuàng),轉(zhuǎn)載請(qǐng)注明出處。
1. 視頻壓縮概述
視頻是由連續(xù)的圖像幀序列組成,圖像的連續(xù)播放呈現(xiàn)出連續(xù)的動(dòng)態(tài)影像即為視頻。所謂視頻壓縮即視頻編碼技術(shù),是指通過(guò)壓縮技術(shù)將原始的視頻格式轉(zhuǎn)化為另一種數(shù)字視頻格式,其目的在于減少文件空間占用。比如攝像頭經(jīng)過(guò)采集后直接生成的原始視頻,不考慮壓縮的話,其視頻數(shù)據(jù)量非常龐大,在網(wǎng)絡(luò)傳輸和數(shù)據(jù)存儲(chǔ)的過(guò)程中,帶寬資源和存儲(chǔ)設(shè)備無(wú)法支撐如此巨大的數(shù)據(jù)量,所以在進(jìn)行傳輸或者存儲(chǔ)前,需要將原始視頻數(shù)據(jù)進(jìn)行視頻壓縮處理。

2. 視頻編解碼器
視頻編解碼器是指一個(gè)能夠針對(duì)數(shù)字視頻文件或者視頻流進(jìn)行壓縮和解壓縮的程序或者設(shè)備。由于編解碼實(shí)現(xiàn)路徑和方式的不同,視頻編解碼器也分為硬件編解碼器和軟件編解碼器。目前主流的視頻編解碼器分為5個(gè)系列:H.26X系列(H.264/HEVC/VVC)、AVS系列(AVS1/AVS2/AVS3)、SVAC系列(SVAC1.0/SVAC2.0)、VP8/VP9系列以及最新的AV1。其中AVS系列和SVAC系列均是我國(guó)具有獨(dú)立知識(shí)產(chǎn)權(quán)的視頻編解碼標(biāo)準(zhǔn)。評(píng)價(jià)編解碼器優(yōu)劣的主要評(píng)價(jià)標(biāo)準(zhǔn)在于:壓縮比的高低、編解碼速度的快慢、編解碼功耗以及解碼兼容性。

3. 視頻壓縮的本質(zhì)
視頻可以被壓縮是因?yàn)榍昂髱瑘D像數(shù)據(jù)中存在大量的信息冗余,主要可以從以下四類進(jìn)行探討:
空間冗余: 同一圖像幀內(nèi),相近像素之間的差別很小,具有較高的相似度;
時(shí)間冗余:視頻中相鄰的前后圖像幀之間,其中發(fā)生變化的像素占整張圖像像素的比例極其微小,存儲(chǔ)運(yùn)動(dòng)關(guān)系,該特點(diǎn)在監(jiān)控場(chǎng)景中尤為常見(jiàn);
編碼冗余:不同像素的出現(xiàn)概率不同,出現(xiàn)概率高的像素分配較少的字節(jié),概率低的分配較多的字節(jié);
視覺(jué)冗余: 人眼視覺(jué)系統(tǒng)對(duì)不同像素顏色敏感度不同,編碼時(shí)可以丟棄這些冗余的信息,而幾乎不影響人眼視覺(jué)效果。
4. 視頻畫(huà)質(zhì)評(píng)價(jià)
談到視頻壓縮,就免不了要談到壓縮后的視頻畫(huà)質(zhì)。在監(jiān)控領(lǐng)域常見(jiàn)問(wèn)題就是壓縮后視頻畫(huà)質(zhì)和原始視頻是否有區(qū)別,能否作為證據(jù)進(jìn)行溯源,是否會(huì)影響AI智能分析精度等;在互聯(lián)網(wǎng)領(lǐng)域大家就更關(guān)注壓縮后視頻畫(huà)質(zhì)是否會(huì)出現(xiàn)馬賽克等而影響用戶對(duì)視頻美觀程度和流暢度評(píng)價(jià)。
視頻編碼畫(huà)質(zhì)評(píng)價(jià)標(biāo)準(zhǔn)主要可以分為主觀評(píng)價(jià)和客觀評(píng)價(jià),其中主觀評(píng)價(jià)標(biāo)準(zhǔn)是通過(guò)人眼直觀觀察進(jìn)行評(píng)分,是最為接近的用戶對(duì)視頻畫(huà)質(zhì)的整體反饋。但由于主觀評(píng)價(jià)的完成需要耗費(fèi)大量人力和時(shí)間,并且受人為的影響因素較大,這里暫時(shí)不深入進(jìn)行討論。
本文將從客觀評(píng)價(jià)標(biāo)準(zhǔn)簡(jiǎn)要闡述下視頻編碼畫(huà)質(zhì)的評(píng)價(jià)標(biāo)準(zhǔn),主要介紹目前主流的全參考視頻質(zhì)量評(píng)價(jià)模型的兩種視頻評(píng)價(jià)標(biāo)準(zhǔn):PSNR(峰值信噪比)、MS-SSIM(結(jié)構(gòu)相似度)。
PSNR:目前最主流的畫(huà)質(zhì)評(píng)價(jià)方法,被公安部相關(guān)機(jī)構(gòu)和互聯(lián)網(wǎng)企業(yè)引用最多的評(píng)價(jià)方式;PSNR取值20~40之間,數(shù)值越大,畫(huà)質(zhì)越好。
MS-SSIM:通過(guò)感知結(jié)構(gòu)信息來(lái)評(píng)價(jià)畫(huà)質(zhì),其結(jié)果更為接近肉眼感知效果;MS-SSIM取值0~1之間,數(shù)值越大,畫(huà)質(zhì)越好。
