COVQ

COVQ

COVQ(Channel-OptimizedVectorQuantization),即信道最優矢量量化器。信道最優矢量量化是近年來圖像、語音信號編碼技術中頗為流行的一種新型量化編碼方法。

COVQCOVQ
COVQ(Channel-OptimizedVectorQuantization),即信道最優矢量量化器。

信道最優矢量量化是近年來圖像、語音信號編碼技術中頗為流行的一種新型量化編碼方法。矢量量化編碼方法一般是有失真編碼方法。1.矢量量化:對於PCM數據,一個數一個數地進行量化叫標量量化。若對這些數據分組,每組K個數構成一個K維矢量,然後以矢量為單元,逐個矢量進行量化,稱矢量量化。2.矢量量化的編碼解碼:輸入量是一個待編碼的K維矢量,即先將輸入圖像分割成m個方塊,每個塊的尺寸為n2,然後把每一個方塊以列(行)堆疊成K(K=n2)維矢量,作為編碼輸入矢量。碼本C是一個具有N個K維矢量的集合,C={yi},i=1,2,…,N。碼本C實際上是一個長度為N的表,這個表的每一個分量是一個K維矢量,稱其為碼字。在接收端有一個與傳送端完全相同的碼本C。

矢量量化編碼過程就是從碼本C中搜尋一個與輸入矢量最接近的碼字的過程。在碼本中尋找到與輸入矢量完全一致的碼字的機率很小,但只要二者之間誤差最小時,便可用該碼字yi代表輸入矢量。傳輸時並不傳送碼字yi本身,只傳送其下標"i"。當碼本長度為N,為傳送下標所需要的比特數為log2N。傳送一個象素所需要的平均比特數為.

一種矢量量化器包括:一參考代碼本,用於儲存在一特徵矢量空間中的若干典型矢量,使能使用相應的標號對它們進行檢索;一學習矢量儲存裝置,用於儲存若干用於學習的矢量;一目標函式計算裝置,用於計算被定義為所說典型矢量和所說用於學習的矢量的函式的目標函式;一運動矢量計算裝置,用於計算運動矢量;以及一匹配裝置,用於將所說運動矢量與所說典型矢量相加取得新的典型矢量,其中:通過將該輸入矢量轉換成標號或從屬矢量對輸入矢量進行編碼,該從屬矢量的分量,為用於所說新典型矢量的標號的所說輸入矢量的從屬值;以及所說運動矢量計算裝置計算與所說用於學習的矢量相關的目標函式的所說新典型矢量的最大值。

矢量相加激勵的線性預測編碼(VSELP)語音編碼器提供了改進的質量,減少了通常語音編碼器的複雜性。VSELP使用代碼簿,它有一預先定義的結構使得代碼簿搜尋過程所要求的計算大為減少。這個VSELP語音編碼器運用基於定點陣技術(FLAT)的反射係數的單一或多段矢量量化器。此外,這個語音編碼器使用預量化器來減小搜尋的複雜性,使用高分辨標量量化器來減小所需要的存貯總量。以減少計算量和存貯要求。

通常情況下,認為WynerZiv編碼器由一個量化器和一個SlepianWolf組成。量化器將信號空間分為單元,不相連的子單元影射到相同的量化索引Q,它由固定碼率的局部最優Lloyd算法、WynerZiv矢量量化器設計。量化器的設計用於理想SlepianWolf編碼器編碼量化的索引,碼率估算依賴於量化索引和邊信息,使SlepianWolf編碼器的塊長與量化器維數分離。這是實際系統的基本要求。對於高碼率,在特定的情況下,最優量化是格子量化,分離的量化單元不需要影射到同一個索引。在編碼端不具有邊信息的情況下,它是漸進無性能損失的。

在WynerZiv編碼器的設計實現上,Zamir等人給出的嵌套線性/格形碼可以達到WynerZiv界。嵌套格形碼的實現由Servetto中給出。Xiong等人[17]通過嵌入量化器加SlepianWolf構成WynerZiv編碼器,後來又使用TCQ(trelliscodedquantization)構成WynerZiv編碼器,兩種方法都能逼近理論界。此外,可以使用Lloyd算法設計量化器加上SlepianWolf編碼器實現WynerZiv編碼。

聯合解碼和運動補償:為了獲得更高的壓縮效率,可以在解碼端進行運動補償。傳統的運動補償編碼可以在這裡採用。例如,CRC可以用於解碼端的運動補償,Viterbi解碼對一系列運動補償預測塊進行操作,每一個具有不同的運動矢量,每個解碼版本的CRC和傳送的CRC進行比較選用。

另外一種方法由Stanford完成,即傳送一個魯棒的hash碼字來輔助解碼端估計運動。目前,本文的hash簡單地由量化的DCT係數的小子集組成,在低延遲系統使用前一幀產生邊信息。因為hash比原數據小,所以允許將上幀的hash存儲到記憶體。對於當前幀的每個塊,計算對應的魯棒hash的相鄰幀距離。如果超過一定距離,則傳送hash數據和WynerZiv位。在hash的基礎上,解碼端執行一個運動搜尋來產生最優的邊信息塊,量化係數的hash碼能修正Turbo解碼的相應機率,因此進一步減少了校驗位的碼率。Hash也能在重建時用於精簡。這非常近似於通用的SlepianWolf編碼的相關信道。

碼率控制:WynerZiv的碼率控制由當前幀和邊信息的統計相關特性來決定。編碼算法本身並不需要改變,碼率隨信道的統計特性而變化。每個幀需要多少碼率的傳輸是靈活的,因為邊信息是在解碼端獲取而不是在編碼端獲取。碼率控制解決的方法之一:完全依賴於解碼端的反饋信息;解碼端將決定最優編碼速率並反饋給編碼端。解碼端使用相關信道估計算法將預測碼率傳輸給編碼端。在解碼端進行碼率控制,明顯降低了編碼端的負擔;反饋允許解碼器在產生邊信息方面具有很大的靈活性;從簡單的拷貝幀的機制到非常複雜的運動補償;基於對象的分割或多幀預測;一個精確的邊信息,需要很少的碼率。因此整個系統性能的改善只與解碼器有關係。這與傳統的視頻編碼方式是有區別的。

這種方法有兩個比較明顯的缺點:首先需要一個反饋信道,這會造成延遲;統計特性估計和解碼過程都是線上執行。因此這種算法不適宜於低複雜度的設備套用。另外一個碼率控制方式是使用一些在編碼端的估計,如PRISM。編碼端存儲前一幀,基於幀差的能量;每個塊分為不同的編碼模式,具有不同的碼率,幀差過小,則不編碼;在這兩種模式中間是不同的伴隨陣和不同的碼率,取決於估計的統計相關。運動估計在解碼端沒有,可以降低解碼複雜度;邊信息的精度不影響碼率,但是會影響重建的信號質量。

編碼器對幀進行操作,每幀包括240個樣點,採用速率為8000Hz。在進一步的處理(高通濾波器去直流分量)後把每幀分成4個子幀,每個子幀包括60個樣點,其它的各種操作包括LPC濾波器以及LSP濾波器非量化係數的計算等,將會導致30ms的分組時延。對每個子幀,用未經處理的輸入信號計算LPC濾波器。最後一個子幀的濾波器係數用來預測分裂矢量量化器(PSVQ,PredictivesplitVectorquantizer)進行量化。正如前面所介紹的,前視占有7.5ms,所以整個編碼時延為37.5ms。這個時延在評介編碼器,尤其是通過數據網路傳輸語音時是個很重要的因素,因為如果編碼及解碼時延比較小的話,就意味著處理網際網路中的時延及其抖動時具有更大的自由度。

相關搜尋

熱門詞條

聯絡我們