霍夫曼編碼:霍夫曼編碼，是可變字長編碼(VLC)的一種。是由Huffma -百科知識中文網

哈夫曼編碼

它是一種編碼方式，哈夫曼編碼是可變字長編碼(VLC)的一種。 Huffman於1952年提出一種編碼方法，該方法完全依據字元出現機率來構造異字頭的平均長度最短的碼字，有時稱之為最佳編碼，一般就叫作Huffman編碼。以哈夫曼樹─即最優二叉樹，帶權路徑長度最小的二叉樹，經常套用於數據壓縮。在計算機信息處理中，“哈夫曼編碼”是一種一致性編碼法（又稱"熵編碼法"），用於數據的無損耗壓縮。這一術語是指使用一張特殊的編碼表將源字元（例如某檔案中的一個符號）進行編碼。這張編碼表的特殊之處在於，它是根據每一個源字元出現的估算機率而建立起來的（出現機率高的字元使用較短的編碼，反之出現機率低的則使用較長的編碼，這便使編碼之後的字元串的平均期望長度降低，從而達到無損壓縮數據的目的）。這種方法是由David.A.Huffman發展起來的。例如，在英文中，e的出現機率很高，而z的出現機率則最低。當利用哈夫曼編碼對一篇英文進行壓縮時，e極有可能用一個位(bit)來表示，而z則可能花去25個位（不是26）。用普通的表示方法時，每個英文字母均占用一個位元組（byte），即8個位。二者相比，e使用了一般編碼的1/8的長度，z則使用了3倍多。倘若我們能實現對於英文中各個字母出現機率的較準確的估算，就可以大幅度提高無損壓縮的比例。

背景

哈夫曼壓縮是個無損的壓縮算法，一般用來壓縮文本和程式檔案。哈夫曼壓縮屬於可變代碼長度算法一族。意思是個體符號（例如，文本檔案中的字元）用一個特定長度的位序列替代。因此，在檔案中出現頻率高的符號，使用短的位序列，而那些很少出現的符號，則用較長的位序列。

霍夫曼編碼

基本信息

哈夫曼編碼

背景

相關搜尋

熱門詞條