MPEG-4標準

MPEG-4標準

運動圖像專家組MPEG 於1999年2月正式公布了MPEG-4(ISO/IEC14496)標準第一版本。同年年底MPEG-4第二版亦告底定,且於2000年年初正式成為國際標準。 MPEG-4與MPEG-1和MPEG-2有很大的不同。MPEG-4不只是具體壓縮算法,它是針對數位電視、互動式繪圖套用(影音合成內容)、互動式多媒體(WWW、資料擷取與分散)等整合及壓縮技術的需求而制定的國際標準。 MPEG-4標準將眾多多媒體套用集成於一個完整框架內,旨在為多媒體通信及套用環境提供標準算法及工具,從而建立起一種能被多媒體傳輸、存儲、檢索等套用領域普遍採用的統一數據格式。

簡介

MPEG-4的編碼理念是:MPEG-4標準同以前標準的最顯著的差別在於它是採用基於對象的編碼理念,即在編碼時將一幅景物分成若干在時間和空間上相互聯繫的視頻音頻對象,分別編碼後,再經過復用傳輸到接收端,然後再對不同的對象分別解碼,從而組合成所需要的視頻和音頻。這樣既方便我們對不同的對象採用不同的編碼方法和表示方法,又有利於不同數據類型間的融合,並且這樣也可以方便的實現對於各種對象的操作及編輯。例如,我們可以將一個卡通人物放在真實的場景中,或者將真人置於一個虛擬的演播室里,還可以在網際網路上方便的實現互動,根據自己的需要有選擇的組合各種視頻音頻以及圖形文本對象。

MPEG-4包含了MPEG-1及MPEG-2的絕大部分功能及其他格式的長處,並加入及擴充對虛擬現實模型語言(VRML,Virtual Reality Modeling Language)的支持,面向對象的合成檔案(包括音效,視頻及VRML對象),以及數字著作權管理(DRM)及其他互動功能。而MPEG-4比MPEG-2更先進的其中一個特點,就是不再使用宏區塊做視頻分析,而是以視頻上個體為變化記錄,因此儘管視頻變化速度很快、碼率不足時,也不會出現方塊畫面。

由於MPEG-4是一個公開的平台,各公司、機構均可以根據MPEG-4標準開發不同的制式,因此市場上出現了很多基於MPEG-4技術的視頻格式,例如WMV 9、Quick Time、DivX、Xvid等。MPEG-4大部分功能都留待開發者決定採用是否。這意味著整個格式的功能不一定被某個程式所完全函括。因此,這個格式有所謂配置(profile)及級別(level),定義了MPEG-4套用於不同平台時的功能集合。

MPEG-4系統的一般框架是:對自然或合成的視聽內容的表示;對視聽內容數據流的管理,如多點、同步、緩衝管理等;對靈活性的支持和對系統不同部分的配置 。

優點

與MPEG-1、MPEG-2相比,MPEG-4具有如下獨特的優點:

基於內容的互動性

MPEG-4提供了基於內容的多媒體數據訪問工具,如索引、超級連結、上下載、刪除等。利用這些工具,用戶可以方便地從多媒體資料庫中有選擇地獲取自己所需的與對象有關的內容,並提供了內容的操作和位流編輯功能,可套用於互動式家庭購物,淡入淡出的數位化效果等。MPEG-4提供了高效的自然或合成的多媒體數據編碼方法。它可以把自然場景或對象組合起來成為合成的多媒體數據。

高效的壓縮性

MPEG-4基於更高的編碼效率。同已有的或即將形成的其它標準相比,在相同的比特率下,它基於更高的視覺聽覺質量,這就使得在低頻寬的信道上傳送視頻、音頻成為可能。同時MPEG-4還能對同時發生的數據流進行編碼。一個場景的多視角或多聲道數據流可以高效、同步地合成為最終數據流。這可用於虛擬三維遊戲、三維電影、飛行仿真練習等

通用的訪問性

MPEG-4提供了易出錯環境的魯棒性,來保證其在許多無線和有線網路以及存儲介質中的套用,此外,MPEG-4還支持基於內容的的可分級性,即把內容、質量、複雜性分成許多小塊來滿足不同用戶的不同需求,支持具有不同頻寬,不同存儲容量的傳輸信道和接收端 。

部分

MPEG-4由一系列的子標準組成,被稱為部(part)(有時也譯為卷),包括以下的部分:

第一部分(ISO/IEC 14496-1):系統:描述視頻和音頻數據流的控制、同步以及混合方式(即混流Multiplexing,簡寫為MUX)。

第二部分(ISO/IEC 14496-2):視頻:定義一個對各種視覺信息(包括自然視頻、靜止紋理、計算機合成圖形等等)的編解碼器。(例如XviD編碼就屬於MPEG-4 Part 2)

第三部分(ISO/IEC 14496-3):音頻:定義一個對各種音頻信號進行編碼的編解碼器的集合。包括高級音頻編碼(Advanced Audio Coding,縮寫為AAC)的若干變形和其他一些音頻/語音編碼工具。

第四部分(ISO/IEC 14496-4):一致性:定義對本標準其他的部分進行一致性測試的程式。

第五部分(ISO/IEC 14496-5):參考軟體:提供用於演示功能和說明本標準其他部分功能的軟體。

第六部分(ISO/IEC 14496-6):多媒體傳輸集成框架(DMIFfor Delivery Multimedia Integration Framework)

第七部分(ISO/IEC 14496-7):最佳化的參考軟體:提供對實現進行最佳化的例子(這裡的實現指的是第五部分)。

第八部分(ISO/IEC 14496-8):在IP網路上傳輸:定義在IP網路上傳輸MPEG-4內容的方式。

第九部分(ISO/IEC 14496-9):參考硬體:提供用於演示怎樣在硬體上實現本標準其他部分功能的硬體設計方案。

第十部分(ISO/IEC 14496-10):高級視頻編碼或稱高級視頻編碼(Advanced Video Coding,縮寫為AVC):定義一個視頻編解碼器(codec)。AVC和XviD都屬於MPEG-4編碼,但由於AVC屬於MPEG-4 Part 10,在技術特性上比屬於MPEG-4 Part2的XviD要先進。另外,它和ITU-TH.264標準是一致的,故又稱為H.264。

第十二部分(ISO/IEC 14496-12):基於ISO的媒體檔案格式:定義一個存儲媒體內容的檔案格式。

第十三部分(ISO/IEC 14496-13):智慧財產權管理和保護(IPMP for Intellectual Property Management and Protection)拓展。

第十四部分(ISO/IEC 14496-14):MPEG-4檔案格式:定義基於第十二部分的用於存儲MPEG-4內容的視頻檔案格式。

第十五部分(ISO/IEC 14496-15):AVC檔案格式:定義基於第十二部分的用於存儲第十部分的視頻內容的檔案格式。

第十六部分(ISO/IEC 14496-16):動畫框架擴展(AFX: Animation Framework eXtension)。

第十七部分(ISO/IEC 14496-17):同步文本字幕格式。

第十八部分(ISO/IEC 14496-18):字型壓縮和流式傳輸(針對開放字型格式Open Font Format)。

第十九部分(ISO/IEC 14496-19):合成材質流(Synthesized Texture Stream)。

第二十部分(ISO/IEC 14496-20):簡單場景表示(LASeR for Lightweight Scene Representation。

第二十一部分(ISO/IEC 14496-21):用於描繪(Rendering)的MPEG-J拓展。

第二十二部分(ISO/IEC 14496-22):開放字型格式(Open Font Format)。

第二十三部分(ISO/IEC 14496-23):符號化音樂表示(Symbolic Music Representation)。

第二十四部分(ISO/IEC 14496-24):音頻與系統互動作用(Audio and systems interaction)。

第二十五部分(ISO/IEC 14496-25):3D圖形壓縮模型(3D Graphics Compression Model)。

第二十六部分(ISO/IEC 14496-26):音頻一致性檢查:定義測試音頻數據與ISO/IEC 14496-3是否一致的方法(Audio conformance)。

第二十七部分(ISO/IEC 14496-27):3D圖形一致性檢查:定義測試3D圖形數據與ISO/IEC 14496-11:2005, ISO/IEC 14496-16:2006, ISO/IEC 14496-21:2006,和ISO/IEC 14496-25:2009是否一致的方法(3D Graphics conformance)。

套用

這些特點無疑會加速多媒體套用的發展,從中受益的套用領域有:網際網路多媒體套用;廣播電視;互動式視頻遊戲;實時可視通信;互動式存儲媒體套用;演播室技術及電視後期製作;採用面部動畫技術的虛擬會議;多媒體郵件;移動通信條件下的多媒體套用;遠程視頻監控;通過ATM網路等進行的遠程資料庫業務等。MPEG-4主要套用如下:

網際網路視音頻廣播

由於上網人數與日俱增,傳統電視廣播的觀眾逐漸減少,隨之而來的便是廣告收入的減少,所以現在的固定式電視廣播最終將轉向基於TCP/IP的網際網路廣播,觀眾的收看方式也由簡單的遙控器選擇頻道轉為網上視頻點播。視頻點播的概念不是先把節目下載到硬碟,然後再播放,而是流媒體視頻(streaming video),點擊即觀看,邊傳輸邊播放。

現在網際網路中播放視音頻的有:Real Networks公司的 Real Media,微軟公司的 Windows Media,蘋果公司的 QuickTime,它們定義的視音頻格式互不兼容,有可能導致媒體流中難以控制的混亂,而MPEG-4為網際網路視頻套用提供了一系列的標準工具,使視音頻碼流具有規範一致性。因此在網際網路播放視音頻採用MPEG-4,應該說是一個安全的選擇。

無線通信

MPEG-4高效的碼率壓縮,互動和分級特性尤其適合於在窄帶移動網上實現多媒體通信,未來的手機將變成多媒體移動接收機,不僅可以打移動電視電話、移動上網,還可以移動接收多媒體廣播和收看電視。

靜止圖像壓縮

靜止圖像(圖片)在網際網路中大量使用,現在網上的圖片壓縮多採用JPEG技術。MPEG-4中的靜止圖像(紋理)壓縮是基於小波變換的,在同樣質量條件下,壓縮後的檔案大小約是JPEG壓縮檔案的十分之一。把網際網路上使用的JPEG圖片轉換成MPEG-4格式,可以大幅度提高圖片在網路中的傳輸速度。

電視電話

傳統用於窄帶電視電話業務的壓縮編碼標準,如H261,採用幀內壓縮、幀間壓縮、減少象素和抽幀等辦法來降低碼率,但編碼效率和圖像質量都難以令人滿意。MPEG-4的壓縮編碼可以做到以極低碼率傳送質量可以接受的聲像信號,使電視電話業務可以在窄帶的公用電話網上實現。

計算機圖形動畫與仿真

MPEG-4特殊的編碼方式和強大的互動能力,使得基於MPEG-4的計算機圖形和動畫可以從各種來源的多媒體資料庫中獲取素材,並實時組合出所需要的結果。因而未來的計算機圖形可以在MPEG-4語法所允許的範圍內向所希望的方向無限發展,產生出今天無法想像的動畫及仿真效果。

電子遊戲

MPEG-4可以進行自然圖像與聲音同人工合成的圖像與聲音的混合編碼,在編碼方式上具有前所未有的靈活性,並且能及時從各種來源的多媒體資料庫中調用素材。這可以在將來產生象電影一樣的電子遊戲,實現極高自由度的互動式操作 。

相關詞條

相關搜尋

熱門詞條

聯絡我們