《MP3》

《MP3》

MP3的全稱是Moving Picture Experts Group Audio Layer III。是當今較流行的一種數字音頻編碼和有損壓縮格式,它設計用來大幅度地降低音頻數據量,而對於大多數用戶來說重放的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標準化的。

基本信息概述

MP3播放器解析

MP3播放器工作原理

《MP3》《MP3》

MP3的全稱是Moving Picture Experts Group Audio Layer III。是當今較流行的一種數字音頻編碼和有損壓縮格式,它設計用來大幅度地降低音頻數據量,而對於大多數用戶來說重放的音質與最初的不壓縮音頻相比沒有明顯的下降。它是在1991年由位於德國埃爾朗根的研究組織Fraunhofer-Gesellschaft的一組工程師發明和標準化的。

簡單的說,MP3就是一種音頻壓縮技術,由於這種壓縮方式的全稱叫MPEG Audio Layer3,所以人們把它簡稱為MP3。MP3是利用 MPEG Audio Layer 3 的技術,將音樂以1:10 甚至 1:12 的壓縮率,壓縮成容量較小的file,換句話說,能夠在音質丟失很小的情況下把檔案壓縮到更小的程度。而且還非常好的保持了原來的音質。正是因為MP3體積小,音質高的特點使得MP3格式幾乎成為網上音樂的代名詞。每分鐘音樂的MP3格式只有1MB左右大小,這樣每首歌的大小只有3-4兆位元組。使用MP3播放器對MP3檔案進行實時的解壓縮(解碼),這樣,高品質的MP3音樂就播放出來了。MP3是一個數據壓縮格式。它丟棄掉脈衝編碼調製(PCM)音頻數據中對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了小得多的檔案大小。

在MP3中使用了許多技術其中包括心理聲學以確定音頻的哪一部分可以丟棄。MP3音頻可以按照不同的位速進行壓縮,提供了在數據大小和聲音質量之間進行權衡的一個範圍

MP3格式使用了混合的轉換機制將時域信號轉換成頻域信號:

* 32波段多相積分濾波器(PQF)。
* 36或者12 tap 改良離散餘弦濾波器(MDCT);每個子波段大小可以在0...1和2...31之間獨立選擇。
* 混疊衰減後處理。

根據MPEG規範的說法,MPEG-4中的AAC(Advanced audio coding)將是MP3格式的下一代,儘管有許多創造和推廣其他格式的重要努力。然而,由於MP3的空前的流行,任何其他格式的成功在目前來說都是不太可能的。MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持比如攜帶型媒體播放器(指MP3播放器)DVD和CD播放器

MP3格式特點

1.MP3是一個數據壓縮格式2.它丟棄掉脈衝編碼調製(PCM)音頻數據中對人類聽覺不重要的數據(類似於JPEG是一個有損圖像壓縮),從而達到了小得多的檔案大小。
3.MP3音頻可以按照不同的位速進行壓縮,提供了在數據大小和聲音質量之間進行權衡的一個範圍。MP3格式使用了混合的轉換機制將時域信號轉換成頻域信號
4.32波段多相積分濾波器(PQF)
5.36或者12 tap 改良離散餘弦濾波器(MDCT);每個子波段大小可以在0...1和2...31之間獨立選擇
6.MP3不僅有廣泛的用戶端軟體支持,也有很多的硬體支持比如攜帶型媒體播放器(指MP3播放器)DVD和CD播放器。

mp3發展歷程

MPEG-1 Audio Layer 2編碼開始時是德國Deutsche Forschungs- und Versuchsanstalt für Luft- und Raumfahrt(後來稱為Deutsches Zentrum für Luft- und Raumfahrt, 德國太空中心)Egon Meier-Engelen管理的數字音頻廣播(DAB)項目。這個項目是歐盟作為EUREKA研究項目資助的,它的名字通常稱為EU-147。EU-147 的研究期間是1987年到1994年。

到了1991年,就已經出現了兩個提案:MUSICAM(稱為Layer 2)和ASPEC(自適應頻譜感知熵編碼)。荷蘭飛利浦公司、法國CCETT和德國Institut für Rundfunktechnik提出的Musicam方法由於它的簡單、出錯時的健壯性以及在高質量壓縮時較少的計算量而被選中。基於子帶編碼的Musicam 格式是確定MPEG音頻壓縮格式(採樣率、幀結構、數據頭、每幀採樣點)的一個關鍵因素。這項技術和它的設計思路完全融合到了ISO MPEG Audio Layer I、II 以及後來的Layer III(MP3)格式的定義中。在Mussmann教授(University of Hannover)的主持下,標準的制定由Leon van de Kerkhof(Layer I)和Gerhard Stoll(Layer II)完成

一個由荷蘭Leon Van de Kerkhof、德國Gerhard Stoll、法國Yves-François Dehery和德國Karlheinz Brandenburg 組成的工作小組吸收了Musicam和ASPEC的設計思想,並添加了他們自己的設計思想從而開發出了MP3,MP3能夠在128kbit/s達到MP2 192kbit/s 音質

所有這些算法最終都在1992年成為了MPEG的第一個標準組MPEG-1的一部分,並且生成了1993年公布的國際標準ISO/IEC 11172-3。MPEG音頻上的更進一步的工作最終成為了1994年制定的第二個MPEG標準組MPEG-2標準的一部分,這個標準正式的稱呼是1995年首次公布的ISO/IEC 13818-3。

編碼器的壓縮效率通常由位速定義,因為壓縮率依賴於位數(:en:bit depth)和輸入信號的採樣率。然而,經常有產品使用CD參數(44.1kHz、兩個通道、每通道16位或者稱為2x16位)作為壓縮率參考,使用這個參考的壓縮率通常較高,這也說明了壓縮率對於有損壓縮存在的問題

Karlheinz Brandenburg使用CD介質的Suzanne Vega的歌曲Tom’s Diner來評價MP3壓縮算法。使用這首歌是因為這首歌的柔和、簡單鏇律使得在回放時更容易聽到壓縮格式中的缺陷。一些人開玩笑地將Suzanne Vega稱為“MP3之母”。來自於EBU V3/SQAM參考CD的更多一些嚴肅和critical 音頻選段(glockenspiel, triangle, accordion, ...)被專業音頻工程師用來評價MPEG音頻格式的主觀感受質量。

MP3走向大眾

為了生成位兼容的MPEG Audio檔案(Layer 1、Layer 2、Layer 3),ISO MPEG Audio委員會成員用C語言開發的一個稱為ISO 11172-5的參考模擬軟體。在一些非實時作業系統上它能夠演示第一款壓縮音頻基於DSP的實時硬體解碼。一些其它的MPEG Audio實時開發出來用於面向消費接收機和機頂盒的數字廣播(無線電DAB和電視DVB)。後來,1994年7月7日Fraunhofer-Gesellschaft發布了第一個稱為l3enc的MP3編碼器。Fraunhofer開發組在1995年7月14日選定擴展名.mp3(以前擴展名是.bit)。使用第一款實時軟體MP3播放器Winplay3(1995年9月9日發布)許多人能夠在自己的個人電腦上編碼和回放MP3檔案。由於當時的硬碟相對較小(如500MB),這項技術對於在計算機上存儲娛樂音樂來說是至關重要的。

MP2、MP3與網際網路

1993年10月,MP2(MPEG-1 Audio Layer 2)檔案在網際網路上出現,它們經常使用Xing MPEG Audio Player播放,後來又出現了Tobias Bading為Unix開發的MAPlay。MAPlay於199年2月22日首次發布,現在已經移植到微軟視窗平台上。

剛開始僅有的MP2編碼器產品是Xing Encoder和CDDA2WAV,CDDA2WAV是一個將CD音軌轉換成WAV格式的CD抓取器。

Internet Underground Music Archive(IUMA)通常被認為是線上音樂革命的鼻祖,IUMA是網際網路上第一個高保真音樂網站,在MP3和網路流行之前它有數千首授權的MP2錄音。從1995年上半年開始直到整個九十年代後期,MP3開始在網際網路上蓬勃發展。MP3的流行主要得益於如nullsoft於1997年發布的Winamp和Napster於1999年發布的Napster這樣的公司和軟體包的成功,並且它們相互促進發展。這些程式使得普通用戶很容易地播放、製作、共享和收集MP3檔案。關於MP3檔案的點對點技術檔案共享的爭論在最近幾年迅速蔓延—這主要是由於壓縮使得檔案共享成為可能,未經壓縮的檔案過於龐大難於共享。由於MP3檔案通過網際網路大量傳播一些主要唱片廠商通過法律起訴Napster來保護它們的著作權(參見智慧財產權)。如iTunes Music Store這樣的商業線上音樂發行服務通常選擇其它或者專有的支持數字著作權管理(DRM)的音樂檔案格式以控制和限制數字音樂的使用。支持DRM的格式的使用是為了防止受著作權保護的素材免被侵犯著作權,但是大多數的保護機制都能被一些方法破解。這些方法能夠被計算機高手用來生成能夠自由複製的解鎖檔案。一個顯著的例外是微軟公司的Windows Media Audio 10格式,目前它還沒有被破解。如果希望得到一個壓縮的音頻檔案,這個錄製的音頻流必須進行壓縮並且帶來音質的降低。

MP3的音頻質量

因為MP3是一種有損格式,它提供了多種不同“位速”的選項—也就是用來表示每秒音頻所需的編碼數據位數。典型的速度介於每秒128和320kb之間。與此對照的是,CD上未經壓縮的音頻位速是1411.2 kbit/s(16 位/採樣點 × 44100 採樣點/秒 × 2 通道)。

使用較低位速編碼的MP3檔案通常回放質量較低。使用過低的位速,“壓縮噪聲(:en:compression artifact)”(原始錄音中沒有的聲音)將會在回放時出現。說明壓縮噪聲的一個好例子是壓縮歡呼的聲音:由於它的隨機性和急劇變化,所以編碼器的錯誤就會更明顯,並且聽起來就象回聲。除了編碼檔案的位速之外,MP3檔案的質量也與編碼器的質量以及編碼信號的難度有關。使用優質編碼器編碼的普通信號,一些人認為128kbit/s的MP3以及44.1kHz的CD採樣的音質近似於CD音質,同時得到了大約11:1的壓縮率。在這個比率下正確編碼的MP3能夠獲得比調頻廣播和卡式磁帶[來源請求]更好的音質,這主要是那些模擬介質的頻寬限制、信噪比和其它一些限制。然而,聽力測試顯示經過簡單的練習測試聽眾能夠可靠地區分出128kbit/s MP3與原始CD的區別[來源請求]。在許多情況下他們認為MP3音質太低是不可接受的,然而其他一些聽眾或者換個環境(如在嘈雜的車中或者聚會上)他們又認為音質是可接受的。很顯然,MP3 編碼的瑕疵在低端計算機的揚聲器上比較不明顯,而在連線到計算機的高質量立體聲系統,尤其是使用高質量的headphone時則比較明顯。Fraunhofer Gesellschaft(FhG)在他們的官方網站上公布了下面的MPEG-1 Layer

1、2和3的壓縮率和數據速率用於比較:

* Layer 1: 384 kbit/s,壓縮率 4:1
* Layer 2: 192...256 kbit/s,壓縮率 8:1...6:1
* Layer 3: 112...128 kbit/s,壓縮率 12:1...10:1

不同層面之間的差別是因為它們使用了不同的心理聲學模型導致的;Layer 1的算法相當簡單,所以透明編碼就需要更高的位速。然而,由於不同的編碼器使用不同的模型,很難進行這樣的完全比較。

許多人認為所引用的速率出於對Layer 2和Layer 3記錄的偏愛而出現了嚴重扭曲。他們爭辯說實際的速率如下所列

* Layer 1: 384 kbit/s 優秀
* Layer 2: 256...384 kbit/s 優秀, 224...256 kbit/s 很好, 192...224 kbit/s 好。
* Layer 3: 224...320 kbit/s 優秀,192...224 kbit/s 很好, 128...192 kbit/s 好。

當比較壓縮機制時,很重要的是要使用同等音質的編碼器。將新編碼器與基於過時技術甚至是帶有缺陷的舊編碼器比較可能會產生對於舊格式不利的結果。由於有損編碼會丟失信息這樣一個現實,MP3算法通過建立人類聽覺總體特徵的模型儘量保證丟棄的部分不被人耳識別出來(例如,由於noise masking),不同的編碼器能夠在不同程度上實現這一點。

一些可能的編碼器:

* Mike Cheng在1998年早些時候首次開發的LAME。 與其它相比,它是一個完全遵循LGPL的MP3編碼器,它有良好的速度和音質,甚至對MP3技術的後繼版本形成了挑戰。
* Fraunhofer Gesellschaft:有些編碼器不錯,有些有缺陷

有許多的早期編碼器現在已經不再廣泛使用:

* ISO dist10 參考代碼*Xing
*BladeEnc
*ACM Producer Pro.

好的編碼器能夠在128到160kbit/s下達到可接受的音質,在160到192kbit/s下達到接近透明的音質。所以不在特定編碼器或者最好的編碼器話題內說128kbit/s或者192kbit/s下的音質是容易引起誤解的。一個好的編碼器在 128kbit/s下生成的MP3有可能比一個不好的編碼器在192kbit/s下生成的MP3音質更好。另外,即使是同樣的編碼器同樣的檔案大小,一個不變位速的MP3可能比一個變位速的MP3音質要差很多

需要注意的一個重要問題是音頻信號的質量是一個主觀判斷。Placebo effect is rampant, with many users claiming to require a certain quality level for transparency.許多用戶在A/B測試中都沒有通過,他們無法在更低的位速下區分檔案。一個特定的位速對於有些用戶來說是足夠的,對於另外一些用戶來說是不夠的。每個人的聲音感知可能有所不同,所以一個能夠滿足所有人的特定心理聲學模型並不明顯存在。僅僅改變試聽環境,如音頻播放系統或者環境可能就會顯現出有損壓縮所產生的音質降低。上面給出的數字只是大多數人的一個大致有效參考,但是在有損壓縮領域真正有效的壓縮過程質量測試手段就是試聽音頻結果

如果你的目標是實現沒有質量損失的音頻檔案或者用在演播室中的音頻檔案,就應該使用無損壓縮算法,目前能夠將16位PCM音頻數據壓縮到38%並且聲音沒有任何損失,這樣的壓縮工具有Lossless Audio LA、Apple Lossless、TTA、FLAC、Windows Media Audio 9 Lossless (wma) 和Monkey’s Audio 等等。對於需要進行編輯、混合處理的音頻檔案要儘量使用無損格式,否則有損壓縮產生的誤差可能在處理後無法預測,多次編碼產生的損失將會混雜在一起,在處理之後進行編碼這些損失將會變得更加明顯。無損壓縮在降低壓縮率的代價下能夠達到最好的結果

一些簡單的編輯操作,如切掉音頻的部分片段,可以直接在MP3數據上操作而不需要重新編碼。對於這些操作來說,只要使用合適的軟體(mp3DirectCut和MP3Gain),上面提到的所關心的問題可以不必考慮

位速

位速對於MP3檔案來說是可變的。總的原則是位速越高則聲音檔案中包含的原始聲音信息越多,這樣回放時聲音質量也越高。在MP3編碼的早期,整個檔案使用一個固定的位速

MPEG-1 Layer 3允許使用的位速是32、40、48、56、64、80、96、112、128、160、192、224、256和320 kbit/s,允許的採樣頻率是32、44.1和48kHz。44.1kHz是最為經常使用的速度(與CD的採樣速率相同),128kbit/s是事實上“好品質”的標準,儘管192kbit/s在對等檔案共享網路上越來越受到歡迎。MPEG-2和[非正式的]MPEG-2.5包括其它一些位速:6、12、24、32、40、48、56、64、80、96、112、128、144、160kbit/s。

可變位速(VBR)也是可能的。MP3檔案的中的音頻切分成有自己不同位速的幀,這樣在檔案編碼的時候就可以動態地改變位速。儘管在最初的實現中並沒有這項功能,VBR現在已經得到了廣泛的套用。這項技術使得在聲音變化大的部分使用較大的位速而在聲音變化小的部分使用較小的位速成為可能。這個方法類似於聲音控制的磁帶錄音機不記錄靜止部分節省磁帶消耗。一些編碼器在很大程度上依賴於這項技術

高達640kbit/s的非標準位速可以使用LAME編碼器和自由格式來實現,但是幾乎沒有MP3播放器能夠播放這些檔案。

MP3的設計局限MP3格式有一些不能僅僅通過使用更好的編碼器繞過的內在限制。一些新的壓縮格式如Vorbis和AAC不再有這些限制

按照技術術語,MP3有如下一些限制:

* 位速最大是320 kbit/s;
* 時間解析度相對於變化迅速的信號來說太低
* 對於超過15.5/15.8 kHz的頻率沒有scale factor band;
* Joint stereo 是基於幀與幀完成的;
* 沒有定義編碼器/解碼器的整體時延,這就意味著gapless playback缺少一個正式的規定;然而,即使有這些限制,一個好好的調整MP3編碼器能夠非常有競爭力地完成編碼任務

MP3音頻編碼

MPEG-1標準中沒有MP3編碼器的一個精確規範,然而與此相反,解碼算法和檔案格式卻進行了細緻的定義。人們構想編碼的實現是設計自己的適合去除原始音頻中部分信息的算法(或者是它在頻域中的修正離散餘弦(MDCT)表示)。在編碼過程中,576個時域樣本被轉換成576個頻域樣本,如果是瞬變信號就使用192而不是576個採樣點,這是限制量化噪聲隨著隨瞬變信號短暫擴散。這是聽覺心理學的研究領域:人類主觀聲音感知。

這樣帶來的結果就是出現了許多不同的MP3編碼器,每種生成的聲音質量都不相同。有許多它們的比較結果,這樣一個潛在用戶很容易選擇合適的編碼器。需要記住的是高位速編碼表現優秀的編碼器(如LAME這個在高位速廣泛使用的編碼器)未必在低位速的表現也同樣好

MP3音頻解碼

另一方面,解碼在標準中進行了細緻的定義。

多數解碼器是bitstream compliant,也就是說MP3檔案解碼出來的非壓縮輸出信號將與標準文檔中數學定義的輸出信號一模一樣(在規定的近似誤差範圍內)。

MP3檔案有一個標準的格式,這個格式就是包括384、576、或者1152個採樣點(隨MPEG的版本和層不同而不同)的幀,並且所有的幀都有關聯的頭信息(32位)和輔助信息(9、17或者32位元組,隨著MPEG版本和立體聲或者單通道的不同而不同)。頭和輔助信息能夠幫助解碼器正確地解碼相關的霍夫曼編碼數據。

所以,大多數的解碼器比較幾乎都是完全基於它們的計算效率(例如,它們在解碼過程中所需要的記憶體或者CPU時間)。

ID3和其它標籤

標籤”是MP3(或其它格式)中保存的包含如標題、藝術家、唱片、音軌號或者其它關於MP3檔案信息等添加到檔案的數據。最為流行的標準標籤格式目前是ID3 ID3v1和ID3v2標籤,最近的是APEv2標籤。

APEv2最初是為MPC 檔案格式開發的(參見 APEv2規範)。APEv2可以與ID3標籤在同一個檔案中共存,但是它也可以單獨使用。

音量歸一化(normalization)

由於CD和其它各種各樣的音源都是在不同的音量下錄製的,在標籤中保存檔案的音量信息將是有用的,這樣的話回放時音量能夠進行動態調節

人們已經提出了一些對MP3檔案增益進行編碼的標準。它們的設計思想是對音頻檔案的音量(不是“峰值”音量)進行歸一化,這樣以保證在不同的連續音軌切換時音量不會有變化。

最流行最常用的保存回放增益的解決方法是被簡單地稱作“Replay Gain”的方法。音軌的音量平均值和修剪信息都存在元數據標籤中。可選技術

有許多其它的有損音頻編解碼存在,其中包括:

* MPEG-1/2 Audio Layer 2 (MP2),MP3的前輩;
* MPEG-4 AAC, MP3的繼承者,Apple的iTunes Music Store和iPod使用;
* Xiph.org Foundation的Ogg Vorbis,自由軟體和沒有專利的編解碼器;
* MPC,也稱作Musepack(以前叫MP+),由MP2派生出來
* Thomson Multimedia的MP3和SBR的組合mp3PRO;
* AC-3,Dolby Digital和DVD中使用;
* ATRAC,Sony的MiniDisc使用;
* Windows Media Audio(WMA)來自於微軟公司;
* QDesign, 用於低速QuickTime;
* AMR-WB+ 針對蜂窩電話和其它有限頻寬使用進行了最佳化的增強自適應多速寬頻編解碼器;(Enhanced Adaptive Multi Rate WideBand codec);
* RealNetworks的RealAudio,經常用於網站的流媒體;
* Speex,基於CELP的專門為語音和VoIP設計的自由軟體和無專利編解碼器。

mp3PRO、MP3、AAC、和MP2都是同一個技術家族中的成員,並且都是基於大致類似的心裡聲學模型。Fraunhofer Gesellschaft擁有許多涵蓋這些編解碼器所用技術的基本專利,Dolby Labs、索尼公司、Thomson Consumer Electronics和AT&T擁有其它一些關鍵專利。

在網際網路上有一些其它無損音頻壓縮方法。儘管它們與MP3不同,它們是其它壓縮機制的優秀範例,它們包括:

* FLAC 表示‘自由無損音頻編解碼(Free Lossless Audio Codec)’
* Monkey’s Audio
* SHN,也稱為Shorten
* TTA
* Wavpack
* Apple Lossless

聽覺測試試圖找出特定位速下的最好質量的有損音頻編解碼。在128kbit/s下,Ogg Vorbis、AAC、MPC和WMA Pro性能持平處於領先位置,LAME MP3稍微落後。在64kbit/s下,AAC-HE和mp3pro少許領先於其它編解碼器。在超過128kbit/s下,多數聽眾聽不出它們之間有明顯差別。什麼是“CD音質”也是很主觀的:對於一些人來說128kbit/s的MP3就足夠了,而對於另外一些人來說必須是200kbit/s以上的位速

儘管如WMA和RealAudio這些新的編解碼器的支持者宣稱它們各自的算法能夠在64kbit/s達到CD音質,聽覺測試卻顯示了不同的結果;然而,這些編解碼器在64kbit/s的音質明顯超過同樣位速下MP3的音質。無專利的Ogg Vorbis編解碼器的開發者宣稱它們的算法超過了MP3、RealAudio和WMA的音質,上面提到的聽覺測試證實了這種說法。Thomson宣稱它的mp3PRO 在64kbit/s達到了CD音質,但是測試者報告說64kbit/s的mp3Pro檔案與112kbit/s的MP3檔案音質類似,但是直到 80kbit/s時它才能接近CD音質。專門為MPEG-1/2視頻設計的、最佳化的MP3總體上在低於48kbit/s的單聲道數據和低於80kbit/s的立體聲上表現不佳

授權和專利問題

Thomson Consumer Electronics在認可軟體專利的國家控制著MPEG-1/2 Layer 3 專利的授權,這些國家包括美國和日本,歐盟國家不包括在內。Thomson積極地加強這些專利的保護。Thomson已經在歐盟國家被歐洲專利局(:en:European Patent Office授予軟體專利,但是還不清楚它們是否會被那裡的司法所加強。參見歐洲專利協定中的軟體專利(:en:Software patents under the European Patent Convention)。關於Thomson專利檔案、授權協議和費用的最新信息請參考它們的網站mp3licensing.com。

在1998年9月,Fraunhofer Institute向幾個MP3軟體開發者發去了一封信聲明“發布或者銷售編碼器或者解碼器”需要授權。這封信宣稱非經授權的產品“觸犯了 Fraunhofer和THOMSON的專利權。製造、銷售或者發布使用[MPEG Layer-3]標準或者我們專利的產品,你們需要從我們這裡獲得這些專利的授權協定。”這些專利問題極大地減慢了未經授權的MP3軟體開發並且導致人們的注意力轉向開發和歡迎其它如WMA和Ogg Vorbis這樣的替代品。Windows開發系統的製造商微軟公司從MP3專向它們自有的Windows Media格式以避免與專利相關的授權問題。直到那些關鍵的專利過期之前,未經授權的編碼器和播放器在認可軟體專利的國家看起來都是非法的。

儘管有這些專利限制,永恆的MP3格式繼續向前發展;這種現象的原因看起來是由如下因素帶來的網路效應:

* 熟悉這種格式,不知道有其它可選格式存在
* 這些可選格式沒有普遍地明顯超過MP3的優勢這樣一個現實
* 大量的MP3格式音樂,
* 大量的使用這種格式的不同軟體和硬體,
* 沒有DRM保護技術,這使得MP3檔案可以很容易地修改、複製和通過網路重新發布,
* 大多數家庭用戶不知道或者不關心軟體專利爭端,通常這些爭端與他們個人用途而選用MP3格式無關。另外,專利持有人不願對於開源解碼器加強授權費用的徵收,這也帶來了許多免費MP3解碼器的發展。另外,儘管他們試圖阻止發布編碼器的二進制代碼, Thomson已經宣布使用免費MP3編碼器的個人用戶將不需要支付費用。這樣,儘管專利費是許多公司打算使用MP3格式時需要考慮的問題,對於用戶來說並沒有什麼影響,這就帶來了這種格式的廣受歡迎。

sisvel S.p.A. [1]和它的美國子公司Audio MPEG, Inc. [2]以前曾經以侵犯MP3技術專利為由起訴Thomson[3],但是那些爭端在2005年11月最終以Sisvel給Thomson MP3授權而結束。Motorola最近也與Audio MPEG簽署了MP3的授權協定。由於Thomson和Sisvel都擁有他們聲稱編解碼器必需的單獨的專利,MP3專利的法律狀態還不清晰。Fraunhofer的專利將在2010年4月到期,到了那時MP3算法將不再受專利保護

MP3播放器

MP3播放器,顧名思義也就是可播放MP3格式的音樂播放工具。
MP3播放器的壓縮率可以達到1:12,但在人耳聽起來,卻並沒有什麼失真,因為它將超出人耳聽力範圍的聲音從數字音頻中去掉,而不改變最主要的聲音。此外,MP3播放器也可以上傳、下載其他任何格式的電腦檔案,MP3播放器具有移動存儲功能。
MP3播放器其實就是一個功能特定的小型電腦。在MP3播放器小小的機身里,擁有MP3播放器存儲器(存儲卡)、MP3播放器顯示器(LCD顯示屏)、MP3播放器中央處理器 [MCU(微控制器)或MP3播放器解碼DSP(數位訊號處理器)] 等。

世界上第一台MP3的誕生,其實是有一個小故事的,故事追溯到1997年3月的一天,韓國三星公司一位部門經理Moon先生,出差在美國回到漢城的飛機上,在他的筆記本電腦上看他的同事給他發出的一分報告。這是一份圖象、文字和MP3音樂合成的簡報。當Moon閱讀完畢摘下耳機,發現他身旁的旅客正在聽著MD,Moon頓時受到啟發:要是電腦上的MP3音樂檔案也能夠直接取出來,用一個獨立的播放器來播放,那不就是最好的音樂隨身聽嗎?回到韓國後,他將這個想法提給當時的總裁尹鍾龍。可惜的是,當時三星正在進行組織重整,無暇兼顧Moon的發展提案。半年後,亞洲金融風暴的發生使三星公司受到巨大的衝擊,Moon先生也被迫提早退休。離開三星公司後,Moon先生進入了另一家韓國企業Saehan(世韓)出任總裁,並將他的想法在Saehan公司轉變成為了現實,於1998年推出了世界上第一台的MP3播放器——MPMan F10。MP3播放器是利用數位訊號處理器DSP(Digital Sign Processer)來完成處理傳輸和解碼MP3檔案的任務的。DSP掌管隨身聽的數據傳輸,設備接口控制,檔案解碼回放等活動。DSP能夠在非常短的時間裡完成多種處理任務,而且此過程所消耗的能量極少(這也是它適合於攜帶型播放器的一個顯著特點)。

首先將MP3歌曲檔案從記憶體中取出並讀取存儲器上的信號→到解碼晶片對信號進行解碼→通過數模轉換器將解出來的數位訊號轉換成模擬信號→再把轉換後的模擬音頻放大→低通濾波後到耳機輸出口,輸出後就是我們所聽到的音樂了。

MP3內部結構

MP3播放器由液晶顯示屏、微處理器、數碼信號處理器(DSP)晶片、輸入輸出控制器、放大器和一些按鈕組成。微處理器是播放器的“大腦”,用來接受用戶選擇的播放控制,並將當前播放的歌曲信息顯示在液晶顯示屏上,然後向數據信號處理晶片發出指令,使其準確地處理音頻信號。數碼信號處理器先用解壓算法將MP3檔案解壓,接著用數模轉換器將數碼信息轉換成波形信息,然後由放大器將信號放大並送到音頻連線埠,最後我們就可以通過接在音頻連線埠的耳機聽到動聽的音樂了。
市場的快速更新使我們能夠更快地享受到科技為人類帶來的便捷,然而,同時也使選購變得困難起來,究竟什麼才是我們想要的MP3呢?這裡就涉及了一個定位問題,只要明確自己的購買目的,才能準確地選擇到優秀的產品

一、造型

出色的造型設計,不僅僅是要表現MP3的與眾不同,也是憑藉它來確定質量優劣的最重要標誌之一。雖然生活中不能以貌取人,但對於MP3這類人為的商品,“以貌取物”準確度卻是八九不離十。

型狀必須是別出心裁,而不是滿大街都可以看到的公模設計,由於開發MP3模具並不容易,而且有一定的外型設計專利,廠商必然把這部分產品定位為高端機型,亦會更花心思。色調的搭配很重要,通常高級的設計師才會非常注重這一方面,不一定要色彩鮮艷,但肯定要搭配合理,使MP3看起來更高貴典雅一些。對使用者形成了強烈的視覺衝擊,特別是那些針對時尚愛美MM量身定做的產品,色彩比任何功能更具吸引力。此外,高級烤漆加工處理後,還會使外殼不易丟色,這可以從外殼的色澤反光度上看出。

材料選取上,金屬最佳,橡膠次之,工程塑膠最差,當然,這並非說金屬造的MP3就是好貨,而是金屬相對來說會抗擊力強些,而且看起來比較漂亮,更有質感和檔次。所謂“行家一出手,便知有沒有”,摸一摸MP3的外殼,看看它是否順手,即可大致判斷MP3的材料品質。做工主要是看產品的細微之處與各部分之間的連線位置,如果是外殼拼接緊急(特別是電池蓋位置),按鍵柔軟舒適,沒有毛刺和機體不平整的問題,基本上算過關了。

輕巧的重量是不可忽視的一點,MP3是隨身聽設備,即使外觀設計得再突出,不便於攜帶或體積過大的話,同樣失去了“隨身”的精髓。鏡面是最近非常流行的設計,不過,真正的納米鏡面是可以清楚地反射出光線,當作鏡子用。鏡面的最大缺陷是一旦劃傷之後,傷痕會變得非常明顯,就像撕破臉的美女。丹丁的DX-8機身形狀為流線型的類橢圓形,而且在上下兩端的曲線弧度並不一樣,看上去和雞蛋的平面圖確實很相像,所以被命名為“彩蛋”。

二、顯示屏

科學在發展進步,時尚同樣也在發展進步,我們用的手機早已從簡單的單色螢幕進入了彩色螢幕的時代,同樣,消費數碼產品的典型代表MP3播放器也已經開始邁出了步入彩屏時代的步伐,而且相信這也必然會成為未來發展的主流。

以色彩效果來分,自然是顏色數目越高越好,螢幕材料則是LTPS(Low Temperature Polysilicon,低溫多矽顯示器)好於TFT,TFT(thin film transistor,薄膜電晶體)好於STN(Super Twisted Nematic,超扭曲向列),至於OLED(Organic light-emitting diode,有機電激發光顯示器)彩屏,則是在黑暗中較有優勢,但無法如TFT和STN般顯示複雜的圖片。

由於MP3體積小,螢幕尺寸會大受限制,而且螢幕並非越大越好,而是要看顯示內容的多少,相同尺寸下,顯示內容越多證明螢幕分辨越高,看圖片時會越顯得細膩,也利於加入人性化圖形選單,使操作方式貼近日常的Windows視窗習慣。

三、晶片

最主要的晶片是存儲和解碼晶片,廠商通常不會透露存儲晶片的資料,當然是三星英特爾東芝等大廠的晶片質量較好,可惜只有拆機才能看出,不提也罷

至於解碼晶片,在許多MP3評測中都有提到,它不僅決定了音頻處理的速度,也確定了MP3的特別音效功能,包括多重EQ、3D音效。當然,解碼晶片也是影響音質的最重要部分之一,APU(Audio Processing Unit,音頻處理單元)的算法會對波形的還原起著決定性的作用。雖說MP3格式也是有損壓縮,但是使用高採樣率之後,MP3的音質會大幅度提高。不過,高採樣率的MP3音頻檔案需要解碼晶片支持高數據流,而此時廉價產品所使用的解碼晶片顯然力不從心。

四、耳機

耳機包括兩部分,一個是MP3本身的輸出功率,輸出功率大(兩個耳機加起來20mW以上)可以推動一些阻抗比較高的高檔耳機,令音質上的表現更加完美;二是耳機本身的質量,以貌取機是必然之路,優秀的耳機外觀肯定不會差到那裡去。最要注意的是那些耳機號稱是某革著名大廠耳機的OEM,藉以作宣傳作用。實際上,大部分耳機並非真的是OEM產品,徒具一個形似的外表,內里跟本不是那么一回事。人怕出名豬怕壯,一旦某耳機型號樹立起名牌效應,許多耳機廠商就跟風生產形似的產品,連帶著MP3廠商也在插上一腳。因此,我們千萬不能盲從於商家或某些新聞稿文章的描述,最佳的方法仍然是自己聆聽。老實說,市面上大多數MP3的附帶耳機都不怎么樣,即使是中高級產品,仍然讓我們感到失望,只有那些真正的高端產品,才會有較容易為人接受的耳機。如果你真的很注重MP3附送耳機的質量,只有從每個品牌最高端的幾隻型號中選取。

順帶一提,即使是真的OEM耳機,其產品性能、質量都必然遜於零售版的耳機。零售版產品要同時考慮到品牌形象和盈利,對產品的要求會高許多,相對來說,OEM只是隨機附送的,部分標準未達到零售版的要求,也無須太過注重。總而言之,大家不要太過迷信MP3附送的OEM耳機,不如另花錢購買一些名牌耳機為好,價格約50-150元的第三方耳機,效果絕對好於所謂的OEM產品

五、功能

MP3的功能越來越多,它與PDA、手機一樣,都向多功能方面發展,儘可能吸收其它產品的功能,以便增加產品賣點。購買時要按需入手,別盲目性地追求多功能,功能越多價格越貴,而且買回來之後,你會發現有許多是跟本用不上的。

●可移動硬碟:電腦直接把MP3識別為一個移動存儲器,可存放音樂以外的各種檔案 。
●固件升級:解決發布產品後的己知軟體、硬體故障,增加新
●資料夾瀏覽:按資料夾方式存儲不同的歌曲,並且以此為單位播放,無須所有MP3都放於同一目錄下面,提高管理易用性。
●多國語言:主要支持中文簡體中文繁體韓文日文英文,某些機型甚至有26國語言。
●A-B復讀:反覆讀某一段的內容,便於學習外語 。
●文字閱讀:通常只有螢幕大的MP3有此功能,可以當電子書看,某些產品還支持PDA的文本格式。如果固件容量足夠,還可以下載各種不同的中外文字型。自動捲軸功能也很有用,自動向上或者向下翻頁時背景燈長亮,既省去了自己翻頁的麻煩,也完全彌補了小顯示屏的缺點。甚至能邊看書邊聽MP3,如同功能簡化的PDA。
●TTS(text-to-speech,文本語音朗讀),把文本直接用MP3發聲轉換為文字,機器聲沒有語氣和節奏變換,聽起來會覺得很奇怪,但很適合不想看書的懶人 。
●字典:英漢字典,用作翻譯之用,注意,MP3控制鍵有限,輸入英文單詞並不容易
●自動錄音功能:通過SAD(Sound Activity Detector,聲音激活偵察器),可設定無聲時間長短,只有當有聲音時才會錄音,不但節省記憶體空間,更在回放時節省時間。
●遠程錄音:使用AGC(Auto Gain Control,自動增益控制),可調節靈敏度和錄音質量(低,重,高),適用遠距離外部錄音,如:會議 。
●FM:收聽電台,許多產品都能預設若干個頻道,無須每次調節 。
●FM錄音:把電台內容轉存為MP3,某些產品還有FM錄音!可以輸入星期幾,幾時幾分開始對多少赫茲的頻道進行錄音,這對於喜歡的廣播節目或者外語學習節目不會因為忙碌而錯過,可錄製下來慢慢聽。
●EQ設定:即為音效的設定。幾乎每款產品都會有幾種已經預置的音效設定,如普通、搖滾、爵士、流行、古典。有的MP3還支持自定義音效設定,用戶可以根據自己的喜好來定製。但無液晶屏顯示的產品,這些EQ設定幾乎就不存在了,僅有本身固化的一種音效模式。這樣對於一些特別忠愛個性音樂效果的朋友就顯得有些殘忍了。
●直錄:把外部音源(CD/md隨身聽、家庭音響、電腦)編碼壓縮為音樂檔案,直接存在MP3上。由於MP3機內置的編碼晶片性能較差,音質比不上電腦壓縮的音樂檔案。
●時鐘:時間設定可以輸入月日,時分,又能作為手表用了 。
●定時關機:可設定時間在0~180分之間定時關機,當然也可以設定0~60分之間的無操作自動關機,最方便晚上睡覺前聽歌。
●圖片瀏覽器:不僅可以瀏覽拍攝下來的照片,更可以欣賞電腦下載的圖片。因為MP3的螢幕小,解析度相對較高看圖片會覺得份外精美,但大多數螢幕都有比例限制,比例不對則會出現變形而無法正常顯示現象。
●數位相機:如同手機初期的攝像頭那樣,採用10 - 30萬像素1/5.5" CMOS鏡頭,CMOS主要缺點就是亮度感應慢,所以在光線充足的環境下拍攝出來的效果才比較好。CMOS的最大優點就是體積小,最適合裝在MP3隨身聽上。攝像頭本身也有多種功能,能進行數碼變焦,多種效果拍攝等。

六、電池

大部分MP3採用5號(AA)或7號(AAA)電池,它們可以隨意買到,價格也較為便宜(0.5-5元)。如果是可充式鋰電(10 - 15元),使用時間相當悠長,播放時間都可達到10小時以上,再攜帶多一顆電池,可以滿足2-3天的需求,你總不可能一天到晚都用耳機塞著耳朵吧。

這裡著重要講講的是鋰電,分為可拆卸和不可拆卸兩種,可拆卸鋰電使用非常方便,可以隨時更換,除了可以使用USB線連線電腦後充電,也可以使用附帶的電源適配器為充電。其超大容量和特殊的放電方式,可以保證30小時以上的播放時間,足以頂得上三顆AA電池。不過,使用可拆卸鋰電的MP3少之又少,市面上不會超過10款。電池上的銘牌會標明了電池工作電壓,安全事項,保修期等信息,還有最大輸出電流和充電時間,方便另購,可是購買一個可拆卸鋰電的價格亦相當昂貴(150-200元左右),由於它的體積太小,不小心遺失會令人十分心痛。 相較之下,不可拆卸鋰電沒有遺失問題,使用這類電池的MP3通常體積相當小巧,甚至連省電大戶的液晶屏也欠奉,不過,仍能保持6-8小時的播放時間。它的最大問題是經常要充電,長時間使用的話,必須隨身攜帶充電器,真是相當麻煩。如果你有多種數碼產品的話,光是充電器的重量已經夠你受的了。此外,還要注意它的壽命,許多人使用鋰電都是不太愛惜的,往往是電池未用完就充電,或者一天之內反覆充多次,這會嚴重影響鋰電的正常壽命。先兆是使用時間越來越短,直至最後無法充電。不可拆卸鋰電一旦損壞,只能拿到廠商處維修換電池,只有廠商才有這類造型獨特的專用電池,更換價格約為100元/顆。產品過了保修期之後,還要付維修費,長遠投資會倍增。

七、容量

容量當然是越大越好啦,10-40GB的容量能夠儲存的歌曲,和256MB-1GB的存儲量不可同日而語。然而,容量卻涉及到許多的問題。談及大容量的MP3播放器,很多熟悉這個市場的讀者一定會想到創新的JUKEBOX,作為開創大容量MP3播放器市場的產品,這款產品一度成為了大容量MP3的代名詞。和第一代的JUKEBOX相比,雖然最新的產品體積略有縮小,但是仍然屬於“龐然大物”的級別。由於體積過大,這款產品也受到了很多消費者的詬病,也直接導致了其在與蘋果推出的iPod對壘中的失敗。iPod之所以能夠成功,同時憑藉了靚麗外觀、較小體積和超大容量。至此,大家明白到,在追求容量的同時,也不能過於忽視體積和成本,只有在三者間取得很好的平衡,才能保持產品的生存價值。 值得注意的是,目前大部分MP3都採用Flash晶片作為存儲介質,而Flash晶片昂貴的價格成了大容量普及遇到的一個最大障礙。因此,技術上的突破將是大容量播放器發展的方向,如果真的需要追求高容量,只好放棄Flash晶片,選擇硬碟式MP3。看看那些512MB-1GB產品的天價,足可以購買到容量幾十倍的硬碟MP3,是否需要為體積作出如此大的犧牲,真是要考慮清楚了。除非你是那些從來不拿背包、帶包、掛包,連錢包、手機也不想帶在身上,希望“無機周身輕”的人,又或者是銀兩多得用不完,正頭痛如何花錢的朋友,不然的話,依然是硬碟式MP3具有最佳性能/價格比。這裡要特別一提DMC生產的Xclef 500,它是至今為止最大容量的MP3,存儲量高達137GB,使用USB 2.0接口,使用線路輸入或光學輸入可實現可達320Kbps的錄音質量。支持MP3 VBR壓縮率。內置2.5寸的硬碟,具有FM收音、FM錄音、語言錄音,7行大螢幕顯示,支持ID3,有多種語言版本支持,使用內置鋰電池,容量為2000毫安,其機身具有12MB快取,信躁比大於90dB,失真率僅為0.01%,耳機輸出功率為雙10毫瓦,其重量為255克。價格在450美元左右,呵呵,其價格足以買到高性能PDA了。

八、傳輸速度

現在的MP3,絕大部分有快閃記憶體盤功能,無論是在傳輸檔案或音樂的時候,速度都是非常重要的。USB 2.0也稱為Hi-Speed USB,它的傳輸速度達到480Mbps=60MB/秒,換言之,理論上一秒種可傳輸12首5MB大小的MP3。至於IEEE 1394(火線),速度是400M bps = 50MB/秒,一秒種可傳輸10首5MB大小的MP3。對於256、512MB的產品來說,複製歌曲只是舉手之勞,就算是GB級的硬碟MP3,亦不會顯得太慢。然而使用USB 1.0的話,它的速度只有12M bps = 1.5MB/秒,複製一首5MB的歌曲已經要3.3秒,真是等到花兒也謝了,特別是在硬碟MP3上,沒有多少人有如此好的耐性

購買之前,一定要看清楚MP3是否支持USB 2.0,現在市面上約有30-40種產品支持USB 2.0,一般是較新的機型。可是,並沒有多少產品會把此特性明確地標記在外殼上,我們只能通過說明書或包裝盒來查找,或者直接詢問經銷商,真的無法確定的話,最好的方法是插在電腦上試試,由於大部分主機板已經包含USB 2.0接口,Win XP會提示找到相關設備。

九、附屬檔案

附屬檔案質量是看出廠商是否肯花心思的最直接方法,通常MP3都有產品說明書、耳塞、USB在線上線、保修卡、驅動光碟,較高端的產品還會附送扣在身上的臂帶、布袋、皮袋、音頻轉接線、音樂直錄線、掛在脖子上的掛繩、耳塞保護膜、電池、充電器等。簡而言之,附屬檔案的數量越多,造工超精緻,證明隨身聽本身的質量也不會差到那裡去,君未聽聞“猛將手下無弱兵”之言嗎?

十、所支持的格式

MP3格式是最為常用的,它支持採樣率為44.1KHz,可以使用的比特率一般是8-256Kbps。不同的MP3產品對採樣率和比特率的支持範圍也不盡相同,當然支持的範圍越廣越好,對於採樣率,好一點的產品可以支持到48KHz。對於動態編碼VBR,可以在同等音質下使檔案的體積更小,有些機器是不能支持的。WMA是微軟推廣的一種格式,壓縮率一般在5-192Kbps。在相同音質下,WMA可以比MP3格式檔案的體積更小,所以擁有此功能的MP3播放器等於變相增大了其記憶體容量。還要提醒朋友們的是,用Windows自帶的WMP壓縮檔案時,需要把著作權保護的選項去掉,否則壓出來的WMA檔案在MP3上無法播放;從網上下載的WMA檔案都經過了加密,因此用支持WMA的播放器有可能也會出現不能播放的情況。對於其它的格式,如ASF、WAV等,都沒有MP3和WMA格式好用,從實用的角度來看,是可有可無的。

十一、頻率回響範圍

人的耳朵能聽到的聲音頻率範圍是20-20000Hz,低於20Hz和高於20KHz的聲音都是人耳分辨不出來的。不過頻響範圍在50Hz到18KHz之間,應該就已經可以了,目前的MP3應該都可以到達這個頻響範圍了。不過頻響範圍與採樣率是不同的,大家不要混淆了。

十二、信噪比

信噪比即音源產生最大不失真聲音信號強度與同時發出的噪音強度之間的比率,通常以“SNR”或“S/N”表示,是衡量音箱、耳機等發音設備的一個重要參數。對於MP3來說,也是一個很關鍵的參數。“信噪比”一般用分貝(dB)為單位,信噪比越高表示音響器材的效果越好。一般而言,至少要選擇信噪比在60dB以上的產品。但目前還沒有一個正式的檢測機構來評定產品的信噪比,所以一些劣質的MP3產品說明中也標有很高的信噪比,這只能靠您自己的耳朵來驗證了。MP3在沒有播放任何音源信號時,若能聽到較為明顯的“嗡嗡”或“嘶嘶”的類似電流的聲音,說明機器的信噪比太低,不適合選購

mp3玩家交流聚集地

歡迎大家去百度貼吧_MP3玩家 吧,探討MP3、MP3購買、使用技巧
MP3玩家吧建吧時間:4月份,建吧不滿一個月,就已在百度全國“網友俱樂部”分類中排名達到238名!且短短2個月總貼數突破1萬帖!可見本吧人氣不可擋!在mp3各相關貼吧中享有較高聲譽
本吧希望給大家提供一個舒適的MP3討論環境,大家有任何MP3選購、MP3使用等MP3相關的問題和MP3使用經驗,都可以在這裡發表或提問,也希望大家和諧討論,謝謝大家的支持!
本吧聚集了眾多高手,如:齊天小寶,⑦仙道彰☆,iamthe1,藍色流星雪,Know消夜,lusan63,血之韻律,DuDuLana,airorbit本吧高手將即時為您解答問題,基本5分鐘內必有人回復~~~

熱門詞條

聯絡我們