MPEG于1988年成立,是為數(shù)字音/視頻制定壓縮標準的專家組,目前已擁有300多名成員,包括IBM、SUN、BBC、NEC、INTEL、AT&T等世界知名公司。MPEG組織最初得到的授權是制定用于“活動圖像”編碼的各種標準,隨后擴充為“及其伴隨的音頻”及其組合編碼。MPEG能夠比其他算法提供更好的壓縮比,最高可達200:1。更重要的是,MPEG在提供高壓縮比的同時,對數(shù)據(jù)的損失很小。MPEG視頻壓縮編碼包括了MPEG-1、MPEG-2、MPEG-4、MPEG-7、MPEG-21。MPEG-1即俗稱的VCD制式,MPEG-2則為DVD所采用,MPEG-4是為交互式多媒體通訊制定得壓縮標準,MPEG-7是為互聯(lián)網(wǎng)視頻檢索制定的壓縮標準,MPEG-21側重于支持大范圍網(wǎng)絡的各種設備可以透明地訪問各種多媒體資源。由于MPEG-7及MPEG-21標準重點已經(jīng)不在壓縮方面,不在本文討論范圍。
a) MPEG-1
1992年推出的MPEG-1用于傳輸1.5Mbps數(shù)據(jù)傳輸率的數(shù)字存儲媒體運動圖像及其伴音的編碼。它包括五個部分,第一部分(系統(tǒng)部分)說明了如何根據(jù)第二部分(視頻部分)以及第三部分(音頻部分)的規(guī)定,對音頻和視頻進行復合編碼;第四部分(一致性部分)說明了檢驗解碼器或編碼器的輸出比特流符合前三部分規(guī)定的過程;第五部分是用C語言實現(xiàn)編碼和解碼器的參考軟件。MPEG-1以其高效的壓縮技術和較為滿意的圖像質量成為紅極一時的家庭化VCD的基礎。
b) MPEG-2
1995年推出的MPEG-2圖像壓縮的原理是利用了圖像中的兩種特性:空間相關性和時間相關性。這兩種相關性使得圖像中存在大量的冗余信息。如果我們能將這些冗余信息去除,只保留少量非相關信息進行傳輸,就可以大大節(jié)省傳輸頻帶。而接收機利用這些非相關信息,按照一定的解碼算法,可以在保證一定的圖像質量的前提下恢復原始圖像。
MPEG-2,以其更高的像素分辨率,大大提高了視頻質量,為DVD(高密度數(shù)字視頻光盤),特別是HDTV(高清晰度電視)、DAB(數(shù)字音頻廣播) 等廣播級的數(shù)字電視的編碼和傳送的迅速推廣提供了基礎,并大大推進了許多基于視頻的試驗性及商業(yè)性服務。MPEG-2標準是針對SDTV和HDTV在各種應用下的壓縮方案和系統(tǒng)層的詳細規(guī)定,編碼碼率從3Mbps到100Mbps,能夠提供廣播級的視頻和CD級的音質。
根據(jù)MPEG-2標準,不同廠家的編碼器雖然可以采用不同算法,但產生的MPEG-2碼流都必須遵守相同的語法和解碼規(guī)則,任何支持同樣或更高級別的MPEG-2格式的解碼器都可以解碼。這一點保證在整個信號數(shù)據(jù)鏈路中的設備互換性,解決多種視頻數(shù)據(jù)格式并存帶來的許多問題,這在開放性網(wǎng)絡設備構架中是非常重要。全球正在開始實施的數(shù)字電視廣播傳輸?shù)膰H標準有三個:美國的AISC、歐洲的DVB及日本的ISDB。它們在傳送視音頻流時都采用MPEG-2的傳輸流。MPEG-2 IBP幀方式由于采用幀間壓縮,大大降低了碼率,已在傳輸、播出中獲得了廣泛應用,并為國際所公認。
MPEG-2不是MPEG-1的簡單升級,MPEG-2在系統(tǒng)和傳送方面作了更加詳細的規(guī)定和進一步的完善。MPEG-2解決了MPEG-1不能滿足的日益增長的多媒體應用對分辨率和傳輸率的要求,支持固定比特率傳送、可變比特率傳送、隨機訪問、分級編碼、比特流編輯等功能。
c) MPEG-4
1998年制定的MPEG-4第一版及1999年推出 的MPEG-4第二版 被視為第一個真正意義上的多媒體標準。它以客觀對像作為編碼形式,實現(xiàn)多媒體交互應用。它在移動通信、視頻交互及計算機圖片2D/3D計算處理以及專業(yè)數(shù)字視頻等方面起著決策性作用。
MPEG4于1998 年11月公布。MPEG-4標準主要應用于視像電話(Video Phone),視像電子郵件(Video Email)和電子新聞(Electronic News)等,其傳輸速率要求較低,在4800-64000bits/sec之間,分辨率為176X144。MPEG-4利用很窄的帶寬,通過幀重建技術,壓縮和傳輸數(shù)據(jù),以求以最少的數(shù)據(jù)獲得最佳的圖象質量。
MPEG-1、MPEG-2都是采用傳統(tǒng)壓縮編碼技術,著眼于圖像信號的統(tǒng)計特性來設計編碼器,屬于波形編碼的范疇。傳統(tǒng)壓縮編碼方案把視頻序列按時間先后分為一系列幀,每一幀圖像又分成宏塊以進行運動補償和編碼,這種編碼方案存在以下缺陷:
·在高壓縮比的情況下會出現(xiàn)嚴重的“馬賽克效應”。
·不能對圖像內容進行訪問、編輯和回放 。
·未充分利用HVS(人類視覺系統(tǒng))特性。
MPEG-4則是基于對象的新型壓縮編碼技術,它利用了人眼視覺特性,適應了多媒體信息的應用由播放型轉向基于內容的訪問、檢索及操作的發(fā)展趨勢,更適于交互AV服務以及遠程監(jiān)控。
AV對象(AVO,Audio Visual Object)是MPEG-4為支持基于內容編碼而提出的重要概念。對象是指在一個場景中能夠訪問和操縱的實體。在MPEG-4中所見的視音頻已不再是過去MPEG-1、MPEG-2中圖像幀的概念,而是一個個視聽場景(AV場景),這些不同的AV場景由不同的AV對象組成。AV對象是聽覺、視覺、或者視聽內容的表示單元,可以是自然的或合成的聲音、圖像。因此MPEG-4標準的基本內容就是對AV對象進行高效編碼、組織、存儲與傳輸。AV對象的提出,使多媒體通信具有高度交互及高效編碼的能力,AV對象編碼就是MPEG-4的核心編碼技術。從而實現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對象和內容的現(xiàn)代編碼的轉變,因而引領著新一代智能圖像編碼的發(fā)展潮流。
在具體的技術方面,MPEG-4除采用第一代的視頻編碼的核心技術,如變換編碼、運動估計與運動補償、量化、熵編碼外,還提出了一些新的關鍵技術。這些新的技術包括:
·對象提取技術-MPEG-4實現(xiàn)基于內容交互的首要任務就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應編碼方法,以實現(xiàn)高效壓縮。
·VOP技術-VOP(視頻對象平面)是視頻對象在某一時刻的采樣。VOP技術不僅克服了方塊效應,而且提高了壓縮比,實現(xiàn)了基于內容的交互。
·編碼可分級技術-指碼率的可調整性,即視頻數(shù)據(jù)只壓縮一次,卻能以多個幀率、空間分辨率或視頻質量進行解碼,從而可支持多種類型用戶的各種不同應用要求。
MPEG系列標準中的每個標準都是建立在前面標準的基礎之上的。MPEG-1和MPEG-2是目前成熟的廣泛應用的標準。多媒體數(shù)據(jù)壓縮編碼的發(fā)展趨勢是基于內容的壓縮。MPEG-4第一次提出了基于內容、基于對象的壓縮編碼思想,它要求對自然或合成視聽對象作更多分析甚至是理解,這正是信息處理的高級階段,因而代表了現(xiàn)代數(shù)據(jù)壓縮編碼技術的發(fā)展方向。MPEG-4作為一個開放的多媒體標準出現(xiàn)在市場上的確受到了廣大的矚目,所以為眾多的廠商所采用。