reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Megatest MP3 přehrávačů: úvod

31.1.2005, Zdeněk Kabát, článek
Megatest MP3 přehrávačů: úvod
Obrovský potenciál kompresního formátu MP3 se dnes využívá velmi široce a na trhu se můžeme setkat s osobními přehrávači nejrůznějších vlastností. Otestovali jsme více než 20 modelů, se kterými se setkáte v průběhu týdne.
Když se objevil formát MP3, znamenalo to v oblasti digitálních multimédií malou revoluci. Do té doby běžné formáty (například WAV/PCM nebo AU/U-LAW) zabírali při srovnatelné kvalitě mnohem více místa na disku. Jedna minuta záznamu v CD kvalitě znamenala něco málo přes 10 MB. Naproti tomu stálo MP3 se svým necelým 1 MB při kvalitě „srovnatelné“ s CD.


Obr. 1 - Osobní přehrávače si oblíbil snad každý :-)

Komprese

Komprese je proces, při němž se digitální audio data z původního zdroje (nejčastěji CD) mění do komprimované podoby, tak, aby zabírala méně místa.
Existují dva přístupy ke kompresi digitální hudby. Prvním přístupem je komprese bezztrátová, pří níž jsou všechna audio data zachována. Nejpoužívanějšími bezztrátovými kodeky dneška jsou FLAC (http://flac.sourceforge.net) a Monkey's Audio (http://www.monkeysaudio.com).


Obr. 2 - Data v nekomprimované formě (WAV)
Klikněte pro zvětšení

Druhým přístupem, kterým se budeme zabývat v tomto článku, je komprese ztrátová. Při ní nejsou výsledná data stejná, jako ta, která do procesu vstupovala, nicméně zní téměř stejně. Je tomu tak proto, že v každém z kodeků je obsažen tzv. psychoakustický model, což je vlastně matematické vyjádření možností lidského sluchu. Podle tohoto modelu kodek určuje, které informace má člověk největší šanci rozlišit. Ty, které nerozliší, nebo které sice rozliší, ale již se nevejdou do komprimované podoby, pak úplně vynechá. Všeobecně lze říci, že čím menší komprese, tím větší kvalita a obráceně. Pro porovnávání velikosti komprese se zažilo porovnávání podle bitrate. Bitrate označuje průměrný počet bitů, které jsou použity na jednu vteřinu záznamu.

CBR, VBR a ABR

Tyto tři pojmy označují, jakým způsobem kodér rozděluje bitrate.
  • CBR (Constant Bitrate) znamená to, že pro každou část souboru je použit stejný počet bitů, nehledě na to, jestli je tato konkrétní část náročná, nebo ne. Výhodou je, že výsledná velikost souboru je přesně spočitatelná, což se hodí například pro streamování hudby po síti.
  • V módu ABR (Average Bitrate) se kodér přizpůsobuje náročnosti pasáže, ale zároveň se snaží dodržet průměrnou bitrate. To je technika, která zlepšuje kvalitu a zároveň má tu výhodu, že výsledná velikost souboru je stále poměrně přesně odhadnutelná.
  • VBR je zkratkou pro Variable Bitrate a znamená to, že se kodér snaží zachovávat danou kvalitu pro celou délku audio souboru. Výhodou je to, že nedochází ke kvalitativním výkyvům, nevýhodou naopak to, že výslednou velikost souboru nelze odhadnout.

Tyto tři pojmy se vážou k MP3 kodéru LAME (http://lame.sourceforge.net), který je dnes pro kódování MP3 nejpoužívanější. U Ogg Vorbis je ABR označováno jako „nominal bitrate“ a VBR jako „quality“. U WMA se rovněž setkáte s VBR a CBR, ale ještě s jednou přidanou specialitkou. Tou je dvouprůchodové kódování. Spočívá v tom, že kodér nejdříve analyzuje celý záznam, aby v druhém průchodu zvolil nejlepší možnou bitrate.

MP3

MP3, přesněji ISO-MPEG Audio Layer-3, je patentovanou technologií německého institutu Fraunhofer-Gesellschaft. V roce 1992 se tato technologie stala částí oficiálního standardu MPEG-1. Protože kodérů do MP3 existuje mnoho, přiblížíme si alespoň nejpoužívanější z nich – LAME.


Obr. 3 - MP3 ořezává vysoké frekvence příliš brzy, kvalita je nízká (MP3 VBR, ~64 kbit)
Klikněte pro zvětšení

Ten podporuje – v rámci MPEG-1 Layer 3 – rozpětí datového toku od 32 do 320 kbit a vzorkovací frekvence 32, 44.1 a 48 kHz. Asi nejužitečnější (a možná i nejdiskutovanější) funkcí, kterou disponuje, je mód „joint stereo“. Při tomto módu se nekóduje každý audio kanál zvlášť, ale kóduje se to, co mají oba společné, a to, co mají rozdílné. To samozřejmě zvyšuje kvalitu záznamu, kde se od sebe oba kanály příliš neliší. Všeobecně se doporučuje používat joint stereo při datovém toku 128 kbit a nižším. Při vyšším totiž jednak jeho přednosti nemají takovou šanci se uplatnit a jednak samotné jeho použití zvyšuje riziko slyšitelných zvukových artefaktů.

Ogg Vorbis

Ogg Vorbis je open-source kodek a cílem jeho tvůrců není nic menšího, než nahradit všechny konkurenční kodeky. A nutno dodat, že jsou na velmi dobré cestě. Ogg Vorbis kupříkladu podporuje až 256 kanálů a techniku zvanou „channel-coupling“, což je v podstatě vylepšené joint stereo. Ačkoliv je samotný kodek pod neustálým vývojem a vydání od vydání jeho kvalita stále stoupá, samotné soubory jsou zpětně kompatibilní a přehraje je tedy jakýkoliv přehrávač podporující Ogg Vorbis.


Obr. 4 - Kodér obsáhne většinu frekvencí ve slyšitelné oblasti (OGG Quality, ~64 kbit)
Klikněte pro zvětšení

WMA9

Poslední kodér z dílny Microsoftu se vyznačuje volitelným používáním dvouprůchodového kódování. Jako jediný v tomto porovnání nabízí i bezztrátovou kompresi, pravda je ale ta, že v této oblasti specializované kodeky dosahují lepších výsledků. Kromě toho je také populární mezi hudebními společnostmi díky systému ochrany písní s autorskými právy.


Obr. 5 - Stejně jako MP3 i WMA ořezává vysoké frekvence příliš brzy (WMA 2-pass VBR, 64 kbit)
Klikněte pro zvětšení

Porovnání - Ogg Vorbis v čele

Podle očekávání je nejkvalitnějším kodekem Ogg Vorbis. Největší rozdíly jsou patrné při nízkém datovém toku. Při bitrate 64 kbit se věrností reprodukce nemůže ani s MP3, ani s WMA srovnávat. MP3 produkuje velké množství artefaktů, zní velice utlumeně a celkově stojí o třídu níže. WMA je na tom již sice daleko lépe, než MP3, ale stále je patrné, že příliš brzy ořezává vysoké frekvence. Ani u Ogg Vorbis se ještě nedá hovořit o CD kvalitě, pravdou ale je, že k ní má nejblíže. CD kvalita je při tak nízkém datovém toku nedosažitelná.

Situace je však jiná při bitrate kolem 96 kbit, kdy při běžném poslechu nelze rozeznat Ogg Vorbis od CD. I WMA si při tomto bitrate vede velice dobře, ořezává sice ještě frekvence v uchem rozlišitelném pásmu, ale při běžném poslechu si uživatel rozdílu mezi WMA a CD nevšimne. MP3 je na tom samozřejmě o dost hůře, pro vytvoření dojmu kvality CD potřebuje datový tok alespoň 160 kbit.

Porovnání času potřebného k převodu tříminutové písně
Ikona Odkaz na databázi
CBR, 64 kbit
VBR, ~64 kbit
CBR, 128 kbit
VBR, ~128 kbit
WMA (2-pass)
0:16
0:10
0:18
0:12
OGG
0:50
0:21
0:57
0:20
MP3
0:11
0:11
0:15
0:15
Tab. 1 - Srovnání času potřebného k převedení skladby do různých formátů
(testováno na procesoru Pentium M 1,5GHz s 512MB paměti)

Otázka, proč je MP3 nejrozšířenější, je nasnadě. Jednak je to proto, že až donedávna to byl jediný formát podporovaný výrobci hardware, a jednak proto, že jsou na něj lidé jednoduše zvyklí. Za dnešní situace se do MP3 vyplatí konvertovat soubory právě tehdy, když chcete mít jistotu největší „kompatibility“. Pro ostatní případy dnes existují rozumnější alternativy právě v podobě Ogg Vorbis a WMA.

Za tuto kapitolu o kompresních formátech včetně natípání grafů a naměření doby komprese hudby bych chtěl poděkovat Markovi Hnilicovi (http://www.mbox.wz.cz/)
reklama