Převod obrazu do číslicové formy – digitalizace
22.3.2001, Emil Pavelka, zpráva
Abychom mohli analogový signál zpracovávat pomocí našeho počítače, musíme jej digitalizovat. Prvním krokem který absolvujeme je vzorkování.
Abychom mohli analogový signál zpracovávat pomocí našeho počítače, musíme jej digitalizovat. Prvním krokem který absolvujeme je vzorkování. Tady také dochází k prvním chybám, jejichž velikost je závislá na vzorkovací frekvenci, která musí být pro dosažení dobré kvality alespoň dvojnásobná, oproti nejvyšší modulační frekvenci. Jak takové vzorkování probíhá je patrné z následujícího obrázku.
Modrý je analogový signál a červené jsou vzorkovací impulsy. Při řádkové frekvenci 15625 Hz trvá jeden řádek 64 mikrosekund, z čehož viditelná obrazová část má 52 mikrosekund. Tato část je přenášena jako analogová informace. Při převodu tedy závisí na vzorkovací frekvenci. Aneb - kolik vzorků sejmeme a zpracujeme za 52 mikrosekund, tolik budeme mít vertikálních řádků.
Další chyba nám vzniká zaokrouhlováním. Máme-li sejmutou informaci uložit například do 8-mi bitů, pak máme k dispozici 256 úrovní. Pokud se tedy hodnota nachází někde mezi dvěma úrovněmi, zaokrouhlíme ji. To, co může tahle operace udělat se zdrojem, si můžete prohlédnout na obrázcích plynulého přechodu.
Věci, které jsme si řekli v závěru části o barvách, nám byly potřebné k tomu, abychom mohli následně pochopit co pro nás znamená, setkáme-li se například se zápisem o vzorkování 4:4:4, 4:2:2, 4:2:0 nebo 4:1:1 . Jedná se o poměry vzorkování jasové složky k rozdílovým barevným složkám. 4:4:4 není vzhledem k objemu dat pro obyčejné smrtelníky. PAL (i DV PAL, DVD a hlavní profil MPEG2) používá 4:2:0, kde jsou barvonosné složky vzorkovány poloviční frekvencí, než jasová složka a ještě vždy ob řádek vynechávány. Je to nejméně intuitivní označení, protože to na první pohled vypadá jako čtyři vzorky jasu, dva R-Y a žádný B-Y, což by nešlo. Používá se zde stejně vzorků jako u 4:1:1, které používá SECAM, ale výsledný dojem z obrazu se jeví lepší (to ovšem může být subjektivní). Tady si také můžeme všimnout, že při převodu mezi PALem a SECAMem dojde ke ztrátě (nebo chybě při dopočítání) u poloviny barvonosných informací.
Karty pro zachytávání videa provádějí prvotní digitalizaci do některého druhu YUV formátu. Nejrozšířenější jsou YUY2 (nVidia pro něj používá označení YUNV) a UYVY (nVidia používá UYNV) a představují vzorkování 4:2:2. Po digitalizaci tyto karty video dále převedou na RGB, nebo pošlou hardwarovému či softwarovému kodeku ke kompresi. V dnešní době silných počítačů se u těchto karet často vyplatí implicitně používané kodeky obejít, ale to už se blížíme ke kompresi videosignálu.
Jak jsme si řekli, tak karty pro digitalizaci videa, digitalizují vstupní signál na některý z rodiny YUV formátů. Ten se potom převádí na RGB a nebo dále komprimuje. Proč se komprimuje? Karty pro zachytávání videa nám umožňují ukládat video v rozlišení maximálně 704x576 (většina analogových) nebo 720x576 (digitální, ale ty nás teď nevzrušují).
Vezmeme-li si bitmapový, nekomprimovaný obrázek v barevné hloubce 24bit, pak na uložení obrázků představujících jednu sekundu potřebujeme následující velikost prostoru: 704x576x24/8x25=304128000 bytů. To je cca 30 MB, tedy 1.8 GB za minutu. Takový datový tok by byl dost šílený a i požadovaný prostor by tomu odpovídal. Tedy práce pro diskové pole. Vezmeme-li v úvahu vzorkování 4:2:2 (YUY2), pak vidíme, že třetinu nároků můžeme odepsat. Potřebujeme tedy uložit datový tok 20 MB za sekundu, čímž zabereme za každou minutu 1.2 GB místa na disku. To je sice o dost veselejší, ale stále velmi problematické.
Takže se to pokusíme ještě zmenšit...
Modrý je analogový signál a červené jsou vzorkovací impulsy. Při řádkové frekvenci 15625 Hz trvá jeden řádek 64 mikrosekund, z čehož viditelná obrazová část má 52 mikrosekund. Tato část je přenášena jako analogová informace. Při převodu tedy závisí na vzorkovací frekvenci. Aneb - kolik vzorků sejmeme a zpracujeme za 52 mikrosekund, tolik budeme mít vertikálních řádků.
Další chyba nám vzniká zaokrouhlováním. Máme-li sejmutou informaci uložit například do 8-mi bitů, pak máme k dispozici 256 úrovní. Pokud se tedy hodnota nachází někde mezi dvěma úrovněmi, zaokrouhlíme ji. To, co může tahle operace udělat se zdrojem, si můžete prohlédnout na obrázcích plynulého přechodu.
Věci, které jsme si řekli v závěru části o barvách, nám byly potřebné k tomu, abychom mohli následně pochopit co pro nás znamená, setkáme-li se například se zápisem o vzorkování 4:4:4, 4:2:2, 4:2:0 nebo 4:1:1 . Jedná se o poměry vzorkování jasové složky k rozdílovým barevným složkám. 4:4:4 není vzhledem k objemu dat pro obyčejné smrtelníky. PAL (i DV PAL, DVD a hlavní profil MPEG2) používá 4:2:0, kde jsou barvonosné složky vzorkovány poloviční frekvencí, než jasová složka a ještě vždy ob řádek vynechávány. Je to nejméně intuitivní označení, protože to na první pohled vypadá jako čtyři vzorky jasu, dva R-Y a žádný B-Y, což by nešlo. Používá se zde stejně vzorků jako u 4:1:1, které používá SECAM, ale výsledný dojem z obrazu se jeví lepší (to ovšem může být subjektivní). Tady si také můžeme všimnout, že při převodu mezi PALem a SECAMem dojde ke ztrátě (nebo chybě při dopočítání) u poloviny barvonosných informací.
Karty pro zachytávání videa provádějí prvotní digitalizaci do některého druhu YUV formátu. Nejrozšířenější jsou YUY2 (nVidia pro něj používá označení YUNV) a UYVY (nVidia používá UYNV) a představují vzorkování 4:2:2. Po digitalizaci tyto karty video dále převedou na RGB, nebo pošlou hardwarovému či softwarovému kodeku ke kompresi. V dnešní době silných počítačů se u těchto karet často vyplatí implicitně používané kodeky obejít, ale to už se blížíme ke kompresi videosignálu.
Jak jsme si řekli, tak karty pro digitalizaci videa, digitalizují vstupní signál na některý z rodiny YUV formátů. Ten se potom převádí na RGB a nebo dále komprimuje. Proč se komprimuje? Karty pro zachytávání videa nám umožňují ukládat video v rozlišení maximálně 704x576 (většina analogových) nebo 720x576 (digitální, ale ty nás teď nevzrušují).
Vezmeme-li si bitmapový, nekomprimovaný obrázek v barevné hloubce 24bit, pak na uložení obrázků představujících jednu sekundu potřebujeme následující velikost prostoru: 704x576x24/8x25=304128000 bytů. To je cca 30 MB, tedy 1.8 GB za minutu. Takový datový tok by byl dost šílený a i požadovaný prostor by tomu odpovídal. Tedy práce pro diskové pole. Vezmeme-li v úvahu vzorkování 4:2:2 (YUY2), pak vidíme, že třetinu nároků můžeme odepsat. Potřebujeme tedy uložit datový tok 20 MB za sekundu, čímž zabereme za každou minutu 1.2 GB místa na disku. To je sice o dost veselejší, ale stále velmi problematické.
Takže se to pokusíme ještě zmenšit...