TurboCache, HyperMemory a... AGP?
Jak jsem již naznačil, celá technologie TurboCache je velmi podobná HyperMemory od ATi a v úplné podstatě jde o využívání systémové paměti pro potřeby grafické karty. V tomto místě je ale vhodné podotknout, že se nejedná o nic nového pod sluncem, protože v podstatě všechny AGP karty fungují podobně (viz AGP Aperture Size v BIOSu). Důvod, proč se o tomto systému dříve nemluvilo, byl jeho pomalý vzestup. Naproti tomu TurboCache a HyperMemory jsou ukázkovými příklady využití marketingu - technologiím se dají vznešená jména, zákazníkům namluvíte, že se bez toho neobejdou, a prodejnost je rázem vyšší.

Obr. 4 - Architektura TurboCache
Ovšem přeci jen se TC a HM od dřívější funkce liší a totiž tím, že využívají mnohem rychlejší sběrnici PCI Express. Zatímco AGP si musela postačit s propustností 2,1 GB/s, PCI Express x16 nabízí 4 GB/s každým směrem, celkem tedy 8 GB/s. Ve srovnání s šířkou pásma low-endových karet, která se pohybuje kolem 3-7 GB/s, je to hodnota mnohem využitelnější.
Mezi AGP a PCI Express je ještě z hlediska ukládání grafických dat do systémové paměti jeden zásadní rozdíl. Zatímco AGP si do paměti na desce ukládala jen textury, které z ní byly načítány, GeForce 6200 TurboCache dokáže do RAM i zapisovat. Znamená to, že veškeré manipulace s daty, ať už se jedná o barvu pixelu, souřadnice vrcholu apod., mohou být průběžně pozměňovány.
Podívejme se ještě, kolik si TurboCache ze systémové paměti ukousne. V tabulce vidíte, jaké verze se plánují a logicky z ní lze vyčíst i spotřeba systémové paměti. První, nejlevnější verze, alokuje celkem 128-16 = 112MB RAM, analogicky pak druhá a třetí 96MB, resp. 192MB paměti. To je poměrně dost a nVidia doporučuje pro GeForce 6200 TC alespoň 512MB paměti.
Data, ke kterým je třeba rychle přistupovat, jsou samozřejmě ukládána do lokálního frame bufferu, zatímco textury a další jsou zapisovány do systémové paměti. Právě využití vlastní paměti pro menší množství důležitých dat vysloužilo technologii označení TurboCache.
Cesta je... užší než se zdá
Tak tedy PCI Express dokáže přenést každou vteřinu celkem 8GB dat. Společnost nVidia uvádí, že propustnost 16MB verze GeForce 6200, u které přistupuje k jednomu paměťovému čipu 32-bit sběrnicí, je 8,0 + 2,4 (32-bit x 700MHz) = 10,4 GB/s, zatímco šířka pásma 32MB verze (dva 16MB čipy) dává dohromady 8,0 + 5,6 (2 x 32-bit x 700MHz) = 13,6 GB/s.

Obr. 5 - Teoretické propustnosti
Ale co systémová paměť? Vezměme v úvahu průměrný systém, který obsahuje 512MB dvoukanálové paměti DDR400. Její propustnost je celkem 400MHz x 64-bit x 2 = 6,4 GB/s, tedy o něco méně, než nám zvládá PCI-E x16. A to je navíc jen teoretická propustnost při nulovém zatížení paměťové sběrnice. A věřte, že procesor, pevné disky, síťová karta apod. si také něco ukrojí.
... a dlouhá
Druhým problémem je, že přístup do systémové paměti trvá mnohem déle než do lokální paměti. Je to logické, zatímco mezi GPU a frame bufferem je jen rychlá sběrnice (jeden "skok"), na cestě k RAM musí data překonat několik překážek. Mluvíme-li o Pentiu 4, putují data po sběrnici PCI Express do NorthBridge a tam odtud do paměti (dva skoky). U Athlonu 64 je situace ještě složitější: GPU -> (PCI-E) -> čipset -> (HyperTransport) -> CPU -> RAM, skoky jsou tedy tři. Tento parkur má pak za následek zvýšení latence.
Jak jsem již naznačil, celá technologie TurboCache je velmi podobná HyperMemory od ATi a v úplné podstatě jde o využívání systémové paměti pro potřeby grafické karty. V tomto místě je ale vhodné podotknout, že se nejedná o nic nového pod sluncem, protože v podstatě všechny AGP karty fungují podobně (viz AGP Aperture Size v BIOSu). Důvod, proč se o tomto systému dříve nemluvilo, byl jeho pomalý vzestup. Naproti tomu TurboCache a HyperMemory jsou ukázkovými příklady využití marketingu - technologiím se dají vznešená jména, zákazníkům namluvíte, že se bez toho neobejdou, a prodejnost je rázem vyšší.

Obr. 4 - Architektura TurboCache
Ovšem přeci jen se TC a HM od dřívější funkce liší a totiž tím, že využívají mnohem rychlejší sběrnici PCI Express. Zatímco AGP si musela postačit s propustností 2,1 GB/s, PCI Express x16 nabízí 4 GB/s každým směrem, celkem tedy 8 GB/s. Ve srovnání s šířkou pásma low-endových karet, která se pohybuje kolem 3-7 GB/s, je to hodnota mnohem využitelnější.
Mezi AGP a PCI Express je ještě z hlediska ukládání grafických dat do systémové paměti jeden zásadní rozdíl. Zatímco AGP si do paměti na desce ukládala jen textury, které z ní byly načítány, GeForce 6200 TurboCache dokáže do RAM i zapisovat. Znamená to, že veškeré manipulace s daty, ať už se jedná o barvu pixelu, souřadnice vrcholu apod., mohou být průběžně pozměňovány.
Velikost paměti | Na kartě | Sběrnice | Propustnost | Cena |
128MB | 16MB | 32-bit | 8,0 + 2,8 GB/s | $79 |
128MB | 32MB | 2x 32-bit | 8,0 + 5,6 GB/s | $99 |
256MB | 64MB | ? | 8,0 + ? GB/s | $129 |
Tab. 2 - Jednotlivé verze GeForce 6200 TurboCache
Podívejme se ještě, kolik si TurboCache ze systémové paměti ukousne. V tabulce vidíte, jaké verze se plánují a logicky z ní lze vyčíst i spotřeba systémové paměti. První, nejlevnější verze, alokuje celkem 128-16 = 112MB RAM, analogicky pak druhá a třetí 96MB, resp. 192MB paměti. To je poměrně dost a nVidia doporučuje pro GeForce 6200 TC alespoň 512MB paměti.
Data, ke kterým je třeba rychle přistupovat, jsou samozřejmě ukládána do lokálního frame bufferu, zatímco textury a další jsou zapisovány do systémové paměti. Právě využití vlastní paměti pro menší množství důležitých dat vysloužilo technologii označení TurboCache.
Cesta je... užší než se zdá
Tak tedy PCI Express dokáže přenést každou vteřinu celkem 8GB dat. Společnost nVidia uvádí, že propustnost 16MB verze GeForce 6200, u které přistupuje k jednomu paměťovému čipu 32-bit sběrnicí, je 8,0 + 2,4 (32-bit x 700MHz) = 10,4 GB/s, zatímco šířka pásma 32MB verze (dva 16MB čipy) dává dohromady 8,0 + 5,6 (2 x 32-bit x 700MHz) = 13,6 GB/s.

Obr. 5 - Teoretické propustnosti
Ale co systémová paměť? Vezměme v úvahu průměrný systém, který obsahuje 512MB dvoukanálové paměti DDR400. Její propustnost je celkem 400MHz x 64-bit x 2 = 6,4 GB/s, tedy o něco méně, než nám zvládá PCI-E x16. A to je navíc jen teoretická propustnost při nulovém zatížení paměťové sběrnice. A věřte, že procesor, pevné disky, síťová karta apod. si také něco ukrojí.
... a dlouhá
Druhým problémem je, že přístup do systémové paměti trvá mnohem déle než do lokální paměti. Je to logické, zatímco mezi GPU a frame bufferem je jen rychlá sběrnice (jeden "skok"), na cestě k RAM musí data překonat několik překážek. Mluvíme-li o Pentiu 4, putují data po sběrnici PCI Express do NorthBridge a tam odtud do paměti (dva skoky). U Athlonu 64 je situace ještě složitější: GPU -> (PCI-E) -> čipset -> (HyperTransport) -> CPU -> RAM, skoky jsou tedy tři. Tento parkur má pak za následek zvýšení latence.