Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

nVidia GeForce 6200 s TurboCache

7.1.2005, Zdeněk Kabát, článek
nVidia GeForce 6200 s TurboCache
S menším zpožděním bychom Vám rádi trochu přiblížili novinku, se kterou přišla nedávno nVidia, a to technologii TurboCache. Je implementována v grafických kartách GeForce 6200 a zajišťuje, podobně jako ATi HyperMemory, sdílení systémové paměti přes rychlou sběrnici PCI Express. Chcete znát detaily?
Kapitoly článku:
TurboCache, HyperMemory a... AGP?

Jak jsem již naznačil, celá technologie TurboCache je velmi podobná HyperMemory od ATi a v úplné podstatě jde o využívání systémové paměti pro potřeby grafické karty. V tomto místě je ale vhodné podotknout, že se nejedná o nic nového pod sluncem, protože v podstatě všechny AGP karty fungují podobně (viz AGP Aperture Size v BIOSu). Důvod, proč se o tomto systému dříve nemluvilo, byl jeho pomalý vzestup. Naproti tomu TurboCache a HyperMemory jsou ukázkovými příklady využití marketingu - technologiím se dají vznešená jména, zákazníkům namluvíte, že se bez toho neobejdou, a prodejnost je rázem vyšší.


Obr. 4 - Architektura TurboCache

Ovšem přeci jen se TC a HM od dřívější funkce liší a totiž tím, že využívají mnohem rychlejší sběrnici PCI Express. Zatímco AGP si musela postačit s propustností 2,1 GB/s, PCI Express x16 nabízí 4 GB/s každým směrem, celkem tedy 8 GB/s. Ve srovnání s šířkou pásma low-endových karet, která se pohybuje kolem 3-7 GB/s, je to hodnota mnohem využitelnější.

Mezi AGP a PCI Express je ještě z hlediska ukládání grafických dat do systémové paměti jeden zásadní rozdíl. Zatímco AGP si do paměti na desce ukládala jen textury, které z ní byly načítány, GeForce 6200 TurboCache dokáže do RAM i zapisovat. Znamená to, že veškeré manipulace s daty, ať už se jedná o barvu pixelu, souřadnice vrcholu apod., mohou být průběžně pozměňovány.

Velikost paměti
Na kartě
Sběrnice
Propustnost
Cena
128MB
16MB
32-bit
8,0 + 2,8 GB/s
$79
128MB
32MB
2x 32-bit
8,0 + 5,6 GB/s
$99
256MB
64MB
?
8,0 + ? GB/s
$129
Tab. 2 - Jednotlivé verze GeForce 6200 TurboCache

Podívejme se ještě, kolik si TurboCache ze systémové paměti ukousne. V tabulce vidíte, jaké verze se plánují a logicky z ní lze vyčíst i spotřeba systémové paměti. První, nejlevnější verze, alokuje celkem 128-16 = 112MB RAM, analogicky pak druhá a třetí 96MB, resp. 192MB paměti. To je poměrně dost a nVidia doporučuje pro GeForce 6200 TC alespoň 512MB paměti.

Data, ke kterým je třeba rychle přistupovat, jsou samozřejmě ukládána do lokálního frame bufferu, zatímco textury a další jsou zapisovány do systémové paměti. Právě využití vlastní paměti pro menší množství důležitých dat vysloužilo technologii označení TurboCache.

Cesta je... užší než se zdá

Tak tedy PCI Express dokáže přenést každou vteřinu celkem 8GB dat. Společnost nVidia uvádí, že propustnost 16MB verze GeForce 6200, u které přistupuje k jednomu paměťovému čipu 32-bit sběrnicí, je 8,0 + 2,4 (32-bit x 700MHz) = 10,4 GB/s, zatímco šířka pásma 32MB verze (dva 16MB čipy) dává dohromady 8,0 + 5,6 (2 x 32-bit x 700MHz) = 13,6 GB/s.


Obr. 5 - Teoretické propustnosti

Ale co systémová paměť? Vezměme v úvahu průměrný systém, který obsahuje 512MB dvoukanálové paměti DDR400. Její propustnost je celkem 400MHz x 64-bit x 2 = 6,4 GB/s, tedy o něco méně, než nám zvládá PCI-E x16. A to je navíc jen teoretická propustnost při nulovém zatížení paměťové sběrnice. A věřte, že procesor, pevné disky, síťová karta apod. si také něco ukrojí.

... a dlouhá

Druhým problémem je, že přístup do systémové paměti trvá mnohem déle než do lokální paměti. Je to logické, zatímco mezi GPU a frame bufferem je jen rychlá sběrnice (jeden "skok"), na cestě k RAM musí data překonat několik překážek. Mluvíme-li o Pentiu 4, putují data po sběrnici PCI Express do NorthBridge a tam odtud do paměti (dva skoky). U Athlonu 64 je situace ještě složitější: GPU -> (PCI-E) -> čipset -> (HyperTransport) -> CPU -> RAM, skoky jsou tedy tři. Tento parkur má pak za následek zvýšení latence.