reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Technologie: Architektura 3Dlabs P10

2.7.2002, Zdeněk Kabát, článek
Technologie: Architektura 3Dlabs P10
Díky vesměs kladným ohlasům na Hyper-Threading jsme se rozhodli pokračovat v rubrice Technologie. Jejím dalším tématem jistě potěšíme všechny příznivce 3D grafiky, protože zde popisujeme architekturu grafického čipu P10. V článku naleznete také informace o 3DLabs Wildcat VP, která je tímto čipem vybavena a která byla vypuštěna minulý týden.
Kapitoly článku:

Úvod



Evoluce je nedílnou součástí počítačového světa. V grafickém světě probíhala od CGA, EGA, VGA až po SVGA a probíhá dále. Počet barev se ustálil na dostačujících 32 bitech (přestože ATI R300 má být vybavena 128-bit, viz zde) a nyní spěje vývoj hlavně k jednomu cíli - plné programovatelnosti. Výrobci grafických čipů se snaží, aby se GPU svou flexibilitou přirovnal k CPU, což je jasně vidět na novém programovacím jazyce Cg od nVidia (článek zde). Tento trend nastolila společnost nVidia svým grafickým čipem GeForce3 (nFinite engine) a pokračuje dále. Prostředkem, který dokáže spoutat sílu shader jednotek, se stala DirectX8. Zatím není příliš využita, ale to se za krátko změní příchodem aplikací a her, jež dokáží z DX8 vytěžit více.

Před příchodem 3D akcelerátorů prováděl CPU kromě úkonů jemu přidělených (fyzikální výpočty, AI) také renderování. Přechod k nové technologii byl tedy více než nutný. Grafickému jádru byla pak přidělena dostatečná šířka paměťového pásma, aby si renderování samo provádělo a CPU byl uvolněn od starého břemene. Ale jak se ukázalo, programátoři se nechtěli smířit s pevnými funkcemi, a proto přišly dnešní programovatelné 3D akcelerátory. Přesto není svoboda v programování GPU jako Radeon 8500 a GeForce4 neomezená, protože některé grafické pipeline mají stále pevné funkce. Tomu se rozhodla udělat přítrž společnost 3DLabs se svou plně programovatelnou pipeline.

Společnost 3DLabs nyní přichází s řešením nejen pro profesionální grafiku. Aby se nové technologie lépe prosadily na trhu, společnost dokonce souhlasila se svým prodejem pod křídla Creative Labs. Předchozí řada profesionálních grafických karet od 3DLabs byla určena výhradně pro profesionální sektor, ale nyní vstoupí společnost s čipem P10 i do konzumní části. Označení GPU (Graphics Processing Unit) se zdálo 3DLabs "zastaralé", a tak se nyní setkáváme s novým pojmem - VPU, Visual Processing Unit.

V úvodu bych ještě rád zmínil připravovaný operační systém od Microsoftu, na který se budu v článku odkazovat, nazvaný Longhorn. Toto uživatelské rozhraní další generace nutí výrobce GPU vytvářet takové grafické čipy, které převezmou prakticky všechny typické funkce správy aplikací v oknech. Jinými slovy se každé okno na ploše stane 3D texturou, ať je to hra, video či textový editor. Nyní se o správu těchto aplikací stará CPU a Microsoft se mu snaží ulevit tím, že starosti o GUI (Graphics User Interface - grafické uživatelské rozhraní) převede na GPU. Doufejme, že to MS nepřežene s nároky :-)


Specifikace



Podívejme se nejdříve na specifikace GPU 3DLabs P10 a porovnejme je s nVidia NV25 (GeForce4) a ATI R200 (Radeon 8500):
  • Počet tranzistorů: 76 milionů (NV25 - 63 mil., R200 - 60 mil.)
  • 0,15 mikronová výrobní technologie
  • 256-bitové sběrnice DDR (NV25, R200 - 128-bit)
  • Šířka paměťového pásma: 20GB/s (NV25, R200 - 10GB/s)
  • 8 simultánních textur
  • 8-cestný multisampling
  • Vertex procesory: 16 SIMD
  • Texturové procesory: 128 SIMD, programovatelné
  • Antialiasing: 64 SIMD procesorů, programovatelné, multisample AA
  • Zpracování obrazu: 64 SIMD procesorů
  • Povrchy: N-patches, Bezier, B-Splines, NURBS
  • 16 GB virtuální paměti
  • 10-bitové DAC barvy
  • Balení čipu: 860-ball HSBGA
  • AGP 4x
  • Plná podpora DX8 vertex a pixel shaderů
  • 200 Gflops, 1,2 TeraOp, 60M polygonů/sec, přes 1 Gpixel/sec

Pozn.: Tato architektura hraje významnou roli v celé pipeline. Proto až na následující stránce použiji výraz procesory, znamená to právě tyto elementy procesorů uvedené u architektury SIMD. Ve skutečnosti se na grafické kartě 272 procesorů opravdu nenachází :-)

Zde není prakticky co dodávat - architektura je velice působivá; počet tranzistorů, 256-bitová paměť atd. nenechají nikoho na pochybách. Na druhou stranu tak vzroste velikost čipu, hlavně kvůli 256-bitové sběrnici. Aby mohla být propustnost skutečně plných 20GB/s, musí paměť běžet na taktovací frekvenci alespoň 312,5MHz (625MHz DDR), což se s ohledem na 325MHz u GF4 zdá být docela reálné.

Možná bychom se ale mohli zmínit o architektuře SIMD (Single-Instruction Stream Multiple-Data Stream). Tato architektura dokáže manipulovat s velkými vektory a maticemi v krátkém čase. Síla této technologie se pozná, když je počet elementů procesoru roven velikosti vektoru. V této situaci může sčítání a násobení vektorových elementů probíhat současně (paralelně). I když je rozměr vektoru větší než dostupný počet elementů procesoru, zrychlení je v porovnání s postupným algoritmem (zpracovávání dat sériově) nezměrné. Jsou dva druhy architektury SIMD, ale podíváme se pouze na Pipelined SIMD.

Pipelined SIMD se skládá z pipeline aritmetických jednotek a ze sdílené paměti. Pipeline bere různé řady instrukcí a provádí všechny operace určené aritmetické jednotce (ALU). K využití pipeline musí být data k vyhodnocení uložena v jiných paměťových modulech, aby mohly být zpracovávány co nejrychleji. Hlavním účelem architektury SIMD je tedy paralelní a rychlé zpracovávání dat.
reklama