reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Nvidia Tesla K10/20: světový rekord na krku

2.7.2012, Petr Štefek, technologie
Nvidia Tesla K10/20: světový rekord na krku
Nvidia pustila do světa informace o chystaných akcelerátorech produktové řady Tesla. Krom známého jádra GK104 se uvedl také monstrózní čip GK110 se 7 miliardami tranzistorů a vynikajícím výkonem pro GPGPU.
Kapitoly článku:
  1. Nvidia Tesla K10 – lehká váha
  2. Nvidia Tesla K20 - vše, na co jsme čekali
Nvidia bez velkého marketingu uvedla nového zástupce svých profesionálních karet TESLA, které se profilují pro profesionální aplikace a využití síly svého paralelního výpočetního procesoru (GPU). I zarytí fanoušci Nvidie snad nebudou polemizovat, že v březnu uvedené jádro GK104 (GeForce GTX 680) je určeno spíše pro hry, než pro profesionální využití. Zásluhu na tom má především absence hardwarového schedulingu a slabý výkon v double-precision (FP64) výpočtech. O to větším překvapením je, že Nvidia uvedla svůj nový produkt pod označením Tesla K10 právě na tomto GPU. V přípravě ale má také vyšší model s označením K20, který by měl splnit očekávání i těch nejnáročnějších.




Produktová mapa Nvidia Tesla


Profesionální Tesla K10 ale má jednu zásadní vlastnost, jedná se totiž o dual GPU kartu, která vychází z high-endového herního modelu GeForce GTX 690. V minulosti byla Tesla typická tím, že disponovala pouze jediným high-endových jádrem (Fermi GF110) a kromě dalších menších úprav disponovala hlavně podstatně větší kapacitou paměti, která je v případě profi aplikací rozhodně potřeba. Někteří novináři mluví o GK104 jako o GPU, které nepředstavuje top produkt Nvidie, ale dle mého názoru tomu tak není, neboť společnost cenově i produktově posadila toto jádro tam, kde doposud bylo jádro GF110.

Nvidia potřebovala velký surový výkon proti konkurenčnímu čipu Tahiti, a tak stvořila relativně jednoduché GPU s velkým počtem stream procesorů a zřekla se odděleného taktu pro shaderovou část čipu, čímž uspořila také nezanedbatelnou porci nutných tranzistorů. Výkonnost GK104 v GPGPU není nijak oslňující na čemž má zásluhu jednak chybějící zmiňovaný hardwarový scheduling ale také velmi slabý výkon FP64 (1/24). Svým výkonem se tak zařadí docela hluboko pod GF110 a její výkon je spíše podoben mainstreamovému jádru GF114, které známe z GeForce GTX 560. Dalšími faktory, které GK104 předurčovaly spíše pro zábavu, byl nižší počet registrů na jeden stream procesor (CUDA Core) nebo úplná absence ECC. ECC napravuje alespoň částečně Tesla K10 na úrovni pamětí (podobně jako v případě operační paměti serveru s vyhrazeným opravným bitem).




Tesla K10 žádné speciální chlazení nepotřebuje


Asi nikdo se tak nemůže divit, že uvedení profi řady Tesla právě s tímto jádrem je velkým překvapením. Nvidia ale ve své produktové mapě uvažuje nad Tesla K10 jako nad akcelerátorem pro specifické účely, kde její handicap v FP64 nebo podpora úplného ECC nebude na škodu věci. Vzniká nám tedy jakýsi „low-cost“ produkt Tesla. Poprvé tak Nvidia bude nabízet levnější a dražší řešení Tesla. Podle všeho bude dražší GPU mít název GK110 a bude disponovat výrazně větším potenciálem pro HPC a specifického úlohy jako je molekulární dynamika nebo biochemie.

Podle slov Nvidie je Tesla K10 vhodným akcelerátorem pro pomoc při hledání zásob plynu a ropy (seismická data jsou využívána pro výpočty za pomocí Kirhoffových integrálů, vlnové rovnice atd.) nebo procesování signálu a obrazu pro účely obranného průmyslu.

Těžko si pod těmito slovy představit nějakou reálnou aplikaci, ale společnost by zřejmě s takto vymezeným hardware nešla na trh, pokud by nevěděla, že po něm nebude poptávka. Můžeme uvažovat například těžařského společnosti, bezpečnostní agentury nebo celé státy. V těchto specifických nasazeních je potřeba pouze velký surový výkon a solidní paměťová propustnost. Výsledky nejsou dramaticky ovlivněny absencí ECC nebo double precision výpočtů, jako je tomu u čistě vědeckých aplikací. Nvidia tak zřejmě chce cenově i funkčně oba produkty odlišit, aby si vzájemně nekonkurovaly.





Upřímně řečeno tuto politiku nechápu, neboť Nvidia má v současné době řešení pro profi segment v podobě Tesla M2090, která si nevede po výkonnostní stránce vůbec špatně a duální GK104 ji mnohých disciplínách nepředčí (FP64). Nvidia chce mít na trhu svůj „profi“ Kepler již v této půlce roku a nečekat na konec roku na „plnohodnotné“ řešení. To může signalizovat také to, že již pro Tesla K10 má nalezeno reálně odbytiště, kde bude hrát prim výkonnost v single-precision. Musíme počkat, zda se nám Nvidia v následujících měsících pochlubí nějakou významnější zakázkou (pokud nebude podléhat utajení).

Prozatím můžeme o reálném výkonu Tesla K10 pouze spekulovat, ale vsadím se, že nebude nijak zásadně odlišná od GeForce GTX 690. Ta disponuje také dvěma jádry Gk104, ale na rozdíl od „profi“ verze postrádá například ECC na úrovni paměti a také má poloviční kapacitu paměti. Nvidia si segmenty, pro které využívá své GPU, rozčlenila do tří skupin. Tou první jsou profesionální grafické karty Quadro, které se odlišují především ovladači a BIOSem karet. Druhou skupinou jsou samozřejmě herní akcelerátory pro PC a notebooky. Jako poslední v řadě, ale rozhodně s velkým potenciálem, jsou akcelerátory Tesla. Téměř všichni recenzenti vyčítají jádru GK104 jeho „herní architekturu. Proč si je tedy Nvidia tak jistá tím, že může uspět v profesionálním segmentu?

Teoretický výkon 4.58 TFlops (FP32) je u Tesla K10 podpořen relativně vysokou propustností pamětí GDDR5 na taktu 5GHz s „papírovou“ hodnotou na úrovni 320GB/s. Je zde ovšem nutné počítat s tím, že tato propustnost je součtem pro obě GPU, kde každé z nich má svůj paměťový řadič a 16 paměťových čipů GDDR5 o kapacitě 2 Gb. Jejich celkový počet 32 dává dohromady 8 GB paměti. Takt jádra je v případě Tesla K10 stanoven na 745 MHz, což v kombinaci s relativně nízkou spotřebou GK104 na 28nm procesů dává TDP na úrovni 225 W. To odpovídá jedno-jádrovým kartám minulé generace jako je GeForce GTX 580 nebo její souputník z profesionálního světa pod označením Tesla M2090. Na trhu se Tesla K10 objeví nejspíše v červenci tohoto roku. Cena ještě oficiálně známa není, ale lze předpokládat, že se bude pohybovat na úrovni minulé generace, což by znamenalo 2500 dolarů (v přepočtu asi 50 000 korun).
reklama