reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

7nm Graphcore Colossus s 59,4 mld. tranzistory proti NVIDIA Ampere A100

16.7.2020, Jan Vítek, aktualita
7nm Graphcore Colossus s 59,4 mld. tranzistory proti NVIDIA Ampere A100
Anglická společnost Graphcore se sídlem v Bristolu právě vypustila do světa druhou generaci svých IPU - Intelligence Processing Unit - která bude soupeřit i s novými GPU NVIDIA A100 z generace Ampere. Co nabídne?
Jde tak pochopitelně o disciplínu umělé inteligence či hlubokého učení, na což ostatně ukazuje i označení IPU (Intelligence Processing Unit). Tyto čipy se uplatní v 1U blade systémech IPU-Machine M2000 a jde o Colossus MK2 GC200 vyráběné 7nm procesem firmy TSMC. Každá M2000 pak má nabídnout kolem 1 PetaFLOPs výkonu pro "Machine Intelligence", přičemž Graphcore nabízí také možnost, jak s pomocí IPU-POD vytvořit celé datacentrové či superpočítačové systémy schopné nabídnout až 64 tisíc IPU. Ty mají potenciál dosáhnout až 16 ExaFLOPS výkonu pro účely AI, což je tedy zatím jen teorie. 
 
 
Graphcore Colossus Mk2 GC200 IPU jsou samy o sobě mamutí čipy tvořené 59,4 miliardami tranzistorů na celkové ploše 823 mm2, která už snad musí být na samé hranici možností masek využívaných v rámci procesu TSMC N7.
 
Zajímavé je, že čip NVIDIA Ampere A100 či GA100 jsou téměř na chlup stejně velké čipy (826 mm2) a tvoří je i podobný počet 54,2 miliard tranzistorů, ostatně jde i o stejný výrobní proces rovněž u TSMC. Čili i náklady na výrobu by měly být velice podobné, i když výsledné produkty jsou značně odlišné. Colossus GC200 se skládá ze 1472 "IPU-Tiles" tvořených IPU jádry a celkem 900 MB paměti SRAM (rozdělených mezi jádra), přičemž každé jádro zvládne najednou zpracovávat 6 vláken. Celková propustnost integrované paměti pak je 47,5 TB/s. V porovnání se starým typem IPU pak to nové má nabídnout v reálném světě asi osminásobný výkon. 
 
 
Dále tu máme rozhraní PCIe 4.0 x16, ale také IPU linky pro propojení jednotlivých čipů s propustností 320 GB/s. Jeden blade IPU-M2000 totiž nese čtyři IPU GC200 s výkonem zmíněného 1 PetaFLOP pro AI a kapacitou až 450 GB paměti DDR4 v modulech DIMM. 
 
 
Podstatně větší pak jsou IPU-POD64, kterých může být v jednom systému dohromady až 1024 a v takovém teoretickém případě by bylo dosaženo pro účely AI zmíněných a nevídaných 16 ExaFLOPS výkonu. 
 

Graphcore se také chlubí, že jeho systémy jsou v AI oproti NVIDII a jejím Ampere mnohem výhodnější, co se týče výkonu a pořizovací ceny. Pokud jde třeba o rozpoznávání snímků s využitím EfficientNet-B4, pak stejný výkon dle firmy Graphcore nabídne její systém v ceně 259 tisíc USD jako servery NVIDIA DGX-A100 v hodnotě přes 3 miliony USD. Jeden IPU-M2000 tak má vydat za dva DGX A100.
 
Dostupnost IPU-Machine M2000 a IPU-POD64 je naplánována na 4. letošní kvartál. Už nyní jsou ale IPU-POD k dispozici pro vyzkoušení v rámci cloudu firmy Cirrascale.
 
 
 
 
Zdroj: Graphcore


reklama