reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Baidu Kunlun II ve svém světě útočí i na čip NVIDIA Ampere A100

19.8.2021, Jan Vítek, aktualita
Baidu Kunlun II ve svém světě útočí i na čip NVIDIA Ampere A100
Čínský gigant Baidu nedávno od sebe odštěpil firmu Kunlun Chip Technology Co. a ta se nyní již hlásí s novým čipem Kunlun II. Jedná se o AI akcelerátor či procesor s druhou generací architektury XPU. 
Kunlun Chip Technology Co. funguje coby samostatná společnost vlastněná firmou Baidu od letošního června. Dříve vytvořila čip Kunlun K200, čili první generaci XPU, která v roce 2019 nepředstavovala žádné ořezávátko. Šlo o čip tvořený firmou Samsung s 2,5D pouzdřením na interposeru vedle dvou pamětí HBM2. Tehdy také šlo ještě o 14nm proces a výsledný čip nabízel výkon 256 TOPS (tera OPS) v INT8, 64 TOPS v INT16/FP16 a 16 TOPS v INT32/FP32 při TDP 150 W. 
 
   
Nyní tak nastupuje Kunlun II, a sice již 7nm čip, který evidentně také není vyráběn v ČLR, ale buď opět v Jižní Koreji, nebo na Tchaj-wanu. Z obrázku toho moc nezjistíme, takže jaké jsou dostupné specifikace? 
 
Kunlun II má být asi 2 až 3krát výkonnější než jeho předchůdce a konkrétně slibuje 512 až 768 INT8 TOPS, 128 až 192 INT16/FP16 TOPS a 32 až 48 INT32/FP32 TOPS, čili je určen pro stále stejné typy výpočtů. NVIDIA A100 přitom dosahuje 19,5 FP32 TOPS a 624 INT8 Tensor TOPS (či dvojnásobek s novou funkci sparsity pro využití "řídkosti" v hlubokých neuronových sítích pro zdvojnásobení výkonu ve standardních Tensor Core operacích). Ani ve světle A100 tak nový Kunlun II nevypadá vůbec špatně.


  Baidu Kunlun Baidu Kunlun II Nvidia A100
INT8 256 TOPS 512 ~ 768 TOPS 624/1248 (sparsity) TOPS
INT/FP16 64 TOPS 128 ~ 192 TOPS 312/624 (sparsity) TFLOPS (bfloat16/FP16 tensor)
Tensor Float 32 (TF32) - - 156/312 (sparsity) TFLOPS
INT/FP32 16 TOPS 32 ~ 48 TOPS 19,5 TFLOPS
FP64 Tensor  - - 19,5 TFLOPS
FP64 - - 9,7 TFLOPS
 
Vzhledem k podpoře stejných formátů lze tušit, že Kunlun II budou nasazeny ve stejném prostředí jako starší čipy, čili v cloudových datacentrech firmy Baidu, kde slouží i pro provoz autonomní platformy pro řízení vozů (Apolong) a další účely. 
 
Zdroj: THWPRNewsWire


reklama