NVIDIA Tesla M40 a M4: Maxwell pro strojové učení
12.11.2015, Jan Vítek, aktualita
![NVIDIA Tesla M40 a M4: Maxwell pro strojové učení](navstevnost-a-redakce/1/img/website-800.jpg)
Vedle modulu Jetson TX1 si NVIDIA připravila také nové akcelerátory Tesla M40 a M4. Ty jsou určeny pro datová centra a zaměřují se také na oblast hlubokých neuronových sítí a strojového učení, kde se má nyní odehrávat revoluce.
Šéf NVIDIE Jen-Hsun Huang podotkl, že začal závod ve vývoji autonomní a samostatně se učící umělé inteligence důležité pro další pokrok v automobilismu nebo zdravotnictví, což umožnil nástup moderního hardwaru, který poskytuje potřebný výkon. Tam patří i nový modul Jetson TX1 a nyní představené akcelerátory Tesla M40 a M4, které mají společné to, že jsou založeny na architektuře Maxwell používané již rok herními grafickými kartami.
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-0.6B0.jpg)
Nicméně již před dvěma měsíci NVIDIA představila první karty Tesla založené na architektuře Maxwell, tedy Tesla M60 a M6 určené pro GRID a založené na čipech GM204. Nyní jde o karty využívající čipy GM200 a GM206, které dostaly označení Hyperscale Accelerator. Všechny čtyři jsou určené pro strojové učení, na něž se NVIDIA více zaměřuje od minulého roku nabízejíc Tesla Accelerated Computing Platform.
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-1.2042.jpg)
NVIDIA Tesla M40 Accelerator je založen na nejlepším GPU Maxwell, tedy GM200 s 3072 CUDA jádry, 192 TMU a 96 ROP. Tato karta pracuje na max. 1140 MHz a vybavena je 12 GB paměti GDDR5 na 6 GHz se 384bitovou sběrnicí (propustnost 288 GB/s). Jejím maximem je 7 TFLOPS (FP32), ovšem v double precision (FP64) je to pouze 0,21 TFLOPS, ale to se o Maxwellech ví již dlouho. Tento nepoměr mají změnit až GPU další generace Pascal. TDP této karty je 250 W a chlazení se bude spoléhat na samotný server a jeho systém.
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-4.4888.jpg)
Tesla M4 je s GM206 značně slabší a má pouze 1024 CUDA jader, 64 TMU a 32 ROP, pracuje na max. 1075 MHz a má 4 GB GDDR5 na 5,5 GHz a 128bitové sběrnici (88 GB/s). Pokud se předchozí karta tedy blíží svými specifikacemi TITANu X, pak toto je profesionální bratříček GeForce GTX 960. Tato karta má konfigurovatelné TDP od 50 do 75 W a nabízí výkon 2.2 TFLOPS (FP32) a 0,07 TFLOPS (FP64).
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-10.4666.jpg)
Nyní má tedy NVIDIA v nabídce následující moderní hardware Tesla:
Zdroj: NVIDIA
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-0.6B0.jpg)
Nicméně již před dvěma měsíci NVIDIA představila první karty Tesla založené na architektuře Maxwell, tedy Tesla M60 a M6 určené pro GRID a založené na čipech GM204. Nyní jde o karty využívající čipy GM200 a GM206, které dostaly označení Hyperscale Accelerator. Všechny čtyři jsou určené pro strojové učení, na něž se NVIDIA více zaměřuje od minulého roku nabízejíc Tesla Accelerated Computing Platform.
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-1.2042.jpg)
NVIDIA Tesla M40 Accelerator je založen na nejlepším GPU Maxwell, tedy GM200 s 3072 CUDA jádry, 192 TMU a 96 ROP. Tato karta pracuje na max. 1140 MHz a vybavena je 12 GB paměti GDDR5 na 6 GHz se 384bitovou sběrnicí (propustnost 288 GB/s). Jejím maximem je 7 TFLOPS (FP32), ovšem v double precision (FP64) je to pouze 0,21 TFLOPS, ale to se o Maxwellech ví již dlouho. Tento nepoměr mají změnit až GPU další generace Pascal. TDP této karty je 250 W a chlazení se bude spoléhat na samotný server a jeho systém.
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-4.4888.jpg)
Tesla M4 je s GM206 značně slabší a má pouze 1024 CUDA jader, 64 TMU a 32 ROP, pracuje na max. 1075 MHz a má 4 GB GDDR5 na 5,5 GHz a 128bitové sběrnici (88 GB/s). Pokud se předchozí karta tedy blíží svými specifikacemi TITANu X, pak toto je profesionální bratříček GeForce GTX 960. Tato karta má konfigurovatelné TDP od 50 do 75 W a nabízí výkon 2.2 TFLOPS (FP32) a 0,07 TFLOPS (FP64).
![](nvidia-tesla-m40-a-m4-maxwell-pro-strojove-uceni/41396/img/body-10.4666.jpg)
Nyní má tedy NVIDIA v nabídce následující moderní hardware Tesla:
![]() | NVIDIA Tesla M60 | NVIDIA Tesla M40 | NVIDIA Tesla M6 | NVIDIA Tesla M4 | NVIDIA Grid K2 | NVIDIA Grid K1 |
GPU | GM204 | GM200 | GM204 | GM206 | GK104 | GK104 |
GPU jádra | 2048 x 2 - 4096 CUDA | 3072 CUDA | 1536 CUDA | 1024 CUDA | 1536 x 2 - 3072 CUDA | 192 x 4 - 768 CUDA |
Paměti | 16 GB GDDR5 (8 GB x 2) | 12 GB GDDR5 | 8 GB GDDR5 | 4 GB GDDR5 | 8 GB GDDR5 (4 GB x 2) | 16 GB DDR3 (4 GB x 4) |
Sběrnice | 256bit x 2 | 384bit | 256bit | 128bit | 256bit x 2 | 64bit |
Max. počet uživatelů | 36 | určeno pro Deep Learning | 18 | určeno pro Deep Learning | 32 | 16 |
H.264 (1080P @ 30 FPS) streamy | 2-32 | určeno pro Deep Learning | 1-16 | určeno pro Deep Learning | 2-12 | 1-8 |
Formát | Dual-Slot PCI-Express | Dual Slot PCI-Express (pasivní chlazení) | MXM karta | Single Slot PCI-Express (nízký profil, pasivní chlazení) | Dual-Slot PCI-Express | Dual-Slot PCI-Express |
TDP | 300W | 250W | 100W | 50-75W | 225W | 130W |
Zdroj: NVIDIA