V posledních letech se objevily dvě hlavní společnosti, které se přetahují o to, kdo nabídne lepší hardware pro účely umělé inteligence. Jde o Intel se svými specializovanými akcelerátory Xeon Phi a NVIDII s jejími GPU vybavenými hardwarem pro výpočty v FP16. Nyní se mezi ně nově tlačí také společnost AMD, jejíž grafické čipy Vega mají v tomto ohledu velký potenciál (Radeon Instinct a Vega Frontier) a vedle něj bude o svůj podíl bojovat také Fujitsu.

Fujitsu uvádí jednotky DLU, z jejichž názvu (Deep Learning Unit) je zcela jasné, že budou sloužit trénování hlubokých neuronových sítí, a tedy umělé inteligence. Fujitsu se přitom chlubí, že DLU nabídnou v důsledku desetinásobný výkon na watt než konkurenční produkty a také budou podporovat firemní rozhraní torus fusion, ale je otázka, zda i novou verzi v podobě Tofu 2, která zvyšuje propustnosti z 5 a 12,5 Gb/s na 40 a 100 Gb/s.

Uvnitř každého DLU je nespecifikované množství jednotek DPU (Deep Learning Processing Unit), jež můžeme brát jako obdobu pole Stream procesorů nebo CUDA jader. Tato DPU zvládnou výpočty v FP32, FP16, INT16 i INT8, takže výpočty v plovoucí řádové čárce i celočíselné výpočty.
Každé DPU se pak dále dělí na 16 DLE (Deep Learning Processing Elements), kde každý z nich má 8 jednotek SIMD s velkým registrem. Samotná DPU pak ovládá samostatné jádro, které jednotky řídí a spravuje jejich přístup do paměti prostřednictvím vestavěného kontroleru pro paměti typu HBM2.
Máme tu tak hierarchii DLU - celého čipu, DPU - podjednotek řízených vlastním jádrem a pak jednotlivých jader DPE. V tom lze vidět alternativu ke GPU, jež se může dále dělit na CU (Compute Unit) a pak na samotná jádra.
Fujitsu už také plánuje druhou generaci DLU, která již má být součástí hlavního systémového procesoru, a tudíž ne samostatným akcelerátorem. Ta první se má ale dostat na trh až někdy v příštím roce, což nebylo více upřesněno. O druhé generaci je tak toho logicky známo ještě méně.
Zdroj: Extremetech