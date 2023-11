USA nechtějí, aby se Čína dostala příliš daleko s umělou inteligencí, a tak zakázala prodej nejvýkonnějších GPU, na kterých se modely AI trénují nejrychleji. Spadá sem většina nových výpočetních karet Nvidie, nicméně ban dopadl dokonce i na klasickou grafickou kartu GeForce RTX 4090. Tento ban má trochu složitější pravidla, protože je jinak stanoven pro výpočetní karty a jinak pro ty klasické. Výpočetní karty (čipy pro datová centra) mají omezení nejen ve výkonu daný parametrem TPP (Total Processing Power), který si vysvětlíme za chvíli, ale také "výpočetní hustotou" PD (Performance Density). Ta je v podstatě stanovena jako TPP dělená plochou čipu. Toto omezení pomáhá zabanovat i méně výkonné karty postavené na architektuře Ada Lovelace.



TPP se počítá tak, že se vynásobí výkon v TFLOPS bitovou hloubkou. V případě RTX 4090 je tak výkon 660,8 TFLOPS v FP8, což dává celkem 660,8×8 = 5286. Stejně tak např. v FP16 je výkon 330,4 TFLOPS, což dává stejnou TPP s hodnotou 5286. Limit pro běžné grafické karty je ale stanoven na 4800. Do něj se např. bez problémů vejde GeForce RTX 4080, která má v FP8 jen 389,6 TFLOPS, její TPP je tak 3117.

GeForce RTX 4090 D (podle čínského roku draka, tedy Dragon), což bude podobné řešení jako loňská výpočetní Řešením tohoto problému má být nová(podle čínského roku draka, tedy Dragon), což bude podobné řešení jako loňská výpočetní Nvidia A800 se seříznutou paměťovou sběrnicí, aby se vešla do amerických limitů. Zatím ale není jasné, jakým způsobem bude RTX 4090 D vlastně ořezaná. Mohou to být nižší takty, pravděpodobnější je ale spíše snížení počtu CUDA jader. Na to, aby se karta vešla do limitu, by se z nynějších 16384 CUDA jader musela dostat někam pod 14,88 tisíc, takovým maximem by mohlo být asi 116 SM a 14848 jader, což by bylo opravdu velmi těsné. Pro připomenutí, výchozí RTX 4090 má 128 SM, slabší RTX 4080 jich má 76 SM.

Asi se dá předpokládat, že by se to mohlo pohybovat někde od 100 SM výše (aby to byl stále výrazný nárůst výkonu proti RTX 4080), na druhou stranu to asi nebude úplně na hraně. Nabízí se tak číslo někde mezi, např. 108 SM a 13824 CUDA jader, což by výkon poslalo na 4460 TPP. Samozřejmostí by mělo být zachování velké 24GB VRAM, protože tu využijí nejen hráči, ale i ono nasazení pro trénování AI (kterému se sice americká vláda chce vyhnout, ale Nvidia bude jistě ráda, pokud se k tomuto účelu tyto karty prodají). Neočekává se, že by cena měla být nižší, než je oficiální částka u plnohodnotné RTX 4090, která je nyní v obchodech kvůli nedostatku způsobeným banem USA prodávána mnohem dráž, než by měla.