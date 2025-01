Technologie DLSS je dle společnosti Nvidia hodně populární, má jí dle jejích čísel získaných pomocí ovladačů a aplikací firmy používat okolo 80 % lidí, kteří mají grafickou kartu GeForce RTX 4000 v kompatibilní hře (pokud mají karty starší než RTX 2000 nebo AMD/Intel, případně hrají hry, které DLSS neumí, tak pochopitelně celkové procento v herní populaci vyjde mnohem nižší). Na veletrhu CES 2025 byla představena další generace této technologie, DLSS 4. Ta přináší např. funkci Multi Frame Generation (MFG), která místo jednoho snímku generuje rovnou čtyři. To má dle Nvidie znamenat, že proti běžnému renderování umožní navýšit výkon až 8násobně.



Např. na prezentovaném videu běží scéna z Cyberpunku 2077 v pouhých 27 fps se 67ms latencí bez DLSS, s DLSS 2 je to už 71 fps / 32 ms, DLSS 3 navyšuje výkon na 140 fps / 33 ms a s nejnovějším DLSS 4 je to už 240+ fps s 35ms latencí. Dle Nvidie to tak má umožnit hraní ve ve 4K při 240 fps s ray-tracingem na GeForce RTX 5090. MFG by mělo být při uvedení podporováno na 75 aplikacích z celkových více než 700 RTX-kompatibilních her.

U starších generací na něco takového nebyl výkon, bylo potřeba AI modelu i akcelerátoru pro výpočet optického toku (Optical Flow Accelerator) pro každý snímek. Architektura Blackwellu už toto ale dokáže. AI model je o 40 % rychlejší, potřebuje o 30 % méně RAM a pro vygenerování více snímků potřebuje jen jeden průchod na vygenerovaný snímek. Nvidia říká, že např. Warhammer 40000: Darktide díky tomu navyšuje svou snímkovací frekvenci asi o 10 %, přitom ale využívá o 400 MB méně paměti ve 4K a nastavení Max.

Technologie výpočtu optického toku byla totiž nahrazena AI modelem, který má být efektivnější. To nicméně znamená, že generování musí projít přes 5 různých AI modelů. Bez nových Tensor Core 5. generace (s 2,5× vyšším AI výkonem) by to nebylo možné, dle Nvidie by to z některých AI modelů v DLSS udělalo spíše decelerátor než akcelerátor. Ve výsledku se tak generuje 15 pixelů z 16.

Zásadní novinkou pro DLSS 4 je úplná změna modelu. Zatímco ty předchozí byly založeny na konvolučních neuronových sítích (CNN), nová generace využívá transformační neuronové sítě neboli transformery. Na tomto základu je postaveno např. GPT nebo Gemini. Transformery umožňují tzv. "self-attention", tedy mohou samy zaměřit svou pozornost na to nejdůležitější, tedy přiřadit významovou váhu jednotlivým pixelům (v GPT se to využívá k rozpoznávání toho, která slova jsou ve větě nejdůležitější, což pomáhá rozpoznat význam i kontext).

Technologie transformerů využívá např. DLSS Ray Reconstruction, Super Resolution nebo DLAA (Deep Learning Anti-Aliasing), které jsou ve své aktualizované podobě dostupné pro všechny dřívější karty RTX až po RTX 2000. Frame Generation je dostupný jen od RTX 4000 výše a Multi Frame Generation pouze u RTX 5000. Tato technologie zajišťuje vyšší stabilitu, menší ghosting, lepší detaily při pohybu a hladší okraje. Nvidia to ukazuje např. u srovnání ve hře Alan Wake 2, kde jde vidět mnohem méně artefaktů u plotů, drátů nebo otáčejícího se ventilátoru.



Super Resolution (super rozlišení) a DLAA budou zatím k dispozici jako betaverze. Přechod na transformační modely by měl umožnit větší posun obrazové kvality, kde už Nvidia začala narážet na strop toho, čeho bylo možné dosáhnout s CNN.