Intel se vrací, Lunar Lake navyšuje IPC o 14 % a přináší 120 TOPS pro AI
4.6.2024, Milan Šurkala, aktualita
Poslední roky se Intelu moc nedařilo představit procesorovou architekturu, která by přinášel vysoký výkon a rozumnou spotřebu současně. Nový Lunar Lake by ale mohl znamenat návrat k zajímavým CPU.
Společnost Intel chce představit několik nových architektur procesorů a velmi zajímavě vypadá především Lunar Lake. Tato řada by měla být určena především pro mobilní nasazení a je nutno říci, že alespoň papírově to po mnoha letech konečně vypadá na zajímavou architekturu. Intel totiž poslední roky sice přinášel vysoký výkon, ale za neadekvátní spotřebu. Lunar Lake naopak vše podřizuje co nejvyšší efektivitě, takže asi nebudeme čekat nejvýkonnější CPU na trhu, měly by ale nabízet velmi dobrý poměr výkonu a spotřeby. Zda tomu tak bude, to se teprve uvidí v praktických testech, nyní se ale podívejme alespoň na teorii.
Lunar Lake je dlaždicovým procesorem, který kombinuje CPU, GPU, NPU a operační paměť v jednom balení. Zatímco výpočetní dlaždice Compute Tile je vyráběna u TSMC pomocí procesu N3B, Platform Controller bude vyráběn tamtéž procesem N6.
Procesory samotné budou obsahovat vestavěnou RAM, tu tedy nebude možné dále upgradovat. K dispozici budou varianty s 16 GB a 32 GB (slyšíte to, pánové v Applu?) a půjde o typ LPDDR5x-8533. Ty jsou uspořádány ve 4 16bitových kanálech a oproti klasickému řešení pájení RAM na základní desce toto ušetří 250 mm2 plochy a o 40 % snižuje spotřebu paměťového subsystému.
Intel se zbavil jader LP-E, které do všeho přinášely akorát zmatek, a Lunar Lake tak bude mít jádra P-Core (Lion Cove) a E-Core (Skymont). Výkonná jádra Lion Cove přichází o Hyper-Threading, což má pozitivní i negativní dopady. Díky tomu, že je jádro jednodušší a nemá struktury pro řízení HT, dá se lépe optimalizovat pro jednovláknový běh. Ve výsledku sice celý procesor zpracovává méně vláken najednou, každé z nich ale umí zpracovávat rychleji a efektivněji. Intel mluví o tom, že toto umožnilo o 5 % zvýšit výkon na jednotku spotřeby, klesl ale výkon na jednotku plochy, a to o 15 %. Každé jádro P-Core má 2,5 MB vlastní L2 cache a cluster 4 těchto jader pak sdílí 12 MB L3 cache. Pokud jde o L1 cache, ta datová má 192 kB, instrukční pak 64 kB.
Procesory budou totiž 8jádrové v konfiguraci 4 P-Core a 4 L-Core, které zvládnou zpracovávat 8 vláken najednou. To na dnešní dobu ale není mnoho. Procesor je nyní schopen měnit frekvenci v 16,67MHz intervalech místo 100MHz. Nevíme, jaké takty budou tato jádra mít, ale v prezentaci byly např. obrázky s hodnotami okolo 3,1 GHz.
Jak vidíme ze slajdů z prezentace, Lunar Lake u P-Core (Lion Cove) zvýšil počet výpočetních jednotek, např. počet ALU pro celočíselné výpočty byl navýšen z 5 na 6. Všechny tyto úpravy přináší navýšení IPC o 14 %, což je sice o něco méně než 16 % u AMD Zen 5, nicméně konečně to není nízké jednociferné číslo.
Intel v rámci prezentace ale hodně mluvil o nových E-Core (Skymont), které by měly být hlavním tahounem pozitivních vlastností Lunar Lake. Přepracoval řízení procesoru a plánovač tak, aby na těchto jádrech běželo co nejvíce výpočtů, pro které jsou vhodnější spíše úsporná jádra než ta výkonná. Mají 4 MB sdílené L2 cache a 2násobně se zvýšila propustnost vektorových jednotek a částí vhodných pro AI algoritmy. Také se zdvojnásobila propustnost L1 i L2 cache.
Podle Intelu má Skymont při stejném výkonu třetinovou(!) spotřebu proti LP E-Core u Meteor Lake, resp. při stejné spotřebě nabídne o 70 % více výkonu. Když dostane trochu více šťávy, dokáže podat 2krát tak vyšší výkon. Otázkou ale pochopitelně je, jak si stojí ne proti původním LP E-Core, ale proti původním E-Core, což tu ale nezaznělo a zaznít by mělo. Skymont by měl mít o 38 % vyšší IPC v celočíselných operacích a o 68 % vyšší v desetinných číslech proti LP E-Core. Znamená to dokonce to, že úsporný Skymont (E-Core) má nyní o 2 % vyšší IPC v celočíselných i desetinných operacích než výkonná jádra Raptor Cove (P-Core).
I pro vícevláknové nasazení platí tvrzení o třetinové spotřebě při stejném výkonu. Při stejné spotřebě ale cluster 4 nových E-Core zvládne dosáhnout 2,9krát vyššího výkonu, nicméně zde je potřeba dávat pozor na to, že Meteor Lake má jen 2 LP E-Core, zatímco Lunar Lake 4 E-Core (takže násobně vyšší výkon vyplývá už z násobně vyššího počtu jader). Tato 4jádra mají celkem 4krát vyšší výkon než 2 jádra LP E-Core, k tomu si už ale vezmou o něco více energie. Škoda, že tu nemáme srovnání s E-Core v Meteor Lake, to by ta čísla jistě nevypadala tak hezky.
Obrovským skokem má být i GPU. To má přinášet o 50 % více výkonu než Meteor Lake a jde o 2. generaci Xe jader. Přináší nové jednotky XMX, 8 větších jednotek pro ray-tracing, vektorové jednotky Xe2, 8MB L2 cache a toto vše má přinášet výkon 67 TOPS pro AI. Jen v GPU tu tak dostanete výkon téměř celého Snapdragonu X Elite (CPU+GPU+NPU).
Opět tu tak dostáváme vyšší výkon při stejné spotřebě, resp. stejný výkon při mnohem nižším odběru energie. Novinkou je také podpora pro eDP 1.5.
Intel také v procesorech Lunar Lake uvádí nové NPU 4 pro akceleraci algoritmů umělé inteligence. To má celkem 3krát více výpočetních jednotek (6 místo 2), 2krát vyšší propustnost, takt zvýšený z 1,4 na 1,95 GHz a celkový výkon 48 TOPS, čímž dosahuje podobných hodnot jako NPU v Snapdragonu X Elite (45 TOPS) nebo Ryzenech AI 300 (50 TOPS).
Výsledkem je, že daná úloha ve Stable Diffusion v1.5 zabrala nynějšímu NPU 3 v Meteor Lake (11 TOPS) 20,9 sekundy, zatímco Lunar Lake to zvládl za 5,8 sekundy. Spotřeba sice vzrostla z 9,0 W na 11,2 W, ale efektivita je 2,9krát lepší (místo 9,0 W × 20,9 s = 188,1 Ws to spotřebovalo jen 11,2 W × 5,8 s = 65,0 Ws).
Když toto vše dáme dohromady, Lunar Lake dává celkový výkon pro AI na úrovni 120 TOPS. Pro srovnání, Snapdragon X Elite dává 75 TOPS, Ryzen AI 300 pak dle verze 73-80 TOPS. Intel Lunar Lake tak pro AI nabídne o 50 % více výkonu. 5 TOPS jde z 8jádrového CPU, které má sice i optimalizace pro tyto algoritmy, ale není pro ně přímo určeno, případně jen pro některé jednoduché AI úlohy. 48 TOPS jde z NPU, tady jde především o vektorovou a maticovou matematiku, využití najde u AI asistentů a generativní AI. V případě GPU to je dalších 67 TOPS, opět může jít o náročnou generativní AI nebo hry.
Lunar Lake dále přináší podporu Wi-Fi 7, Thunderbolt 4 včetně Thunderbolt Share. První zařízení s těmito procesory by se měla objevit ještě v průběhu 3. čtvrtletí (tedy v létě nebo začátkem podzimu), obecná dostupnost se očekává ve 4. čtvrtletí, tedy na podzim. Přestože však Intel o nových procesorech prozradil opravdu mnohé, chyby tu jedna důležitá věc. Jakou spotřebu budou tyto procesory vlastně mít? Proč Intel tolik mluvil o efektivitě, ale nezmínil výslednou spotřebu (s výjimkou NPU)?
Zdroj: wccftech.com