Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

Intel prozrazuje více: Intel Penryn a architektura Nehalem

30.3.2007, Milan Šurkala, článek
Intel prozrazuje více: Intel Penryn a architektura Nehalem
Na druhou polovinu tohoto roku jsou přichystány 45nm procesory Intel "Penryn". Ty sice vychází z dnešních procesorů Intel "Conroe", ale přináší mnoho nového. Podívejme se, zda jde o evoluci nebo spíš revoluci. Rovněž si povíme o nové architektuře Intel Nehalem.
Ačkoli jsme vám ke konci ledna přinesli poměrně podrobné informace o připravovaných procesorech Intel Penryn, byly včera uveřejněny další informace, o kterých by byla škoda se nezmínit. Připomeňme, že Intel chce každý rok uvést novou výrobní technologii nebo rovnou úplně novou architekturu (nazývá to "tick-tock").



Procesor Penryn patří do kategorie první, přinese totiž 45nm výrobní technologii, novou architekturou bude Nehalem. Procesory Penryn budou značně vylepšenými procesory Intel Conroe. Nepůjde však pouze a jen o die-shrink jádra, změn bude hodně a budou znatelné.

45nm výrobní technologie má kromě svých pozitiv i své stinné stránky, hlavním problémem jsou především úniky proudu (tzv. current leakage). Ty byly velkým problémem např. 90nm procesorů Intel Pentium 4 "Prescott". S pokročilejší výrobní technologií problém narůstá do obřích rozměrů. Poněvadž tloušťka dielektrika je už u dnešní 65nm technologie extrémně tenká (cca 1,2nm, pouhých 5 molekul SiO2), bylo nutno hledat náhradu za dosavadní materiály.



Nově je použito high-k dielektrikum, které je však nekompatibilní se stávajícími hradly, tudíž i ty musí být z nových materiálů. Ty jsou nyní označovány jako "high-k metal gate". Výsledkem jsou podstatně nižší úniky proudu, o 20% rychlejší přepínání tranzistorů a až o 30% nižší spotřeba elektrické energie.

Dnes je ve vývoji 15 procesorů vyráběných 45nm high-k technologií. Bude se jednat o desktopové a mobilní procesory Intel Core 2 i o serverové procesory Intel Xeon. Do konce tohoto roku se rozběhne jejich výroba už ve dvou továrnách s tím, že do poloviny roku 2008 se rozběhne výroba v dalších dvou. Z počátku to budou Fab D1D v Oregonu a Fab 32 v Arizoně. Později se přidá Fab 28 v Izraeli a v polovině roku 2008 snad i Fab 11X v Rio Ranchu (Nové Mexiko).




Větší cache, více tranzistorů

O nové výrobní technologii jsme již mluvili, její hlavním přínosem bude to, že velikosti čipů se zachovají i při podstatně vyšších počtech tranzistorů v procesoru. Ten jde na vrub zejména větší paměti L2 cache. Ta má kapacitu zvýšenou o 50%, dvoujádrové procesory budou mít 6MB a čtyřjádrové dokonce 12MB této paměti. Z tohoto důvodu bude počet tranzistorů činit u quad-core čipů neuvěřitelných 820 milionů, u dvoujádrových půjde přibližně polovinu. Měly by tedy mít asi 410 milionů tranzistorů, což je o 38% více než dnes (cca 293 milionů). Přesto bude činit plocha čipu pouze 107mm2, tedy ještě asi o 25% méně než dnes. Intel to přirovnává ke čtvrtině velikosti průměrné poštovní známky, spotřeba by měla zůstat na dnešní úrovni.


Vyšší frekvence, vyšší IPC (Instruction Per Cycle)

Nové technologie umožňují dosahovat vyšších frekvencí při stejných hodnotách spotřeby TDP. Jak serverové, tak i desktopové procesory budou dosahovat frekvencí více než 3GHz a díky vyššímu IPC, počtu zpracovávaných instrukcí za takt, je možné dosáhnout při stejné frekvenci ještě vyšší výkonu. Některé serverové procesory dokonce budou později využívat 1600MHz sběrnici, zatím má takt jejich sběrnice činit 1333MHz.


Nové úsporné režimy pro mobilní procesory

Mobilní procesory na bázi procesoru Penryn budou mít nové vyspělejší úsporné režimy shrnuté pod označení Deep Power Down Technology. Výsledkem má být nižší spotřeba procesorů v idle režimu, také díky eliminaci interních úniků proudu v procesoru. Novým režimem bude C6 state, kdy se vypne prakticky celý procesor včetně obou cache pamětí i sběrnice, voltáž procesoru se dále výrazně sníží. Samozřejmostí je to, že trvá delší dobu se do takto hlubokého spánku dostat, stejně jako se vrátit do původního stavu.




Intel Dynamic Acceleration: automatické taktování v jednojádrových aplikacích

Penryn bude mít také vylepšenou technologii Intel Dynamic Acceleration (IDA). Její princip spočívá v dynamickém přetaktování jádra, pokud se jedná o jednojádrovou aplikací a druhé jádro je nevyužito nebo je využito málo. Podmínkou je dostát specifikacím TDP. Pokud běží aplikace, která nedokáže využít druhé jádro, spotřeba procesoru je přibližně poloviční. Poněvadž procesor druhé jádro nevyužívá a aktuální spotřeba je velmi vzdálená maximální TDP spotřebě, může si dovolit zvýšit takt zatíženého jádra. Aplikace tak může těžit z maximálního výkonu jednoho jádra procesoru, přičemž maximální TDP spotřeba zůstane nepřekročena. O kolik se mají jádra přetaktovat však zveřejněno nebylo.


Instrukce SSE4 (Streaming SIMD Extensions 4)

Zejména pro multimediální aplikace (editace videa, fotografií) jsou používány instrukce MMX a SSE. Procesory Penryn budou logicky podporovat starší instrukce MMX, SSE (přišly s Pentiem III), SSE2 (Pentium 4), SSE3 (Pentium 4 "Prescott"), SSSE3 (Intel Core 2) a nově přibude dalších 50 instrukcí SSE4. Ty by měly opět umožnit větší flexibilitu v používání těchto instrukcí, které dokáží zpracovávat více dat najednou. Unique Super Shuffle Engine je pojmenování nové, plně 128-bitové jednotky mající na starosti bitové posuvy v SSE registrech. Instrukce bitového posuvu, instrukce rozbalovací (unpack), slučovací (pack) a horizontální aritmetické tak budou probíhat mnohem rychleji. Nutno přiznat, že už implementace SSE v dnešních procesorech Intel Core 2 je velmi rychlá, s viditelným náskokem oproti architektuře AMD K8. SSE4 by podle společnosti Intel mělo umožnit zrychlit práci video kodeků až o 40%.


Enhanced Intel Virtualization Technology

Inovovaná virtualizační technologie nabízí o 25% až 75% rychlejší přepínání mezi virtuálními stroji. Za vše může vylepšená architektura virtualizace na hardwarové úrovni, nejsou tedy vyžadovány žádné úpravy software. Jeden počítač může hostovat více virtuálních strojů, které budou moci lépe využít výkon procesoru.


Radix 16: rychlejší dělení

Každý kdo někdy programoval, časem zjistí, že dělení je velmi neefektivní aritmetická operace. Zatímco sčítání a odečítání, to je jeden či dva takty procesoru, u násobení je to mnohem více a u dělení se vykonání operace pohybuje v desítkách cyklů procesorů. Proto se dělení "počítačově" kulatými čísly (2, 4, 8, 16,...) raději realizuje bitovým posuvem, které je opět proveditelné jen v jednotkách taktů. Nové procesory Penryn budou mít rychlejší techniku zpracovávání instrukcí dělení. Schopnost dělit 4 bity za jeden takt (oproti dnešním 2 bitům za takt) umožní zkrátit čas dělení na polovinu, odmocňování dokonce na čtvrtinu.

Nové 45nm procesory by si měly zachovat své TDP spotřeby běžné z dnešních 65nm procesorů, tedy u mobilních verzí se bude jednat o 35W, u desktopových o 65W, serverové procesory mají mít 80W a konečně high-end quad-core čipy se budou vyznačovat 130W TDP spotřebou. Procesory můžeme očekávat v druhé polovině tohoto roku.

Konkurenční AMD je v tomto ohledu o něco pozadu, neboť teprve nedávno se v továrně Fab36 naplno rozjela 65nm výroba. Dosud byla část procesorů vyráběna 90nm metodou a další 65nm metodou, v dnešních dnech už je 100% produkce továrny Fab36 vyráběno 65nm technologií. Na 45nm technologii chce AMD přejít až v polovině roku 2008, tedy o rok později než Intel. Proti Penrynu chystá novou architekturu, známou jako AMD K8L.


Architektura Intel Nehalem


Pro rok 2008 je díky modelu "tick-tock" naplánována nová architektura Nehalem. Toto jméno už koluje u Intelu dlouho a teprve až příští rok dostane konečně reálnou podobu. Procesory na této architektuře budou využívat 45nm high-k výrobní technologii, jenž bude uvedena s procesory Intel "Penryn".


Dynamické přiřazování prostředků

Intel označuje architekturu Nehalem jako největší průlom od dob Pentia Pro, jehož potomci přežívají dodnes díky mnoha úpravám v podobě mobilních Pentií M. Má jít totiž o první dynamicky škálovatelnou architekturu. A škálovatelnost promlouvá snad do všech částí procesoru. Dynamicky se bude nastavovat a přiřazovat napájení, cache paměti, vlákna, jádra i sběrnice.

Architekturou Nehalem se budou moci pochlubit procesory s jedním až osmi jádry, přičemž by měla být dostupná funkce Simultaneous Multithreading podobná někdejšímu Hyper-Threadingu, známého z procesorů Pentium 4. Zde však má být dosaženo vysokého IPC (počet instrukcí za takt), na základě požadavků aplikace se mají dynamicky přidělovat jádra i paměť cache. Konkrétně se jedná o sdílenou cache nejvyšší úrovně. Zatím není úplně jisté, zda půjde o L2 nebo rovnou o L3 cache (ta by měla podle prvních informací být použita jen u serverových procesorů Xeon). Její spravování bude mít na starosti technologie Intel Smart Cache.




Integrovaný řadič pamětí DDR3

Nemožné se stává skutkem, Intel bude mít od roku 2008 procesory s integrovaným řadičem pamětí. Toto řešení má AMD již od roku 2003. Tvrdošíjný postoj Intelu a jeho obvyklá FSB sběrnice tak zůstane konečně minulostí. Integrovaný řadič pamětí snižuje latence, spotřebu energie a umožňuje jednodušší návrhy základních desek. Procesory s architekturou Nehalem budou mít řadič pamětí DDR3. Spekuluje se o tom, že low-endové a mainstreamové procesory by měly mít jedno i dvoukanálové řadiče, high-endové procesory dvou a možná i čtyřkanálové. Místo FSB bude využita point-to-point sběrnice CSI (Common Serial Bus), podobná známému Hyper-Transportu použitém například u procesoru AMD.


Integrovaná grafika

AMD už delší dobu pracuje na projektu Fusion, což bude spojení CPU a GPU do jednoho čipu. Vše nasvědčuje tomu, že i procesory s architekturou Nehalem budou vyráběny ve verzích s integrovaným grafickým čipem. Předpokládá se, že půjde zejména o mobilní procesory, grafiku Intel označil "high performance". Vzhledem k tomu, že v poslední době Intel nabírá zaměstnance do oddělení vývoje grafických čipů a kolují zvěsti o tom, že Intel chce začít vyrábět i výkonné grafické karty, je možné doufat v poměrně výkonné grafické čipy. Výsledkem budou samozřejmě úspornější, výkonnější a lehčí notebooky.

Mezi další vylepšení má patřit rozšířená instrukční sada SSE4 (že by SSSE4?). Procesory prý budou i nadále využívat patici LGA775 (osobně bych však o tom zejména u verzí s integrovanou grafikou trochu pochyboval, ovšem nechme se překvapit). První procesory budou vyráběny již zmíněnou 45nm technologií, v průběhu roku 2009 se má přejít na 32nm technologii (Westmere). Nová architektura postavená na 32nm technologii, která se objeví v roce 2010, ponese jméno Gesher.

Je tedy vidět, že Intel nelení a připravuje mnoho nového. AMD bude mít co dělat, aby udrželo krok. 65nm technologii totiž rozjíždí až v poslední době, 45nm je zatím naplánována na polovinu příštího roku. Hodně by mohla zachránit architektura AMD K8L, která se objeví v tomto roce. Každopádně se můžeme těšit na neutuchající boj, ze kterého budeme profitovat my, zákazníci. Procesory budou levnější a mnohem výkonnější.

Zdroje: www.intel.com, www.bit-tech.net, www.extremetech.com, www.dailytech.com