Jak vzniká procesor aneb procesorová kuchařka
(Lukáš Petříček, 5.9.2006, zpráva)
Jistě jste si již také položili otázku, co vše musí stát za vývojem a vznikem procesoru. Kolik snažení, intelektu, lidského úsilí a stovek inženýrů stojí za srdcem každého počítače. Přes návrh u „rýsovacího prkna“, přes modelové testování konceptu, zatím bez hmatatelného jádra, za pomocí softwarových nástrojů, přes testování a ladění prototypů, až konečně k procesoru jak ho známe z obchodu.
Protože k tématu se váže pár relevantních skutečností, začneme trochu oklikou. Spoluzakladatel Intelu, Gordon Moore, již v roce 1965 vyslovil prognózu, že počet součástek na čip se každý rok zdvojnásobí při zachování stejné ceny. S rostoucí složitostí výroby a návrhu čipů bylo toto empiricky ověřené pravidlo posléze lehce upraveno na zhruba 2 roky (uvádí se také průměrný údaj zhruba 18 měsíců). Z Moorova zákona plyne také jedna podstatná věc k návrhu procesorů, a to možná velikost čipu, vzhledem k právě dostupné výrobní technologii. Možné tempo vývoje procesorů je proto poměrně snadno odhadnutelné a z větší části dané. A to právě tempem vývoje litografie a možnostmi dostupných technologií výroby procesorů.

Díky stále expandujícímu trhu IT, pokročilejším výrobním technologiím a snižující se ceně se stal výkonný a moderní procesor dostupný téměř pro každého. Poněkud nevýhodným trendem je ovšem to, že nároky na stavbu pokročilých továren a přístrojů na litografii pro výrobu čipů stoupají extrémním tempem, a to mnohem rychleji, než roste trh s procesory. Návrhy a výroba čipů současnou technologií sice občas, ale stále častěji, naráží na jistá úskalí, ale zatím se je daří poměrně dobře překonávat. Moorův zákon tak bude patrně ještě nějaký ten rok platit.


Moorův zákon je stále v platnosti


Aby byla výroba procesoru rentabilní, musí se velikost čipu držet na přijatelných mezích. Kromě toho, že s větší velikostí se na wafer (křemíkovou oplatku) vejde méně jader, stoupá také pravděpodobnost toho, že zde bude defekt, kvůli kterému nebude možné toto jádro použít. Výrobce procesorů se samozřejmě snaží zužitkovat co nejvíce jader z každého waferu, a proto také často uvádí třeba kusy s deaktivovanou částí L2 cache, což je poměrně snadno proveditelné.


Návrh procesoru

Návrh dnešních moderních procesorů je proces nesmírně složitý a nutno podotknout, že bez pomocí samotných počítačů a procesorů dnes proces již zcela nemyslitelný. Po návrhu čipu a jak bude čip pracovat vyplyne na konci návrhu řada masek, které se s vývojem a každou revizí či prototypem samozřejmě mění. Tyto masky jsou poté použity při samotném procesu výroby čipu.

Při návrhu procesoru se stejně jako v jiných odvětvích vychází zejména z dosavadních zkušeností a osvědčených řešení. Návrhy dnešních procesorů jsou kromě velikosti čipu limitovány, což jasně plyne z omezené plochy na waferu a výrobního procesu, také možnou frekvencí čipů opět vzhledem k jejich architektuře a zmiňovanému výrobnímu procesu, jejich následným chlazením a řadou dalších faktorů.

Další problémy s výrobou mikroprocesorů plynou ze samotné a stále se zmenšující výrobní technologie a rostoucí složitosti čipů. Stále větším problémem jsou úniky proudu, statická spotřeba a relativně velmi omezené možnosti škálování napětí vzhledem k stále menší výrobní technologii. Dále tu je lokální přehřívání a stále vyšší teploty v určitých částech čipu, případně špatná distribuce tepla v určitých částech mikroprocesoru, a to zejména v případě složitého a zároveň malého jádra s vysokými frekvencemi. Také kvůli konkurenčnímu prostředí na trhu s procesory, které nutí výrobce využívat výrobních technologií až do jejich absolutních limitů.

Zde bych se dovolil odkázat na náš starší, ale vynikající článek Vyvíjet nové čipy bude složitější:

K realizaci navrhování procesorů se používají specializované softwarové nástroje, kde inženýři navrhující obvod, definují jeho funkce, specifikují signály, vstupy a výstupy, potřebné napětí apod. Specifikace těchto obvodů jsou dále předány softwaru pro návrhy obvodů jako je například SPICE a pak dále importovány pro zpracování softwarem (například od ASML), podobným CADu. To je nezbytné pro definování vrstev a pro prudukci masek (posléze použité pro výrobu čipů).


Software pro návrh a optimalizaci fotolitografických masek od ASML


S konkrétním návrhem procesoru a specifikací jednotlivých částí čipu dostávají jednotlivé části čipu stále zřetelnější a konkrétnější podobu. Nic samozřejmě není tak jednoduché a kromě stálého testování funkčnosti, prochází budoucí masky vývojem, protože funkční koncept nebo dokonce již prototyp ještě neznamená, že procesor je dostatečně zralý pro masovou výrobu. Kromě chyb v samotném procesoru a designu je tu také otázka výtěžnosti a dosažitelných frekvencí, škálovatelnosti, statické (v současnosti jsou třeba stále větším problémem proudové úniky) i dynamické (například možné lokální přehřívání a špatné distribuce tepla) spotřeby.

Krásnou ukázkou, vzhledem k postupnému „zdokonalování“ a odstraňování řady problémů, je architektura Netburst od Intelu. Pokud pomineme ne až tak dokonale realizovatelný koncept postavený na velmi vysokých frekvencí, tedy kromě marketingového hlediska a ceny, protože ten byl takřka geniální, bylo relativní konkurenceschopnosti a odladění řady problémů právě se spotřebou dosaženo až s 65nm výrobním procesem. Ovšem vzhledem k výborné architektuře AMD64 a uvedení Core 2 to stejně nebylo dostatečné. Níže lze vidět prototyp Athlonu 64 vyrobeného 65 nm výrobní technologií. Všimněte si „hluchých“ míst, kde je kvůli použití hustější implementace L2 cache spousta nevyužitého místa, což by samozřejmě v případě prodejního kusu bylo nepřijatelné (pro srovnání poslední revize F dvoujádrového Athlonu 64).


Prototyp Athlonu 64 vyrobeného 65nm výrobní technologií


Od „prvního křemíku“ (prvních vzorků čipu), až k finální várce masek a finálnímu procesoru, který půjde do prodeje, je to kus cesty. A až pak může začít onen proces, kdy se výrobní linky začínají roztáčet naplno. Výrobci základních desek, chipsetů i chladičů již mají dávno kompletní specifikace a spuštění procesoru obvykle provází současně, nebo jen lehce v závěsu, jejich uvedení na trh. Dále se podíváme, jak se takové procesory vyrábějí.


Pro srovnání poslední revize F dvoujádrového Athlonu 64 (90nm Athlon 64 X2)


Výroba procesoru
Výroba procesoru

Vznik jádra mikroprocesoru na waferu provází stovky úkonů a vzniká v jednom z nejčistších prostředí jaké si lze představit. Říká se mu Cleanroom a protože je nutné zde tuto čistotu držet, všichni pracovníci jsou oblečeni do takzvaných „bunny suits“ (skafandrů), které mají možné znečištění minimalizovat. Samozřejmostí je zde čištění vzduchu a řízená relativní vlhkost vzduchu.


AMD Cleanroom ve FAB36, Dráždany

Ke vzniku procesoru se používá mnoho přísad a složení čipu a jeho výroba jsou samozřejmě také zavislé na jeho nasazení a požadovaných paremetrech. Jiné nároky jsou typicky kladeny na část trhu s mobilními počítači a jiné požadavky budou v případě nejvýkonnějších modelů, kde se nutně na spotřebu nebere příliš zřetel. Například v mobilní sféře se často v částích čipu již při návrhu upravují některé tranzistory, aby měly vůči původním desktopovým procesorům nižší spotřebu. Pakliže to samozřejmě nemá přilišné dopady na jejich výkon nebo na výtěžnost.


Příprava ingrediencí

Křemíkový wafer

Wafer je jedním ze základních stavebních kamenů pří výrobě procesorů. Je uříznut z prutu extrémně čistého monokrystalického křemíku. Křemík, ze kterého se wafer skládá, je hlavní částí polovodičů. Jeho oblíbenost tkví, kromě dostupnosti (je to druhý nejrozšířenější prvek na Zemi), v možnostech výrazně ovlivňovat jeho elektrickou vodivost pomocí relativně malého množství dopantů tak, aby měl námi potřebné vlastnosti. Základem pro výrobu waferu je obyčejný písek, postupně čistěný a upravovaný a tažený do tvaru prutu, například Czochralského (krátce také označováno CZ) metodou. Po uříznutí z prutu je wafer následně dále upravován procesy jako broušení, leštění a čistění, až je povrch doslova zrcadlově hladký a zbavený všech nečistot. Kvalitativní nároky na wafer a jeho povrch jsou značné a zásadně ovlivňují možnou kvalitu výstupu.


Opterony vyrobené 90nm výrobní technologií na 300 mm a 200 mm waferech

Pro výrobu procesorů jsou dnes běžně používány wafery o průměru 200 mm a 300 mm. V budoucnosti se také uvažuje o 450 mm waferech, ale problémy s financováním vývoje vybavení pro produkci čipů na takto velkých waferech (jehož cena roste exponenciálně), zřejmě způsobí jejich značný odklad. Větší wafery jsou také náročnější na výrobu a konzistenci kvality čipů, ale umožnují podstatně vyšší výstup počtu procesorů na jeden wafer. S podobnými problémy financování se potýká i zařízení na pokročilou litografii. Náklady jsou zde již také enormní, a proto se hledají i jiné cesty, jak prodloužit životnost stávajícím technologiím.


Chemikálie a plyny

K výrobě procesorů se také používají chemikálie a plyny. Jako například od hexamethyldisilazane sloučeniny, až třeba po obyčejný bór. Vytlačovány jsou dnes z výroby postupně nahraditelné prvky a chemikálie zatěžující životní prostředí.


Kovy

Kovy, jako například hliník nebo měď, se používají jako vodiče elektřiny. Dnes se používají zejména měděné mezispoje a občas také zlato, které se může používat pro připojení čipu na jeho nosnou destičku.


Záření

Konkrétně záření ultrafialové, které má velmi krátkou vlnovou délku (dnes se používá zejména vlnová délka 193 nm, případně kombinace více vlnových délek). Ultrafialové záření se používá k vysvícení vzorů přes fotolitografickou masku na jednotlivé vrstvy procesoru. Jedná se o proces ve svém důsledku podobný fotografování.


Masky

Ty se při výrobě čipů používají jako prostředek a zdroj vysvícení správných vzorů na každé jednotlivé vrstvě budoucího mikroprocesoru. Každá fotolitografická maska u dnešních procesorů představuje řádově GB dat, které jsou nutné pro jejich výrobu. K výrobě moderních procesorů je dnes třeba až 20 či více masek. Fotolitografické masky se poté používají v zařízeních pro fotolitografii. Dnes ještě stále s použitím záření s vlnovou délkou 193 nm.


Zařízení pro fotolitografii, PAS 5500/1150 od ASML


Postupná konstrukce

Mikroprocesor je tvořen vrstvu po vrstvě za použití různých metod, na křemíkovém waferu s užitím ultrafialového záření, plynů a chemikálií. Na každý wafer dnes připadá běžně až několik set procesorů - podle výrobní technologie a velikosti waferu. I přes veškerou snahu výrobců budou některá jádra vadná a později budou při testování vyřazena. Následuje přesnější popis, jak k takovému postupnému vzniku mikroprocesoru dochází...


První růst

Vrstvička oxidu křemičitého je na waferu vypěstována (tak zvaný epitaxní růst) za pomocí extrémní teploty a plynů. Tento růst je podobný tomu, který můžeme vidět na reznoucím železe po vystavení působení vody. Oxid křemičitý na waferu ale roste neporovnatelně rychleji a tato vrstva je příliš tenká, než aby ji bylo vidět pouhým okem. Na tuto vrstvičku jsou samozřejmě také kladeny kvalitativní požadavky, jako například minimální rozptyl její tlouštky, minimální rozptyl měrného elektrického odporu a také co nejméně defektů v její struktuře.


Pokrytí fotorezistem

Dalším krokem je pokrytí waferu, respektive zmiňované vrstvičky, substancí, která mění svoje vlastnosti po vystavení ultrafialovému záření. Říká se jí jednoduše fotorezist.


Fotolitografie

Dalším z kroků je proces zvaný fotolitografie. Ultrafialové záření je na wafer zaměřováno přes složitý systém čoček a masku vzorů, po které je výsledný obraz před promítnutím na wafer zmenšen (typicky 4-5x). Maska chrání části waferu před ultrafialovými paprsky. Části nechráněné před těmito paprsky se naleptají. Na každou vrstvu procesoru se při postupném vrstvení použije jiná maska s příslušnými vzory.


Ozáření waferu pokrytého vrstvičkou oxidu křemičitého a fotorezistem


Leptání

Naleptané části jsou zcela odstraněny rozpouštědlem. Poté jsou odstraněny zbytky fotorezistu naneseného před vysvěcováním vzorů do oxidu křemičitého. Leptání zde tedy zanechá pouze požadované vzory tvořené oxidem křemičitým na křemíkovém plátu.


Proces vrstvení

Dalším krokem je přidání další vrstvičky. Nejprve je opět vypěstována vrstva oxidu křemičitého a na něj je aplikována vrstva polysilikonu (vodivého materiálu, který slouží jako hradlo u MOS technologie, nebo i k propojení jednotlivých částí čipu) a další vrstva fotorezistu. Ultrafialové záření je opět zaměřováno, tentokrát již přes druhou masku, zanechávajíc vzory na této další vrstvě. Nechráněné vzory na masce jsou opět odstraněny rozpouštědlem, které odhalí oxid křemičitý a vrstvy polysilikonu a ty zde zanechávají jen ty správné vzory a struktury.


Část čipu po použití druhé masky a aplikaci zmíněných procesů


Iontová implantace

V procesu iontové implantace jsou vybrané části křemíkového plátu bombardovány s různými elektricky nabitými atomy příměsí, (chemickými znečisťovateli) kterým se říká ionty. Ionty jsou implantovány na křemíkový wafer k zaměnění cest, kterými je pak vedena elektřina. Takto postupně vznikají vrstvy tranzistorů každého budoucího čipu.


Dopování vybraných částí čipu


Vrstvu za vrstvou

Proces vrstvení a aplikace masek, osvěcovaní, leptání a další procesy jsou opakovány a zanechávají zde otvory, které zde dovolí vést spoje mezi jednotlivými vrstvami. Atomy kovu jsou deponovány do waferu plníce otvory vzniklé v předešlém procesu vrstvení. V mikroprocesorovém obvodu je mnoho vrstev. Jejich počet samozřejmě závisí na návrhu samotného mikroprocesoru a na počtu masek. S počtem jeho vrstev a s vrstvami dnes používaných meděných mezispojů (pro dnešní moderní procesory vyrobené 90 nm, resp. 65 nm výrobní technologií, se běžně používá i 8-9 vrstev meděných mezispojů, v závislosti na výrobci a konkrétním čipu) rostou výrobní náklady, ale zároveň dochází ke zmenšení samotného čipu na waferu. Z hlediska nákladů a možné dostupné výrobní technologie se tedy hledá jakési optimum.Wafery jsou pod stálým dohledem a po řadě úkonů jsou vždy kontrolovány.


Proces vrstvení za použití měděných mezispojů


Toto je výčet základních kroků, které provázejí vznik čipů na waferu. S hotovým waferem pak můžeme přejít k dalšímu kroku.


Dokončení výroby, budoucí trendy a závěr
Příprava jádra a testování

Dalším krokem je právě příprava jádra budoucího mikroprocesoru. Na každém waferu jsou dnes typicky stovky jader. Wafer je vždy důkladně prohlédnut a pro další práci s jádrem je třeba každé jednotlivé jádro oddělit diamantovou pilou. Všechna jádra nemusí být plně funkční, a tak po projití optickou výstupní kontrolou bude každé konkrétní jádro samozřejmě dále testováno.


Kompletace procesoru

Každý prohlédnutý a zatím dobrý čip je umístěn na keramickou nebo organickou destičku, která umožnuje procesor umístit do socketu. V případě mikroprocesorů pro osobní počítače nejčastěji na základní desku. V případě současných procesorů x86 se používají například technologie PGA nebo LGA. Pin Grid Array je pole rovnoběžných pinů, vyčnívajících ze spodní strany procesoru. Od socketu 775 v případě Intelu a u nejnovějších Opteronů pro socket F se prosadilo fyzické rozhraní Land Grid Array.


Socket F (1207) pro procesory AMD Opteron


Narozdíl od PGA nejsou na procesoru piny pouze kontaktní plošky. Ta horší část zbyla na samotnou základní desku, kde už jakési piny jsou. Další balení mikroprocesoru záleží na konkrétním použití. Například desktopové čipy jsou dnes schovány pod IHS (Integrated Heat Spreader neboli roptylovač tepla), který má, jak už název napovídá, rozptylovat teplo. Ačkoliv ne vždy funguje zrovna optimálně jeho druhotnou, a možná ještě podstatnější, funkcí jež mu nelze upřít, je to, že fyzicky chrání samotné jádro před mechanickým poškozením. Procesory pro notebooky jsou často bez něj, protože zde jsou na ně kladeny poněkud jiné nároky, než pro typický desktopový procesor (ať již z důvodu místa nebo lepšího odvodu tepla).


Testování

Každý takto dokompletovaný procesor je opět přetestován. Z hlediska kvality a povedenosti každého jádra lze často slyšet pojem „speed binning“, což je právě třídění jednotlivých čipů podle jejich kvality. Dnes, kdy se na spotřebu procesoru začíná brát výraznější zřetel, je to jeden z podstaných ukazatelů. Nejlepší čipy mohou být použity jako nízkonapěťové nebo naopak vysoce taktované modely, za které si firmy účtují prémiové ceny.


Turion 64 X2 pro Socket S1 (638)

V případě AMD tak například ten samý procesor můžete dostat s různým napájecím napětím, což umožnuje flexibilnějsší zařazení každého kusu do nabídky. V případě výkonných procesorů, nebo například modelů s nízkým TDP (Thermal Design Power AMD definuje jako maximální možný tepelný výstup procesoru), lze tedy nabídnout přesně to, co zákazník požaduje. Může se tedy přiklonit k výkonu, dobrému poměru výkonu a spotřeby nebo se soustředit zejména na samotnou spotřebu procesoru.


Procesor je hotov

Procesor je kompletní a je prakticky možné s ním počítat jako s prodejním kusem. Po zabalení do krabice a případném přidání chladiče je již obvykle připraven k odeslání třeba k výrobci počítačů nebo do obchodu...


Athlon 64 FX „PIB“ připravený k prodeji


Budoucí trendy v navrhování mikroprocesorů

Co přinese budoucnost v návrhu a výrobě mikroprocesorů? Současné problémy s výrobou a dlouhodobě pouze mírný růst frekvence jasně udávají směr, kterým se další vývoj musí ubírat.

V první řadě to bude větší paralelizace a zvyšování IPC (počtu instrukcí vykonaných za takt), samozřejmě v kombinaci s vícejádrovými procesory. Protože však z vícejádrových procesorů těží jen specifické aplikace, dalším trendem bude v určitých oblastech, kde je požadavek specificky po vysokém výkonu při určitém zaměření, také nasazení specializovaných akcelerátorů. Procesory pro osobní počítače, jak je známe dnes, jsou sice docela dobré na všechny typy výpočtů, ale ani zdaleka nemohou konkurovat čipům navrženým speciálně pro specifické nasazení. Ty nejenže mohou několikanásobně urychlit určité výpočty, ale navíc takový výpočet dokáží provést až s řádově nižší spotřebou elektrické energie.

S počtem jader poroste potřeba jejich rychlejší komunikace a snaha minimalizovat vliv pomalé paměti na jejich výkon. Ten roste s počtem jader samořejmě mnohem rychleji než výkon a propustnost pamětí. Čím dál častější bude tedy nasazení sdílené a velké cache. Větší podpory a rozšíření se dočká také virtualizace, která má zatím uplatnění specificky spíše na serverovém trhu. Růst výkonu pro nejběžnější počítače již nebude hlavní a jedinou motivací s ohledem na výrobu procesorů a další expanze trhu s procesory, to bude také snaha o větší možnou integraci, která umožní další snižování ceny platformy.

O postupu k větší integraci a nezávislosti (absence komplexního řešení, jako má Intel, dosud AMD částečně bránilo vstupu na některé segmenty trhu) svědčí i nedávné koupení ATi Technologies firmou AMD. Stejně tak stále bližší kooperace s řadou firem vyrábějící komponenty a specializované čipy. K větší integraci akcelerátorů a posléze i GPU na jádro procesoru dojde i díky posunům ve výrobních technologiích a chytře navrženému jádru s modulárním designem. Umožní tak stavět efektivněji a levněji běžné počítače (kde dnešní architektury májí ještě značné rezervy v možném snižování ceny a jsou dražší z hlediska návrhu a počtu součástek) a zároveň počítače zaměřené na konkrétní nasazení s ohledem na specifické požadavky.


AMD / ATI integrace


Torrenza

Prvním zástupcem nové architektury a „otevřené platformy“ bude právě Torrenza. Ta kromě vylepšení některých dnešních technologií, jako je HyperTransport sběrnice, přinese také podporu zmiňovaných akcelerátorů a koncepci větší možné integrace. Jak na úrovni HTX slotu, tak na úrovni socketu samotného procesoru nebo dokonce samotného jádra (což samozřejmě proces zjednodušuje a přechod je postupný a snažší). Integrace například GPU do jádra procesoru se nemusí zdát jako optimální řešení, ale na trhu s mobilních procesorů a pro OEM výrobce počítačů to může být dostatečně výkonné řešení za minimální cenu.


AMD „Torrenza“ - budoucí platforma pro AMD64 procesory

Dalším trendem bude podle Intelu také zkracování cyklů mezi architekturami procesorů. Kratší cykly a častější změny architektur, které však budou navrhované tak, aby pokryly pokud možno všechny segmenty trhu s mikroprocesory. AMD jasně dalo najevo, že v případě následovníků architekruty AMD64 si tyto rychlejší cykly architektur k zachování konkurenceschopnosti a vyšší efektivitě zřejmě vyžádají, tedy alespoň v případě AMD, modulární design jader. Což je koncepce, a pro AMD poměrně optimální cesta, jak pružně reagovat na změny, které přinese v následujících letech Intel. Ohlášeny jsou změny architektury každé dva roky a plány agresivně zvyšovat počet jader na jediném čipu. U architektury vyráběné 22 nm výrobním procesem (pravděpodobně Gesher) Intel počítá i s řešením kde bude až 144 jednodušších jader a 48 MB cache.


Intel plánuje umístit desítky jader na jediný čip


Zdroje: AMD, Intel, ASML, FabTech