reklama
Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně

90nm od AMD - Athlon 64 3000+ pro socket 939

27.9.2004, Eagle , recenze
90nm od AMD - Athlon 64 3000+ pro socket 939
Poštěstilo se mi být prvním člověkem v ČR (počítáno včetně lidí z AMD), který měl možnost vyzkoušet nejnovější výrobní technologii 90nm od největšího rivala Intelu. Dnes popisovaným produktem není samozřejmě nic jiného než již přes půl roku očekávaný Athlon 64 3000+ pro socket 939. Ten má přinést podporu dual-channel paměťové konfigurace při přijatelné ceně.
Testovací konfigurace

Testování mi tentokrát zabralo asi čtyři dny v kuse, můžu tedy říct, že toto byl opravdu vyčerpávající test. Chtěl jsem porovnat výkon nejen s Pentiem 4, ale také s 3000+ pro socket 754 (... které má jako kompenzaci pouze jednokanálového řadiče pamětí o 200 MHz vyšší frekvenci, tj. 2 GHz) a s imaginárním 3000+ pro socket 939 založeném na jádře NewCastle (abych porovnal, o kolik je nová revize výkonnější na stejné frekvenci než starší jádro). Použity byly následující konfigurace:

Athlon 64 3000+ s939, 90nm Winchester DH8-D0, 1.8 GHz, 512kB L2
Athlon 64 3000+ s939, 90nm Winchester DH8-D0 přetaktovaný na 2.3 GHz
Athlon 64 3000+ s939, 0.13um NewCastle DH7-CG, 1.8 GHz, 512kB L2
Athlon 64 3000+ s754, 0.13um NewCastle DH7-CG, 2.0 GHz, 512kB L2
Athlon 64 FX53 s939, 0.13um ClawHammer SH7-CG, 2.4 GHz, 1MB L2

Všechny tyto procesory jsem otestoval v základní desce MSI K8N Neo2 Platinum s čipsetem nForce 3 (250) Ultra. 3000+ pro socket 939 na jádře NewCastle jsem "vyrobil" podtaktováním 3500+ NewCastlu a 3000+ pro socket 754 jsem obdobně získal podtaktováním 3500+ka na 2GHz, snížením násobiče HyperTransportu z 5x na 4x (800 MHz HyperTransport) a přehozením pamětí z dual-channel na single-channel. Dodnes mi není příliš jasné, proč AMD takovýto postup nezvolilo už od začátku a neposlalo socket 754 k ledu rovnou - výkon 754ky je možné z 939ky tímto způsobem vyrobit během dvou minut.



Pentium 4 Northwood 3.0 GHz s odemčeným násobičem
(Engineering Sample)

Jako konkurence ze stáje Intel sloužilo osvědčené 0.13um Pentium 4 s jádrem Northwood na 3.0 GHz na základní desce Intel 875PBZ "Bonanza". Prescott se bohužel v redakci nenachází a i tak se domnívám, že "Inteláci" sáhnou raději po méně hřejícím a výkonnějším Northwoodu.

Paměti byly použity již zmíněné Kingston HyperX DDR400, 2x 256MB. U těch jsem nastavil průměrně rychlé časování 7-3-3-2.5 / 1T command, abych simuloval zhruba to, co dostanete koupí levných značkových pamětí po "přetaktování" časování (levné moduly DDR400 mají běžně 8-4-4-3 !). Toto mi přijde jako rozumné řešení, nepředpokládám totiž, že si někdo k procesoru za šest tisíc koupí paměti za 10 tisíc. Jedinou výjimku co se týče pamětí jsem udělal u FX53, které bylo otestováno s dvěma Corsairy XMS3200, 2x 512MB, s nastaveným časováním 6-2-3-2 / 1T command a s dále vylepšeným nastavením jako idle timer na 256 cyklů. S tímto nastavením (a díky 1MB L2 cache) se pochopitelně výkon FX53ky pohybuje trochu v jiné dimenzi, nicméně vzhledem k ceně procesoru... tyto výsledky proto berte jako nejvyšší výkon v současnosti dostupného procesoru.

Stejně jako při testu Sempronu byl použit operační systém Windows XP SP1 bez aktualizací a s DirectX 9.0c. Jako grafická karta sloužil Radeon 9800 Pro s ovladači Omega založenými na Catalyst 4.7. Toto vše z toho důvodu, abyste mohli porovnat výsledky s minulými měřeními. Ovladače pro čipset byly nejnovější verze 5.10.

Výkon - paměť


Nový procesor by měl mít o něco rychlejší paměťový řadič. To se také ukázalo, i když rozdíl je velmi malý, v řádu asi půl procenta.

K prakticky stejnému výsledku je možné dojít u nebufferovaného testu, jen je zde rozdíl ještě menší.

K tomuto testu ještě jedna poznámka - všimněte si nepoměru výsledků mezi sockety 754 a 939 v buffered a unbuffered. Zatímco v buffered (s uvažováním cache a silným prefetch) dosahuje 939ka více než 160 procent výkonu 754ky, v unbuffered testu (... který více odpovídá realitě) je to již jen asi 130 procent výkonu. Proč tomu tak je? Athlon 64 používá 64byte line a natahuje jí jednu (Pentium 4 používá také 64byte, ale běžně natahuje dvě s tím, že je možné toto změnit úpravou MSR na jednu). V praxi to znamená, že když program přistupuje k proměnné nějaké velikosti, načte se vždy celá line, ve které tato proměnná sídlí. 64byte je ideální hodnota pro paměti typu DDR SDRAM, protože ty dokáží v burst režimu přečíst právě až 8 buněk:


y/2-1/2-1/2-1/2

1/2 značí, že v prvním půlcyklu je přečtena jedna hodnota a v druhém půlcyklu další. "y/2" pak značí inicializační latence do přečtení první hodnoty (rychlost vyhledávání, známé hodnoty RAS, RAS-to-CAS delay, CAS latency a jiné) a následné čtení další hodnoty v dalším půlcyklu. Pokud se o počítače zajímáte déle, jistě vám něco řeknou zápisy jako 7-1-1-1 (typické pro SDRAM paměti) nebo 6-2-2-2 (typické pro Enhanced Data Out (EDO)) či 6-3-3-3 (typické pro Fast Page Mode). Protože modul DIMM pamětí DDR SDRAM má datovou šířku 64bitů, je v jednom půlcyklu přečteno 8 byte. Celkových osm půlcyklů pak znamená přesně 64byte. To je pro Athlon s jedním řadičem DDR pamětí naprosto ideální hodnota. Naproti tomu Pentium III má 32byte line (používá totiž pouze klasické SDRAMy, které jsou schopny načíst jen čtyři hodnoty) a Pentium 4 čte běžně dvě 64byte po sobě (to bylo zase konstruováno pro RDRAMy, které měly problém s latencemi, ale datový tok měly více než solidní). Proto je Pentium 4 tak velmi hladové po velikosti cache, tyto data totiž někam musí ukládat. Odměnou za větší cache a vyšší propustnost pamětí je vyšší efektivita cache a méně tzv. cache miss, kdy data nejsou nalezena v cache, ale musí se pro ně do RAM (což trvá věčnost).

Tohle se stalo, když jsem na testovaném 3 GHz Pentiu 4 přepnul standardní prefetch z 2x 64byte na 1x 64byte. Skóre v bufferovaném (prefetch) testu kleslo téměř na polovinu! Je vidět, že zvýšením délky prefetch mechanismu je možné získat hodně výkonu navíc, samozřejmě za předpokladu, že systém k tomu má odpovídající paměťový řadič. Proč tedy Athlon 64 s939 tolik z dvojkanálového řadiče neprofituje? Jednoduše proto, že procesor je pořád nastaven jen na 64byte prefetch. Dual-channel tak pro něj má smysl pouze v okamžiku, kdy procesor přistupuje k různým datům v rámci různých paměťových řadičů - nebo-li pokud jeden řadič čte jedny data a druhý jiné. To se však nemusí stávat tak často, protože běžně kompilátory umísťují data v paměti hned za sebou, tj. požadavky často spadnou právě do jednoho line (64byte je na mnoho výpočtů relativně hodně dat), které vyřizuje jeden řadič... a druhý se mezi tím fláká.

V testu SuperPI jde hodně o rychlost přístupu k paměti. Všimněte si však, že 3000+ s754 s vyšší frekvencí je rychlejší než 90nm novinka.

A to platí i v okamžiku, kdy počítáme s opravdu monstrózním datovým setem (cca. 250MB). Vyšší frekvence (jednoho) řadiče a jádra zjevně spíše přispívá k vyššímu výkonu než dva řadiče. Příjemnou zprávou však je, že nové jádro je skutečně o maličko rychlejší než Newcastle revize CG.
reklama