Intel kompilátor a SW proti HW prefetchingu AMD
13.6.2007, Bohumil Federmann, aktualita
Již jsem se blíže věnoval práci na softwaru a virtualizaci u AMD. Je naprostou samozřejmostí, že Intel na tomto poli rovněž nezahálí a i to je středem jeho pozornosti. 6 týdnů srovnávacích testů Intelu s AMD dle tvrzení serveru Real World...
Již jsem se blíže věnoval práci na softwaru a virtualizaci u AMD. Je naprostou samozřejmostí, že Intel na tomto poli rovněž nezahálí a i to je středem jeho pozornosti. 6 týdnů srovnávacích testů Intelu s AMD dle tvrzení serveru Real World Technical přineslo své ovoce. Hans de Vries vyzdvihuje práci kompilačního týmu a přímo uvádí:
Intel stále těží z jednoduchosti a pokračuje v používání FSB. Jeho nové Quad-Core je v podstatě spojením dvou Dual-Core a je více než pravděpodobné, že si s touto architekturou vystačí i pro některé 45nm procesory - viz jeho pdf dokument. AMD naopak těží z datové šířky a HyperTransportů včetně řadiče pamětí. Zde se přímo nabízí použití prefetch technologii na úrovni hardware a dosáhnout tak značných výhod v mnohojádrových sestavách. Intel se snaží tento handicap vyrovnat pomocí softwarové kompilace, ve které má bohaté zkušenosti již od svého Itania.
Výsledek práce kompilačního týmu.
Spojení osmi jader procesoru u Intelu.
Spojení 16 jader a 32 jader procesoru u AMD.
Srovnání velikostí Si
Zdroj: Real World Technical, SPEC2006
- 3GHz Opteron je výkonnější než 3GHz Xeon v SPEC2006.
- Velmi vynikající prací kompilačního týmu bylo za šest týdnů dosaženo 17% až 18% zlepšení Xeon SPECInt skóre.
- Merom má nyní extrémně dobrý výkon a dobře konkuruje OPTERONU architektury K8 pracujícímu se dvěma vlákny, ale AMD Barcelona zpracovává současně čtyři vlákna, což je dvojnásobek.
- Alternativou pro hardwarový prefetching je kompilátor používající softwarovou prefetch technologii. Dostatečně inteligentní kompilátor by byl schopen dosáhnout podobných výkonnostních vlastností.
Intel stále těží z jednoduchosti a pokračuje v používání FSB. Jeho nové Quad-Core je v podstatě spojením dvou Dual-Core a je více než pravděpodobné, že si s touto architekturou vystačí i pro některé 45nm procesory - viz jeho pdf dokument. AMD naopak těží z datové šířky a HyperTransportů včetně řadiče pamětí. Zde se přímo nabízí použití prefetch technologii na úrovni hardware a dosáhnout tak značných výhod v mnohojádrových sestavách. Intel se snaží tento handicap vyrovnat pomocí softwarové kompilace, ve které má bohaté zkušenosti již od svého Itania.
Výsledek práce kompilačního týmu.
Spojení osmi jader procesoru u Intelu.
Spojení 16 jader a 32 jader procesoru u AMD.
Srovnání velikostí Si
- Prefetch je rovněž komponenta správce paměti Microsoft Windows počínaje Windows XP.
- SPEC2006: Standard Performance Evaluation Corporation, velmi rozsáhlý a složitý systém testování nejenom procesorů
Zdroj: Real World Technical, SPEC2006