Aktuality  |  Články  |  Recenze
Doporučení  |  Diskuze
Grafické karty a hry  |  Procesory
Storage a RAM
Monitory  |  Ostatní
Akumulátory, EV
Robotika, AI
Průzkum vesmíru
Digimanie  |  TV Freak  |  Svět mobilně
24.4.2020, Jan Vítek, aktualita
Procesory AMD Ryzen 3 3300X a Ryzen 3 3100 přijdou na trh během příštího měsíce a dosud to vypadalo, že se liší pouze v jedné jediné věci, a sice v pracovních frekvencích. Jenomže to není pravda, jak se ukázalo díky uniklým materiálům. 
honza1616 (3713) | 24.4.202017:49
Pro běžného uzivatele PC naprosto nesrovnatelný rozdil.
Ale ja to pri praci poznám kdyz mi multivlaknova aplikace zatěžuje jadra z různých CCX nebo dokonce ruznych CCD,
V tomhle ma Intel neuskutečnou vyhodu i pres jeho žravost ze ma vsechny jadra a cache na jediném čipu a vsechny jadra v jednom bloku.
To je taky duvod proč 8­-jadrovy Intel 9900K stale dokaze v některých aplikacich byt lepsi nez Ryz.9 3900X a být na pul cesty i k 3950X.
Doufejme že aspon cast problému odpadne v dalsi generaci, kdy ma udajne AMD zrušit CCX bloky jader,
Odpovědět2  5
marek12 (57) | 24.4.202018:59
Áno, v mainstreame a lowende Intel stále v pohode stíha. 2, 4, 6, 8 a najnovšie aj 10 jadro vďaka skutočne vyladenej a skvelej core architektúre sú v pohode a ešte nejaký čas budú. V highende Intel končí tam, kde AMD zase vďaka geniálnej čipletovej architektúre iba začína. Je tak pekne vidieť ktorá koncepcia má kde aké výhody. Jedným dychom však treba dodať, že súčasný ZEN2 je tiež luxusne vyladený a čipletový dizajn ho nebrzdí tak ako ZEN1.
Odpovědět2  6
Vladimír Pilný (67) | 24.4.202020:47
Přiznám se, že mě nenapadá, že bych někdy viděl výsledek testu, který dopadl tak jak popisujete. Zato jsem viděl dost testů, kde si s 9900K poradí i laciný 3700X. Jinak já mám to 16jádro, provozuji dost různých vícevláknových aplikací, prováděl jsem testy ve Windows i v linuxu, ale nikde jsem nebyl schopen vnímat rozdíl, na jakém čipletu nebo CCX co běží.
Odpovědět5  0
honza1616 (3713) | 25.4.202012:44
v pořádku to zcela chápu, ve všech aplikacích se CPU nemůže chovat stejně,
já to na rozdíl od jiných dokážu přijmout že AMD muže být rychlejší a lepší, ale tak stejně pořád je dost programu nebo aplikací kde je Intel stále lepší a hravě si poradí s výkonem Ryzenu 9 3900X

1­) mám zde statistiku úkolů za 24 hodin kterou mám v účtu na stránkách projektu
https:­/­/ctrlv.cz­/shots­/2020­/04­/25­/RTRh.png
počítač označený jako DESKTOP­-MF2PG6U je Intel i9­-9900k a ten druhý pod ním je Ryzen 9 3900X
je vidět že mi 8 jádro za den nasype víc práce než Ryzen, viz dosažené časy v pravo....
2­) na dalším screenu https:­/­/ctrlv.cz­/shots­/2020­/04­/25­/oPQr.png
už vidíš můj počítač ­(2 monitory­) vlevo v textáku je jakási lokální statistika, časy odpovídají časům s předchozího screenu v 24. hodinové statistice
vše počítám na nejrychlejší nastavení viz. monitor v pravo ­( jeho levá část­)

3­) a ted ten rozdíl u AMD, jedním slovem ....chaos
https:­/­/ctrlv.cz­/shots­/2020­/04­/25­/2WRY.png

Ještě jednou říkám že AMD dokáže být rychlejší, ale né ve všem
a se zvyšujícím se počtem jader a čipletu se problémy ještě víc prohlubují
Odpovědět2  2
Vladimír Pilný (67) | 25.4.202017:09
Tak jsem si zkoušel Prime95 a máte pravdu, že se chová zvláštně. Nešlo mi nastavit 720k FFT, ale jen 768k, nicméně největší počet iterací vycházelo při 16 cores ­/ 9 workers bez HT.
https:­/­/ctrlv.cz­/Hgj7

Přitom při HT docházelo evidentně k throttlingu, což jsem nikde jinde nezažil ­(a to mám jinak CPU zatížený prakticky nonstop na 100%, ale mám jen vzduchový chladič­), takže tam výsledky nejsou tak směrodatné.

Ještě podivnější bylo ale když jsem zkoušel výchozí testy, kde se mění velikost FFT. Tam pro jednu velikost bylo nejlepší nastavení 1 worker a pro jiné 4 workers a to dost výrazně. Ovšem při opakovaném testu to vyšlo stejně, čili to není náhodná vlastnost architektury, ale prostě tak je ten benchmark postaven.

Nicméně! Ten software má poslední verzi z loňského srpna a o architektuře ZEN 2 tam v changelogu nic není. Naopak, při testu 3 workers v HT i bez HT se vždy pokusil nastavit afinitu jádru 17 ­(proboha!­), což sám vyhodnotil, jako že nejde, když je jader 16. Ale hlavně, proč nastavuje afinitu, když tuhle čipletovou architekturu zjevně nezná. Kdyby to třeba nechal na OS ­(nejlépe v linuxu­), tak to může být třeba úplně jinak. Takže hlavní tušení mám to, že se sice pokouší optimalizovat, ale blbě, a tím to spíš kazí...

Jo, ale pořád neznám žádný test, kde by byl i9900K na půl cesty mezi 3900X a 3950X, to by mě fakt zajímalo.
Odpovědět3  1
honza1616 (3713) | 25.4.202020:33
P95 si nějak nerozumí s Ryzeny, to je vidět na tom že to háže error při testu 3­-Workers stejně jako u mě

a k tomu testu FFT­-720, taky nevím čím to je ale jde to obejít tak že v dialogovém menu benchmarku kde zadáváte počet testů, stačí tam zaškrtnout ­"Benchmark allFFT implem.....­",pak vám to otestuje i FFT 720

to že při HT dochází k Throttlingu je asi vlastnost benchmarku, nebo dost možná CPU jako takových při použití AVX instrukcí
toto se projevuje i u Intelu, toto pozoruji už několik let co se věnuji této práci, není to ojedinělý jev, pozoroval jsem to už i na 4­-jádrovém i7­-6700k a i Ryzenu 7 1700,

benchmark tedy říká že je výhodnější nechat zapnuté HT ale zatěžovat max. polovinu vláken, respektive jen na fyzických jádrech
­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­-
odstavec 3.
změna FFT taky pochopitelně změní vhodnou kombinaci,
s tímto taky operujeme všichni prakticky od prvopočátku a taktéž jsem to pozoroval na všech svých CPU, to není nic zvláštního,
nejsem programátor ani CPU architekt ale myslím si že velikost FFT ovlivňuje rozložení výpočetní práce a potřebu kontaktovat další jádra stejně jako přístup do cache a paměti což v součtu ovlivňuje výkon na jádře případně na více jádrech
- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­-
reakce na poslední odstavec:
to byl ten první screen, vidíte že mi na projektu naskakuje více zpracovaných úkolů na Intelu než na Ryzenu, ne ?
https:­/­/ctrlv.cz­/shots­/2020­/04­/25­/RTRh.png
8­-jádro i9­-9900k mi dokáže za den zpracovat podstatně více práce než Ryz.3900X
a na to následovaly screeny z P95 jako důkaz že že Intel dokáže pracovat rychleji a to na nejrychlejší nastavení 2995 iter­/sec
ale AMD jen 2029 iter­/sec,
i když přiznávám že mám problémy s RAM na této sestavě, což do jisté míry Ryzen znevýhodňuje,
výsledek to až tak rapidně neovlivní, myslím si tak, že kdyby AMD nemělo problémy s architekturou a komunikací, měl bych na stejném počtu jáder odhadem přes 3000iter­/sec což by Intel s přehledem dorovnalo a při zapojení celého CPU možná i 4000iter­/sec
ale bohužel kvůli špatné architektuře mezi sebou jádra špatně komunikují a výsledek je takový jaký je

proto je Intel rychlejší a na půl cesty výkonu mezi 3900x a 3950X
- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­- ­-

věnuji se už několik let distribuovaným výpočtům, možná jste o nich slyšel v poslední době ve spojení s hledáním léku na COVID­-19, toto je stejný princip jen projekt s jiným zaměřením
jestli se o tom chcete dozvědět více můžete se přidat do české komunity
https:­/­/www.czechnationalteam.cz­/
nebo nás rovnou kontaktovat v případě dotazů na našem foru ­(já tam mám stejné jméno­)
https:­/­/forum.czechnationalteam.cz­/

minimálně 1 náš člen už má taky tento 16­-jádrový Ryzen ale ještě nebyla příležitost se o tom takto bavit a on ještě neměl čas ho otestovat
bylo by docela zajímavé kdyby jste nám poskytl taky podobnou 24h statistiku, jak je tento CPU rychlý, a kolik dokáže za den nasypat práce

v případě zájmu nebo jakéhokoliv dotazu k naší práci nás nebo mě neváhejte kontaktovat na našem foru
;­-­)
Odpovědět2  0
Vladimír Pilný (67) | 26.4.20201:13
Já sice programátor jsem, ale Prime95 téměř neznám. Jen mám mnohokrát ověřenou zkušenost, že na optimalizacích opravdu hodně záleží. Kdysi jsem třeba v jednom grafickém filtru který počítal tenzorová pole v javě pouze změnil směr procházení ­(všechny výpočty byly stejné jen v jiném pořadí­) a hned to bylo 2,5x rychlejší. Žádné algoritmické vysvětlení ale nebylo, kompilátor nemohl vymyslet optimalizaci, muselo jít nejspíš o vliv cache CPU. Je dost pravděpodobné, že na jiném CPU by se to chovalo úplně jinak.

No a podle toho špatného přiřazování afinity na neexistující jádro tuším, že v Prime95 optimalizace pro Ryzen nejen chybí, ale spíš mu ještě škodí. Pokud program přesně nezná strukturu CPU, pak je lepší si s afinitou nehrát a nechat to aspoň na OS.

Bohužel podobné ignorování Ryzenů je stále ještě občas zažité z dob dlouhé nadvlády Intelu. Viz nadávná kauza s Matlabem. Naštěstí se to postupně lepší.

Jinak mě by fakt zajímalo, jestli je nějaký program, který škáluje dobře s více jádry ­(tj. Ryzen 3950X je na tom líp než 3900X­) a přitom je i9900K mezi nimi. Já jsem takový nezaznamenal. Prime95 evidentně škáluje špatně a i9900K na tom může být klidně líp než můj.

Já AVX i AVX2 používám pořád ­(například x265­) a nikdy mi to takhle nethrottlovalo. Trvale mi běží při 100% zátěži na ~3,8GHz a 75­-80°C. Ten Prime95 je v tom nějaký extrémní. :­-­)

Ano, už asi týden počítám COVID v Rosettě za CNT :­-­)
https:­/­/statistiky.czechnationalteam.cz­/index.php?akce=user&id_user=27344
Ale nedávám tomu celý výkon, ani neběžím 24h denně, ale jen tak 16.
Odpovědět3  0
honza1616 (3713) | 26.4.202023:49
P95 se běžně používá i při recenzích na nové CPU,
ale hlavně kvůli tomu že dokáže opravdu na max. zatížit CPU, takže je vhodný k testování stability OS a HW hlavně pak po OC, protože nic nezatíží CPU tak jako AVX aplikace
a vidíš pak i kolik sestava sežere při max. zatížení, vidíš jestli máš dobře dimenzované chlazení atp.

nejvíc mě baví OC ­"experti­" co si přetaktují CPU na 5GHz při 1,0000001V a machrují jak jim to krásně jede, hrají na tom hry, ale aby CPU skutečně pořádně zatížili, to ne ... :D na to nemají koule :D protože by jim to házelo BSOD
Odpovědět0  0
Vladimír Pilný (67) | 27.4.20200:36
Já netaktuji a PC mám 100% stabilní. Zejména od té doby, co jsem odhalil a vyměnil jeden vadný 16GB modul ­(chyba v jednom bitu­). Teda ono mi to PC za 5 měsíců kvůli hardwaru nepadlo nikdy, jen dělalo tehdy náhodné bitové chyby v datech. Ostatně Ryzeny jsou de fakto přiměřeně a spolehlivě taktované už od AMD. ;­-­)

Na max ­(žádné prázdné cykly­) dokáže vytížit CPU leccos a nelze říct, že to je nedostatečně, kór když to je real­-world aplikace. Jen holt některé typy instrukcí dokaží ­"udělat peklo­" v některých malých obvodech a způsobit lokální přehřívání, na které se pak musí reagovat. Navi Radeony mají síť 64 teplotních čidel, nedivil bych se, kdyby na tom loňské Ryzeny byly podobně. Takže klidně může nastat situace, kdy lokální přehřívání způsobí throttling, ačkoli v jiném benchmarku který jinak vyžaduje větší celkový příkon CPU nikoli. Takže který z nich je pak směrodatnější?
Dnešní CPU jsou natolik komplexní samostatně fungující entity, že je nikdy nelze vystihnout jediným benchmarkem.

Ostatně intel se svým podtaktováváním při AVX2+ tím trpí mnohem víc. Mně ostatní AVX2 aplikace běží naplno.
Odpovědět1  0
Zajímá Vás tato diskuze? Začněte ji sledovat a když přibude nový komentář, pošleme Vám e-mail.
 
Nový komentář k článku
Pro přidání komentáře se přihlaste (vpravo nahoře). Pokud nemáte profil, zaregistrujte se pro využívání dalších funkcí.