Zajimavy clanek. avx512 bych nezatracoval, preci jen intel se svym rucne optimalizovanym asemblerem dokaze hodne, viz 32 particle movement benchmark s AVX: https://www.anandtech.com/bench/product/2787?vs=2675
Procaky v porovnani:
Intel Core i9-11900K (8C/16T, 125W, $539) - (Rocket Lake) 3.5G Base, 5.3G Turbo
AMD Ryzen 7 5800X (8C/16T, 105W, $449) - 3.8G Base, 4.7G Turbo
Vysledek:
intel: 32211
amd: 5624
protoze ale zdrojaky nejsou k dispozici clovek si nemuze overit zdali avx2 kod neni prilis pesimisticky (neoptimalizovany).
Super clanek a test, diky!
Jinak se tak nejak ukazuje, ze mistni odbornik na kodeky a encodovani videa se malinko spletl. Takhle to ted vypada, ze Raketa neni uplne raketa ve vykonu, zatimco v prikonu doslovne - a to prave v jim vyzdvyhovanem pripadu - video encodingu. Ale mozna zase autor testu udelal chybu, ze netestoval Intel CPU na 5,3 all-core ;) Mam ale spis pocit, ze mistr CeKacko 53 se ted sam schovava v garazi, kterou tu stale castuje jine :D
Tak trošku mi uniká pointa, tak buď ta aplikace umí využít AVX-512 a je pro něj napsaná a zpracovává pro ně data. Takových aplikací bude asi zatím velmi málo. A nebo se jedná o nějakou hybridní technologii, která to sice umí využívat, patlá několik výpočtů do sebe, což je popsáno v tomto článku. A pak se diví, že to nefunguje, topí to a má to nízkej výkon. Lamborgini umí taky jezdit 300kmh a má výkon stovky koní, ale kamion za to stejně nezapřáhneš. Podle mě celej ten test, je totálně mimo, hlavně že tábor červených tady nad tím skotačí jak indiáni okolo táborového ohně. Jediná firma co tady vyrábí přímotopy je AMD, viz prohlášení Lisy, že 100°C je v pohodě a procesorům nevadí. Viz AMD Polaris 83°C+ nefungující odběr a přes limit základní desky odebírající výkon, apod...
k té tvé poslední ... druhá možnost v ankete
k té tvé první ... na tohle nepotřebuješ grafy, každý ví ... otázka je, co je ta "podobná práce" ... pokud člověk nedělá nic, než enkódování, voba je jasná, pokud enkóduje hodinu do týdne, je to podobná práce, ale jen hodinu týdně ...
A kolikrát se ozveš, když tu tupej C.k. Vylhánek blije každodenní dávku hejtovacího hnisu na AMD? To jen napíšeš, že je to vlastně vtipnej troll a ať ho necháme být, ale u trollingu na Intel je to najednou problém..
Navíc tohle použití dělá z RL opravdu 300W těžko uchladitelný přímotop.. takže posměšky jsou dost na místě.
Tenhle test AnandTechu (3DPM 2.1 AVX2/AVX-512) je anomálie a pokud můžu říct, je to asi problém softwaru.
Myslím, že se tam naráží na to, že kód používá nějakou operaci, na kterou má AVX-512 speciální instrukci, která v AVX2 není. Má to snad být nějaká 64bitová konverze mezi INT a FP, jestli si dobře pamatuju, ale nějak se mi nedaří to doheldat. A celý ten výkonnostní rozdíl dělá snad jediná tahle operace. Takže by to byl spíš mikrobenchmark (a zůstává ta otázka, jestli je správně napsaný).
Ian Cutress říká, že to někdo ručně optimalizoval, i když to podle těch výsledků úplně nevypadá. IMHO by nejspíš ta operace šla ručně rozepsat na kód v AVX2/AVX/SSE* a pak by rozdíl byl maximálně 2-3×.*
Je dobré pamatovat, že to není nějaký software, který by se normálně používal, ale diplomka autora/redaktora, do které byl potom přidaný ten kód AVX-512 a AVX2 někým jiným. Je hodně otázka, jestli to do testování patří. Normálně by tenhle aspekt nevadil, ale v kombinaci s tím, jak se to chová...
Jako příklad: AnandTech to použil k porovnání jader Skylake a Cannon Lake a vyšlo mu, že je Cannon Lake třicetpětkár rychlejší: https://images.anandtech.com/graphs/graph13405/105622.png
Je pravda, že to pořád ukazuje výkon té jedné specifické operace (pokud tedy není ta větev kódu, kterou to používá na procesorech bez AVX-512, špatně napsaná). Ale v programech, které budete používat, tohle zrychlení nikdy neuvidíte.
-------------------------------------------
Rozhodně jinak souhlasím s tím, že se AVX-512 nemá zatracovat.
Doufám, že bude brzo ve víc procesorech než teď (AMD snad v Zen 4, i když tam to ještě nemusí mít ideální výkon, spíš to asi poběží stejně rychle jako s AVX2 - no teda kromě toho 3DPM, tak asi taky bude lol výsledek jako na Intelu). Protože jako užitečné rozšíření to určitě je, AVX-512 zase rozšíří možnosti optimalizace aplikací a je proto třeba, aby bylo v co největší základně procesorů a vývojáři měli motivaci to používat.
Jen teda podle tohohle benchmarku se neorientujte :)
Pokud chcete test, který ukazuje přínos AVX-512 víc realisticky, tak bych navrhoval yCruncher v jednom vlákně, kde je vidět, že AVX-512 dosahuje výrazně lepší výkon, než má jádro Zen 3 nebo Skylake bez AVX-512 (v multithreadu už to zdá se moc vidět není, asi proto, že výkon procesoru je pak omezený propustností paměti, a tudíž se už zrychlení nemá šanci projevit?).
Viz https://www.cnews.cz/test-amd-ryzen-9-5950x-32vlaknovy-procesor-na-ktery-intel-nema-odpoved/32/ (druhý graf, "single threading")
*
Třeba v x264/x265 myslím takovýhle případ, že by neexistence nějaké instrukce v předchozích procesorech vedle k podobným průlomovým zlepšením, nikdy nenastal (taková ta 2-3x zrychlení *dílčích funkcí* jo, ale pak to ve výsledku dá pár až několikprocent). Tohle spíš připomíná jiný případ. Když zkusíte spustit x265 a procesoru, který má jenom SSE2 a chybí mu SSE4, tak tam bývalo a nejspíš pořád je asi 3-4× zpomalení proti tomu, jaký by ten procesor měl zhruba mít výkon. A je to proto, že hodně SIMD assembleru je napsaná s předpokladem, že má CPU minimálně SSE4, takže se na CPU bez SSE4 nespustí a běžíte jenom s C++ kódem. x264 tohle nedělá protože je starší a všechny SIMD funkce jsou pokryté i pro procesory s SSE2.
gogo1963 9.8.2021 at 15:16
Mozna to jako posmesek (ode me) muze znit, ale neni. Ja jsem za Intel rad a to dokonce i v pripade RL. Dokonce jsem uvazoval o porizeni v pripade, ze AMD APU bude nedostupne. Co se tyka toho 5700G, tak bylo za cenu, za kterou bych mohl poridit treba tu i7-10700 i s deskou, jen to iGPU je pouze zobrazovadlo (ja jsem potreboval trochu vic).
Ode me to byl trochu stouch do vsech tech vylhanych od od otravneho toxickeho CeKacka, ktery tu pel ody na RL a jak jsou tyto CPU bezkonkurencni na encoding a podobne nesmyly. Kdyz je realny vysledek s peknou analyzou venku, tak je zalezly nekde v garazi, kterou tu neustale urazi lidi. Mozna je na dovolene, ale to nic nemeni na trapnosti a lzivosti jeho trapnych prispevku.
Co se tyka AVX-512, za me je to take rozhodne dobre, jen to uplne neskaluje s prikonem, to bychom se ale obecne mohli bavit o efektivite kdejakeho "top", "high-end" produktu, ktery ma vyhnany vykon za cenu nelinearne rostouciho prikonu a ceny (coz v tomto pripade AVX-512 je).
Ad zast k vyrobci - tohle jde mimo me uplne. Jsou spolecnosti, ktere maji politiku, se kterou se nestotoznuji, nebo treba jen politiku jistych produktu. Jako priklad bych uvedl Nvidii a jejich pristup k opensource ovladacum, resp. jak doslova kaleji na tyto principy. Na druhe strane bych ale na praci nedoporucil nic jineho, nez Nvidia GPU, protoze AMD ovladace jsou neskutecny nefunkcni srot.
A jeste jedna vec, vas "AMD aristokracie" (za kterou se ja osobne rozhodne nepovazuji a ani bych nechtel byt spojovany s jakoukoliv firmou typu AMD, Intel, Nvidia) prece nemusi vzrusovat, mate svoji dobre fungujici i7, tak jste v klidku, ne? :)
To IMHO není pravda, jenom je to kombinace toho, že
a) x265 má jen omezené zrychlení, i když těch +8-9 % výkonu podle mě s přihlédnutím k tomu charakteru kódu taky není málo (a z části to může být i tím, že AVX-512 nemusí být použité úplně všude, kde by se to při maximálně brutální optimalizace dalo udělat)
b) implementace Intelu na 14nm procesu. Ten procesor prostě příliš žere a Intel ho nechává běžet na neoptimálních frekvencích a napětích.
Myslím, že na 10 nm, tj. Ice Lake-SP (třeba těch Xeonech W-3300) a na Tiger Lake by ta efektivita mohla dopadnout už o dost líp.
Jinak co tak vidím, tak lidi, co se věnují optimalizování kódu na procesorech x86, mají prakticky vždycky nebo ve velké většině případů AVX-512 rádi a chtějí ho.
pokud vím, ck enkoduje přes nvenc, což není zrovna ideální způsob, ale když mu to vyhovuje ... nepamatuji se, že by tady vyvřeskoval něco o tom, jak je AVX512 nej nej ... to už má lepčí encod přes quicksync .. možná jsem nečetl všechno ...
... a s tím "vzrušováním" ... no ... kdopak tady pod články o cpu-gpu řádí od modrých? CK, Hnízdo, Crha, Gogo, Vlka už to nebaví, nedivím se ... občas probleskne někdo navíc, Radek fandí Intelu jen jako akcionář ... zbylých 90%, je to vidět třeba i v anketách, je z tábora géniů ... schválne to ani nedávám do uvozovek, aby se někdo neurazil ...
Upřímně řečeno, nedokážu si představit reálnou situaci, kdy se vyplatí nést náklady nižší frekvence a zároveň vysokého hrubého příkonu výměnou za dostupné AVX-512 instrukce (tím netvrdím, že nic takového neexistuje, ale já jsem poctivě hledal, a takový scénář nenašel. Nejvíc co se blíží, je právě ten Handbrake)
Další věc je, že AVX-512 podporují jen Intely, a to ještě ne všechny. A jak jsem už psal - řekněme 10-15% navíc za cenu srovnatelně vyšší spotřeby - to mi připadne jako l'art pour l'art.
AVX512 mohla byt featura, ktera mohla delat RL aspon trochu zajimavym oproti konkurenci. Evidentne se to moc nepovedlo a zapada to do nepovedeneho obrazu RL CPU jako celku. Oproti CL neni vyjma trochu vyssiho vykonu, zajimavy prakticky v nicem (snad vyjma podpory AV1) a CL jej valcuje i cenou.
To ze tady CK emental mozna nepel ody presne na RL AVX512 je celkem podruzne. Otravoval tady ise svymi priblblymi nesmyslnymi mentalitami nescetnekrat.
Moc nerozumím vašemu povzdechu, že AVX512 mohlo dělat RL zajímavým proti konkurenci. Z čeho usuzujete, že ho to zajímavým nedělá? Z toho, že implementace h.265 ho není schopna pořádně využít? Tak už to u algoritmů chodí, že ne vždy se hodí všechny instrukce či datové typy.
Z mého pohledu, jako z pohledu bývalého programátora, může být implementace AVX512 zajímavá kvůli psaní programů, které AVX512 budou využívat. Bez procesoru, který to umí, se to programuje dost blbě.
Jinak na nějaké výpočty RL není. Tam je bez diskuze lepší pořídit si buď 5900x či 5950x nebo ještě něco lepšího ze serverového světa.
Radek Holeček, tombomino
Ja myslim, ze mate pravdu oba, ale take mluvite o malinko necem jinem.
Moje chapani je, ze Radek mluvi o specializovany instrukcich / funkcich navic, ktere programator muze a nemusi vyuzit. Jak moc efektivni to je ted, potazmo do budoucnosti je jina diskuze. Programatorovi tato funkce treba muze ve specifickem pripade ulehcit zivot nebo dat rozvoj vylepsene implementaci.
tombo ma zase na mysli efektivitu / realny dopad na BFU, kde v produktu pro desktop ma zapnuti AVX512 horsi vysledek (efektivita), nez bez.
Za me oba dva validni nazory. Me treba AVX512 v RL tesi (programator nepotrebuje drahy Xeon na uceni se / zkouseni si) a s ohledem na testy je i dobre, ze v standarnim nastaveni je AVX512 vypnute. Takze zrovna toto je pro me + pro Intel.
gogo1963 10.8.2021 at 13:15
“takže pravdu má Radek, nikoliv Tombo … “
Podle me oba maji validni pohled na AVX512. Ten tombuv - Vzpominate jak se tu zeleni fanatici posklebovali AMD pro jejich funkce v GPU, ktere “nikdy nikdo nevyuzije”? Tak presne tohle je AVX512 (Jak u tech AMD GPU, tak u AVX512 mam na mysli pohled BFU).
tombomino 11.8.2021 at 18:19
Za me neni co “zvladat”. gogo ma svuj styl a je vyrazna osobnost. Tak to beru a problem s nim nemam :)
gogo1963 11.8.2021 at 18:54
Nic spatneho. Stejne tak jako o vas. Vetsinou se snazim porozumet ve smyslu “ocekavej dobre umysly”. Na druhe strane jsem tu ve ctyrech pripadech selhal - aroganci s hlouposti, demagogii a lez, psychopatizmus a nakonec zakerneho netaktniho srabika tolerovat nedokazi a hlavne nechci. O ktere 4 se jedna urcite z mych prispevku poznate..
Tombo, :D copak jsi vzdal? Nejsem to já, kdo potřebuje cokoliv vysvětlovat ... že ty meleš často úplně od věci a pak děláš, že tos nebyl ty ... když ty vyčítáš někomu něco, co jsi sám udělal chvilkju předtím ... to jsou tvoje domény ... ty přimrdlé řeči o tom, jak já ničemu nerozumím a jak tebe nebaví něco mi vysvětlovat, jsou víc, než komické ... Alichovi můžeš jen děkovat, že ho rodiče dobře vychovali, když tu tvoji neziskovkářskou blábolivou existenci nesmete pod stůl a snaží se komunikovat s tebou, jako s rovným (v tom ho docela obdivuji) ... nechtěl bys vědět, co si o tobě opravdu myslí ... a já taky ne :D