U mě zatím žádný dojem - ani pozitivní, ani negativní. S ohledem na ohlášenou spotřebu se žádný wow-efekt nekoná.
Osobně si stále myslím, že celý design "x86 big.litttle" je překombinovaný a bude problém udržet scheduler na uzdě, s čímž se pojí problém neočekávaných výkonových propadů. Jestliže platí, že oba typy jader mají jiné IPC, bude nutně výkon kolísat nezávisle na nastavené frekvenci. Když si vzpomenu, jak se u Zenu řešilo přiřazování ST úloh vybranému "lepšímu" jádru, tak tohle mi připadá jako stejný problém, ale na steroidech. Nevěřím, že toto zvládne integrovaný scheduler bez ztráty kytičky - možná tak v benchi.
to že Gracemont konečně dotáhnul výkonem Skylake z roku 2015 není na žádnou oslavu... spíš smutné.... ať žije pokrok !
ad ty marketingové grafy ohledně spotřeby: ono když se srovnává 14nm a 7nm tak to pak ta spotřeba/velikost jádra vypadá hezky...
lepší bude počkat na nezávislé testy, zatím je tam až přiliš mnoho neznámých proměnných, nevíme jak dobře bude fungovat koncept Big-Little nebo přehazování vláken prostřednictvím Thread Directoru atd. a v neposlední řadě o případném zájmu o koupi bude ve velké míře rozhodovat nastavená cena.
když nic jiného, aspoň by AL mohl vytvořit určitý cenový/výkonostní tlak na AMD , což je pro nás zákazníky dobře .-)
PS: díky Honzovi za pěkný rozbor i ten "ukecaný" úvod na začátku článku
Alder Lake
Zapnu vypocetni aplikaci a zacne pocitat:
scheduler zapne prvni male jadro, nestaci to, zapne druhe male jadro, nestaci to, zapne treti male jadro, nestaci to, zapne ctvrte male jadro, nestaci to, zapne pate male jadro, nestaci to, zapne seste male jadro, nestaci to, zapne sedme male jadro, nestaci to, zapne osme male jadro, nestaci to, co ted?
V horsim pripade se dosahne limitu PL1 a nic dal nebude. :-)
V lepsi pripade zapne prvni velke jadro, nestaci to, zapne druhe velke jadro .... :-D
Tady někdo nemůže těžce spolknout že AMD jde pomalu a jistě do kopru, co se týče Tynýta, tam není co řešit, je ho před vydáním AL všude plno a plive kolem sebe kde se dá, ale nečekal jsem tak těžký fanatismus od Delsy42, ten zase plive na Intel kde se dá, hlavně na PcT, co se týče dementů z Diitu, tam není co řešit, stačí si přečíst a potom si dát těžkou sodu a rozdejchat to. Já osobně už se těším až hodím 5950x a 5900x do popelnice a rozloučím se s nedodělky od AMD a opět osedlám Intel, jj uznávám že to trošku trvalo ale konečně je tam kde má být.
Tak ja neviem, všade že Skylake, že menšia spotreba a +- rovnaký výkon, no Skylake je 14nm... keby spravili skylake 7nm nežral by menej a nebol by menší? jasné že áno... ja tam nevidím nič prevratné, proste menší výrobný proces prináša benefit v spotrebe a veľkosti, inak nula, nula..... nič prevratné. Či je riešenie v desktope dať namiesto jedného poriadneho jadra s HT menšie a viac uvidíme, no v desktope asi to nebude terno..... veľa malých alebo radšej menej veľkých s HT? Ja osobne radšej menej veľkých by som bral..... v mobilnom segmente možno, ale teším sa, niečo nové, bude čo čítať a testovať a kritizovať...
Hybridná technológia big.LITTLE je vynikajúca cesta
ako radikálne zvýšiť efektivitu procesorov. To nám
už takmer rok dokazuje Apple svojim integrovaným
procesorom 4C+4c. Intel sa rozhodol pre najlepšie
riešenie s ohľadom na najbližšiu budúcnosť i
strategický význam. Hustota tranzistorov sa bude
navyšovať a nepríjemnosti s tým spojené je
potrebné preventívne riešiť, čo aktuálna hybridná
technológia v podaní Intelu práve robí.
Zjednodušený príklad – prečo by sa malo 16 výkonných
jadier škvariť pod vysokým napetím, za vysokej
teploty a neefektívnom pásme s vysokou spotrebou,
ak môžme záťaž rozložiť na 32 fyzických jadier bez
HT, ktorých pracovný bod bude vo vysokoefektívnom
pásme, pričom tranzistory budú tikat na pohodových
frekvenciách s veľmi nízkym Vcore a tým pádom
nízkej teplote a zlomkovej spotrebe....
Ano, Intel s Apple odhadli ďaľší vývoj správne,
AMD zachrápalo, tak-či-tak červení budú prinútení
nastúpiť do rozbehnutej mašinérie, ale so sklzom
pravdepodobne 3-4 roky...
Honzo, pokud ty malé jádra jsou bez HT technologie, tak je příště srovnávej s procesorem SkyLake také bez HT, tudíž 6600K, který točí alespoň u mě 4,4GHz a jsou týpci co z toho vytáhli i 4,6GHz. Takže jestli v tom procáku jsou dva skylajk procáky a k tomu další osmijádro, tak se obávám, že to bude víc jak 50%+ výkonu všude tam kde to dokáže aplikace využít.
Jak se budou taktovat K verze? Nejspíš nebudou mít společnej násobič co ?
Skúsim analógiu. O výkon malých jadier Gracemont pod vulkánom by som sa nebál nakoľko aj taký Zhaoxin KaiXian KX-U6580 2.5GHz v DOOM z nižším IPC ako Tremont (a Gracemont) s ním nemá najmenší problém...
https://www.youtube.com/watch?v=0q3mR_deszE
Taky jsem se nemohl rozhodnout, jestli hlasovat. Nakonec jsem dal hlas:
" Je to ještě horší, než jsem čekal(a), Alder Lake bude kvůli big.LITTLE naprosto k ničemu."
Ale pravda je jen druha cast: Alder Lake bude kvůli big.LITTLE naprosto k ničemu.
Neni to horsi nez jsem cekal, nic jsem v tomto smyslu neocekaval.
když jsi o tom scheduleru nevěděl, chtěl jsi, aby tam nějaký byl, když už tam je, bude prý k ničemu ... tobě se těžko zavděčit :D ... ber to jako "první vlašťovku" ... tak nějak nevěřím, že by to zkoušeli jen v benchmarcích ... a taky na 100% neexistuje situace, aby se Intel zavděčil všem ... kdyby prodávali ryzen 5800x s nálepkou Intel i11, stejně Redmarx napíše " tohle bych do compu nedal ani s pistolí u hlavy" ...
Clanek je podle mne naopak dobry. Co je pruser, je marketing Intelu, ze ktereho cerpa. JO poukazuje na mozne sede zony v 'marketingovem' prezentovani architektury, kde je sice spousta grafu a cisel, ve skutecnosti ale nic, co by se dalo vzit jako nejaky realny technicky parametr. To poukazani na chybejici frekvence v clanku, novejsi vyr.proces, stavi prezentaci Intelu do trochu jineho svetla, nejspis horsiho.
Takze jo, az se to otestuje, tak se teprve uvidi
Zapnete "výpočetní aplikaci", ta spustí inicializační vlákno, které nic nepočítá, ale jen zjistí, kolik jader (vláken) má procesor a tolik pustí svých výpočetních vláken. Scheduler všechna vlákna spustí, okamžitě vidí, že jsou to vlákna, která neidlují a nacpe je každé na jedno jádro/vlákno procesoru.
To, že procesor běží na neefektivním napětí a frekvencích a má kvůli tomu spotřebu jako blázen ale zrovna je problém, který je k tomu, jestli je procesor hybridní nebo má homogenní jádra, úplně ortogonální.
Intel může hnát výkon za cenu napětí a spotřeby nahoru úplně klidně i u Alder Lake (včetně těch malých jader - ostatně koukněte jak se vyvíjí ta křivka jejich výkonu vs. spotřeba, hnát je na maximum také způsobí, že budou neefektivní) a jestli se potvrdí, že PL2 zase půjdou výš než 200 W, tak se tenhle problém skutečně nevyřešil.
Ten problém je, že výrobci připouštějí u procesorů příliš velkou spotřebu.
AMD 142 W (PPT pro "105W" modely) a už to je dost, ale Intel nechává "125W" CPU žrát ještě mnohem víc.
Tyhle "wattáže" jsou to, co se musí snížit/zlepšit, aby se dalo jásat nad efektivitou.
i5 skylake se 4mi jádry měla kolik 65W, tady máš ty skajlajky dva, tudíž 130W plus k tomu další plnotučné hitech osmi jádro, celkem to má kolik 228W tzn = 98W takže tam nějaká úspora musí být. A navíc nevíme jak je to s kontiunální spotřebou, takže zatím u mě jakž takž pořád dobrý.
Ale o tom žádná, potvrzuje se, že s big.little u ARMu to nemá nic společného, a tak je logické, že nějaký scheduler bude třeba. Jen mám (IMHO oprávněné) obavy o to, jak spolehlivě to bude fungovat. Protože tady se jedná o poměrně sofistikovaný proces "odhadování" toho, co je aplikace na popředí. Jsem zvědavý, jak si třeba poradí s malwarem, nebo vytěžujícím ovladačem, který se někde v koutku točí za svým vlastním ohonem a na obrazovce svítí jeho okno, zatím co ty se budeš snažit třeba pracovat v Excelu.
Uznávam, moja chyba, že sa mi vytratilo upresnenie
toho príkladu " pri stejnom výkone ", teda to upresňujem dodatočne...
Alder Lake je začiatok, tam to nebude ešte tak
očividné, ale Arrow Lake so 40 core 8C + 32c to
už bude iná káva...
Wattáže sa musia znížit, ale nie prostredníctvom
zníženia Vcore a tým zníženia výkonu/frekvencie,
neefektívneho čipu, ale práve nasadením vyššieho
počtu úsporných jadier pracujúcich s nízkym
napetím s cieľom dosiahnutia stejného výkonu
s podstatne menším príkonom...
Vaší poznámce moc nerozumím.
OS je schopen poznat vlákno, které je výpočetní, jednoduše tak, že to vlákno se samo nevzdává svého běhu, ale scheduler ho vždy musí pozastavit, aby ho mohl prostřídat s jiným vláknem (teď mi třeba běží 3536 vláken, ale ani jedno nevytěžuje jádro, na kterém běží, na maximum).
Když je takových vláken málo, nacpe je na velká jádra. Pokud je takových vláken hodně, nacpe je na všechna jádra. Pokud jsou vytížena všechna (či skoro všechna) jádra, tak jsou uměle bržděna (frekvenčně) velká, protože mají horší efektivitu.
Pokud by můj systém běžel aktuálně na bigLITTLE architektuře a ne na Ryzenu 3900X, tak by velká jádra spokojeně spala a všech těch mých 3536 flákajících se vláken by běželo na těch malých jádrech.
Guláš v tom žádný není.
Jako super, jenze tohle co pises, se zatim u zadneho vyrobce bigLITTLE architektury nepodarilo. Velke mnozstvi malych jader ma znacne odpadni ztraty a tudiz se dosahuje stejneho vykonu s vetsim prikonem. Proto to nakonec ti vyrobci takto vubec nedelaji a funguji na systemu prepinani velkych a malych jader, ale v zadnem pripade je nedokazi prubezne presne dle potreby zapinat a vypinat a tim perfektne skalovat vykon a spotrebu.
Jako urcite Intelu preju, aby se mu to jako prvnimu podarilo, ale uprimne bych na to nevsadil ani 1 Kc.
Ve hrách je třeba 11400f v 90 % úspornější než 5600X.
Problém je pracovní software, tam Raketa letí do stratosféry spotřebou.
Intel už podle mě s 14nm procesem prostě rezignoval na jakýkoliv dohánění AMD v tomhle směru, tak se zaměřujoiu jen na gaming, co jim zbývá, když jim to tam 10 let huntovali finanční manažeři a další ksindl co kecal do práce vývojářům architektury.
Až Lisa Su naznačila boardu, že tímhle směrem půjde Intel tak maximálně do zadele.
Asi takto: já si právě myslím, že úhelný kámen celého řešení je ten scheduler. Jen si vem, jak MS nechtěl upravovat svůj scheduler ve Windows, a to je prosím scheduler, který je součástí jádra Windows, takže má detailní informace o procesech. Navíc se bavíme o řešení schedulingu pro více než 16 jader, ale stejných, nebo velmi podobných jader, lišících se jen dosahovanou frekvencí v zátěži, a to je řádově jednodušší problém než řešit, jestli to hodíš na Davida nebo Goliáše.
A teď si to celé posuň na úroveň baremetalu, kdy už vlastně ani pořádně nevíš, jestli ty instrukce, které zrovna provádíš, jsou instrukce kódu kernelu, aplikace, nebo ovladače, protože ti chybí ten kontext, který má jádro OS. Je docela možné, že ty avizované úpravy od MS ve Windows půjdou právě tímto směrem, prostě se nějakým semaforem bude "tagovat" důležitý kód - ale to je jen moje spekulace. Jinými slovy, procesor buď bude "odhadovat" co je třeba vykonat přednostně, nebo bude mít "noty" na totéž, pak ale bude třeba spolupráce s OS (a to zase bude problém s Linuxem a BSD, aspoň dočasně). Je samozřejmě taky možné, že v případě MT zátěže se výkon Biga omezí na výkon Littla, čistě kvůli power obálce celého CPU, to si ale nemyslím, že bude pravděpodobné řešení, protože by pak celý koncept skončil jako svého druhu lepší ST turbo a nebyl by potřeba HW scheduler.
Tak jak tak je to IMHO hodně zajímavé řešení a jsem zvědavý, jak to bude reálně řešeno a hlavně zda to bude fungovat (univerzálně - to by asi byla lambáda, nebo pouze specificky, případně vůbec - tomu moc nevěřím)
Pekna teorie, ale v mobilech se jim to takto zatim implementovat nepodarilo, pomerne slozite prepinaji velka a mala jadra, kdy bud bezi jenom mala a to treba ne vsechna nebo system rozbehne velka vlakna, ale potom aplikace vytizi treba 100% velkych jader, ale uz neumi vytizit zadne z tech malych jader navic. Na tech bezi jen system a klidne jich i vic jak pulka muze spat i v dobe 100% vykonu vsech velkych jader.
Tak uvidime, o kolik bude Intel v implementaci uspesnejsi.
Ono to asi může dopadat různě podle toho, jaká hra se měří, ale nám v testu u všech tří měřených her vyšla spotřeba 11400F horší než 5600X.
https://www.cnews.cz/test-amd-ryzen-5-5600x-dava-smysl-kdyz-je-intel-core-i5-vyrazne-levnejsi/36/
Vám taky nerozumím. Kolik si aplikace pustí výpočetních vláken je zcela její věc. A nenapadá mě důvod, proč by měl procesor ta vlákna, která potřebují výkon honit jen na některých jádrech a jiná nechal flákat.
V podstatě je to totéž, co dneska dělá s HT (SMT). Nejprve obsazuje jedno vlákno na jádro a teprve, když má těch vytěžovacích vláken více, než je jader, tak začne používat druhé vlákno na jádro. A je samozřejmě věcí té aplikace, kolik vláken vytvoří.
Na mobilu samozřejmě už dávno malá a velká jádra najednou běžet mohou. První takový čip byl, pokud se nepletu Samsung Exynos 5420 a to už je nějakých 8 let.
Ze zatim nikde nemas konfiguraci 8+32, protoze nemas duvod mit 32 malych jader k nicemu. Misto toho vyrobci v mobilni sfere jedou treba i prepinane jadra 1+3+4. No a tudiz se to neda ani scitat. Ve vysledku budes mit 8+32 mensi vykon nez 16+0 a jeste tech 16+0 muze byt uspornejsi.
Jako netvrdim, ze to Intel neprorazi, ale nic tomu nenasvedcuje. Oslavy fanousku Intelu jsou tudiz hodne predcasne. Pockejme na nezavisle testy, pak se uvidi. Ja osobne neverim, ze to Intel da a Intel hw scheduler dokaze to, co se zatim nikomu nepodarilo.
Pekne popsano, neco podobneho jsem mel na mysli i ja. Ackoliv se mi architektonicke zmeny libi jak u GoldenC, tak u Gracemont, a to hodnotim hodne kladne, tak jsem zatim k celemu konceptu malinko skepticky prave kvuli tomu scheduleru, na kterem to bude cele stat.
Ono totiz ty propady vykonu u "testu" GoldenC oproti predchozi generaci mohou klidne ukazovat na scheduler, ktery bud neni vyladeny, nebo vyladit ho nepujde tak lehce.
V kazdem pripade jsem na realne testy zvedav a uz ted premyslim o nove "AL" hracce ;)