V noteboocích to smysl dává, pomůže to i v konkurenci proti ARMu. V PC, pracovních stanicích a serverech to smysl nemá. Intel zavádí koncept big.LITTLE jen proto, aby zvýšil multijádrový výkon svých monolitů, ve kterém ho "slepence" od AMD krutě válcují. Ale už má téměř připravenou vlastní čipletovou konstrukci.
Možná jsem moc hloupý ale nikdo mi nebyl schopen vysvětlit v čem je budoucnost a přínosnost tohohle řešení. Co je na tomhle podle Vás průkopnického?
Víte na mne to působí jako jako počin zoufalého Intelu který udělal slepenec dvou dosti vyčpělých produktů a prodává to masám jako super inovaci. Tedy vídím to jenom jako marketing. Zajímalo by mne jestli se AMD chce svést na téhle části trhu co je poblázněná touto big.LITTLE PR vlnou nebo opravdu v tom vidí nosný produkt.
Malá jádra ve velkém počtu budou vždy efektivnější, než velká jádra v menším počtu. To není nějaký pokus, který by Intel dělal. To je realita, které využívá roky. Proč si myslíte, že do síťové infrastruktury osazuje 24jádrové Atomy? Potřebuje tam MT výkon a nízkou spotřebu. ST výkon tam k ničemu nepotřebuje. A u MT výkonu má zaručeno, že ten jednoúčelový software dokáže škálovat na velké množství jader, což je u PC zatím dost problém.
Nemusí. Proč by museli? Oni nemají starou architekturu, která žere jak protržená a není schopná škálovat jádra (Intel) a nemají problém s tím, že neumějí vyrobit desktopový procesor s funkčními powers states (ARM).
big.little je totiž jen úkrok stranou, není to nová kvalita, ale obejití neřešitelných problémů.
Proc jen v mobilu? Proc nemit nizkou spotrebu desktopu? V bezne pracovni cinnosti mi M1 zere cca pul wattu az watt. V plne zatezi jde na 20w v pasivne chlazenem airu pak klesne pod 10w v MacMini drzi tech 20w. Vykon srovnatelny s i5 a cca 60w ktery ale v idle bezi na cca 7w a pri bezne praci skace mezi 7 az 20w a to nepoxitam grafiku ktera v m1 v 2d bere par mW kdezto idlujici diskretni je na 10w
Presne tak a preto aj 24 Gracemontov bude v novej serverovej 7nm Atom platforme Intel Grand Ridge s DDR5 a PCI-Express 4.0.
zdroj: https://www.pcgameshardware.de/CPU-CPU-154106/News/Intel-Grand-Ridge-Atom-DDR5-PCIe-4-in-7-nm-Leak-1355857/
A proč tomu konceptu nevěříte? Jednovláknový výkon jiným než velkým jádrem nezískáte, takže ten koncept smysl má.
Že ARMy mohou zatopit x86 je pravda. Ale to mohou už roky. Zatím to ztroskotává na tom, že nejde jen o výkon, ale i software. A tam má Intel stále náskok. Ne nadarmo o tom dost mluví (novináři to většinou ignorují, protože celý smysl oneAPI asi ještě nepochopili).
Protože to nedává smysl!
Horko-těžko jsme dospěli k šíleně drahým platinovým zdrojům, které dokáží jakžtakž fungovat efektivně v rozmezí 50-500W, a budeme teď řešit zdroje, co mají umět jakési hyperúsporné režimy? A proč? Bude zbytek toho desktopu taky tak úsporný? No nebude, protože neuspíš ani grafiku, ani disk(y), když to má podle tebe "pracovat" a ne spát.
Tenhle režim jednoho slabého jádra, co žere málo, má smysl pro jednočipové stroje, kde je i zbytek stroje (mj. displej, úložiště, OS) nastaven na extrémní úsporu energie. U klasického PC, s disky, RAM, grafikou a dalšími kartami ve slotech, plus plnou sadou I/O (USB, PS/2, apod.) je tohle naprostý nesmysl. Asi stejný, jako šetření spotřeby u dálkového autobusu tím, že použiješ menší zpětná zrcátka. Ušetříš, ale neznatelně, protože daleko víc dělá odpor čelního skla, valivý odpor pneu, nebo klimatizace.
Jinak ten tvůj M1 hype byla sranda, ale už je to prostě moc. Ten procesor není ani náhodou obecně srovnatelný. Něco málo o tom vím, protože tyhle jablečné hypy tu jsou odnepaměti (prakticky od MC68k, přes PPC a dál). Prostě si stačí vybrat jeden scénář kde to vychází dobře, a ten do zblbnutí opakovat, to je celé. Akorát s tím už prudíš.
amd nemělo, nemá peníze na vývoj deseti druhů čipů ... vyvine jeden, k tomu io čip a lepí to dohromady od dvou, po 64, nebo kolik jader ... cpu nejsou ve velikosti čipů zdaleka tak špatně, jako gpu, pokud tedy nejde o profi sféru ... a na význam/nevýznam big.little bych si počkal, až vyjde ...
DedekHrib:
Jeden čiplet vám samozřejmě CPU nebo GPU vytvořit může, viz první Ryzeny, kde jeden čiplet fungoval jako obyčejný Ryzen a když se jich zapojilo více, byl z toho TR nebo Epyc.
Ekonomika výroby právě moc do karet čipletům nehraje. Pokud má ten monolit hodně jader, která můžete jednotlivě vypínat, tak je jedno, jestli je to monolit nebo více čipletů. Samozřejmě, že chyba se může trefit do něčeho, co je na tom čipu jedinečné a bez čeho to nefunguje, ale na druhou stranu u čipletů musíte mít zase implementováno komunikační rozhraní (tím je čip v součtu větší) a taky musíte použít dražší pouzdření.
Jediné, kde se ta ekonomika výroby projeví výrazně, je malosériová výroba hodně konfigurací. Kdyby mělo AMD dělat na Epyc čipy několik různých návrhů křemíku, bylo by to samozřejmě dražší. Ale se vzrůstajím objemem výroby se tahle výhoda ztrácí.
Radek Holeček 4.5.2021 at 17:24
No vidíte pak takové GPU nebo CPU z chipletů nemůže být monolitické.
Ale ekonomika výroby hraje. A to hned ze dvou důvodů. Jednak méně součástek v chipletu je vetší šance ho vyrobit (kvůli výrobní vadě). Více malých stejných součástí znamená množstevní slevu. Musím uznat, že to poslední při stávajícím nedostatku výrobních kapacit asi moc platit nebude. Se zbytkem (komunikační rozhraní, návrh, ...) souhlasím.
Radek Holeček 4.5.2021 at 18:49
Vycházím z Vašeho logického závěru " u čipletů musíte mít zase implementováno komunikační rozhraní (tím je čip v součtu větší) " Dejme tomu, že to bude o 10% více waferů. Proto používám tu množstevní slevu na odběr většího množství chipletů, waferů, ...
Vady na chipletech vadí a projevují se více či méně negativně do výsledné ceny za kterou se GPU nebo CPU prodá (projeví se v počtu jader které jsou funkční v prodávané jednotce).
Vypínáním chiletů získám nižší spotřebu. Ideální by bylo vypínat jednotlivá jádra v chipletu ale to by asi bylo na začítek až příliš.
Když se tohle podaří pak bude celá programovatelná jednotka fungovat jako shluk little procesorů které se budou zapínat nebo vypínat dle potřeby. To je přesně funkce big.LITTLE kvůli které to vzniklo a hlavně je to vše se stejnými procesory namísto lepení rozdílných procesorů.
DedekHrib:
Když bude procesor fungovat jako velký shluk little procesorů, tak z něj nemáte šanci vyždímat velký jednovláknový výkon. Vždycky budete omezen rychlostí toho jednoho malého jádra.
Na spotřebu by to samozřejmě byla nejlepší metoda, ale o tom jsem psal výše, když jsem mluvil o 24jádrových Atomech.
Ta koncepce big.LITTLE vznikla proto, že maximální jednovláknový výkon a spotřeba jsou dvě strany téže mince a nemůžete mít oboje najednou. Buď jedno nebo druhé. A jelikož chcete oboje, tak holt musíte také oboje implementovat.
DedekHrib:
Té množstevní slevě moc nerozumím. Proč by měla být množstevní sleva vázána na to, kolik kterých čipů firma vyrobí? Tomu TSMC je putna, jestli vyrábí wafer s 80mm2 velkými čipy nebo s 500mm2. Odběratel platí za wafer, ne za kus čipu.
Ty vady na čipu vám moc nevadí, pokud se objeví v těch částech, které můžete vypnout, takže když vyrobíte monolitické 8jádro a 16jádro (samozřejmě se stejnými jádry), tak 16jádro bude menší, než dvě osmijádra. Pokud se chyba trefí do jádra, tak ho můžete vypnout tam i tam. Teprve pokud se chyba trefí do toho zbytku, tedy například do řadiče paměti, tak ten čip můžete vyhodit celý. Jenže ty důležité části tvoří malou část čipu. Větší škoda tedy vznikne u šestnáctijádra, ale myslím, že tenhle celkem vzácný případ je vykompenzován zase tou menší relativní velikostí.
Tak big.LITTLE může být jak monolitické, tak i čipletové konstrukce. Vypínáním čipletů získáte co? Ten big.LITTLE má tři režimy, které dávají smysl. 1. je superúsporný, kdy jsou uspána všechna jádra a běží jen jedno či více těch malých úsporný. V 2. režimu běží jedno či několik velkých jader, když potřebujete velký ST výkon (zbytek může taky spát). No a 3. režim je masivní MT, tedy běží všechna jádra malá i velká.
V prvním režimu oceníte malá jádra, v druhém velká a ve třetím obě. Ani v jednom režimu vám to kombinování malých a velkých nepřináší žádnou nevýhodu. Když budete mít v čipu jen velká jádra, v prvním a třetím režimu bude ten čip žrát více. Když budete mít jen malá jádra, bude v druhém režimu problém s nedostatečným výkonem. Prostě big.LITTLE smysl dává vždycky, zatímco ostatní varianty jen někdy.
Řízení vás nijak nezachrání. Když potřebujete nízký výkon, tak to jádro nemůžete vypnout. Musíte ho nechat běžet. A když ho necháte běžet, tak je prostě fakt, že velké jádro bude mít několikanásobně vyšší spotřebu, než to jádro malé. Když má velké jádro 4x tolik tranzistorů, než jádro malé, tak k jeho provozu i v ideálním případě potřebujete 4x více energie. A to nemáte jak obejít. Nemůžete vypnout 3/4 velkého jádra, abyste se dostal na tu spotřebu jádra malého. V idle bude mít malé jádro menší spotřebu, to je obyčejná fyzika.
"Prostě big.LITTLE smysl dává vždycky, zatímco ostatní varianty jen někdy."
No, tak jednoduché to asi taky není. Big.LITTLE asi má potenciál způsobit regrese nebo neefektivitu tam, kdy program nečeká, že jádra mají rozdílný výkon. Toto by mohlo být kompenzováno/obejito tehdy, když má velké jádro SMT a výkon jednoho malého jádra vychází blízko výkonu jednoho vlákna velkého jádra.
Další problém může nastat v tom, že malé jádro může brzdit celkový návrh třeba tím, že by se v něm těžko implementovaly pokročilé věci jako TSX/AVX-512 (docela by mě zajímalo, jestli SVE bylo navržené i s ohledem na big-LITTLE...)
Dokonalá/100% přínosná/bezproblémová ta koncepce asi není, stejně jako není 100% blbá, jak se tu objevovalo v názorech dřív :)
@JO
ted vysel novy clanek na IgorsLab
https://www.igorslab.de/en/exclusive-data-to-intel-alder-lake-s-hot-fight-with-amd/
Mimojine se zatim potvrzuje i to, ze frekvence malych a velkych jader budou ruzne. Coz je dalsi promenlivy parametr k ocekavanemu vykonu malych jader.
Víte pane Holečku tohle je o přesvědčení. Prostě naše víry jsou nekompatibilní. Vy máte výhodu, že produkt Vaší viry reálně existuje. Já mohu jenom věštit. Ano z hlediska regulace spotřeby nemá nyní big-LITTLE konkurenci ale je to slepenec zcela heterogenních věcí. Jako nouzovka to bude fungovat do té doby než nám chiplety dospějí.
Chiplety jsou na trhu krátce a zatím bohužel v nich není konkurence. Víte mám podezření, že to co uniklo z Intelu je slepenec monolitů a ne chiplety. To že Nvidia odložila Hooper ukazuje že i tam mají designem veliké problémy. Jenom se v celé nahotě ukazuje kolik práce v AMD odvedli a jak bohužel u Intelu a Nvidie zaspali. Obě společnsoti to ale nakoplo a vydaly se správným směrem.
Očekávám že někdo, a může to být Intel, Nvidia nebo AMD, si řekne, že nejvíce žerou ty části co jsou označovány Core die. udělají novou generaci chipletů a to tak, že do částí které mají mnohem menší spotřebu než core kterou označují jako I/O die dají ne jen zapínání chiletů ale i jader. Tuhle část energeticky zoptimalizují a výsledkem bude to, že bude mít nižší spotřebu než one LITTE proceor který bude stále obsahovat tu energeticky nenažranou část označovanou jako core. Mám pocit, že tahle chipletová cesta je čisté architektonické řešení a ne nouzový slepenec. Je to ale jenom moje víra, že se tohle narodí a pošle big-LITTLE na smetiště dějin. To jestli mám nebo nemám pravdu se uvidí za nějaký 5 či 10 let. Jestli se tady za tu dobu sejdeme na Cnews můžeme si o tom opět poklábosit.
i mělo (viz malé kočkovité šelmy), ale nedává to smysl. V okamžiku, kdy můžeš vyrábět "zmetky" typu 200GE, které ti v sebevyšší zátěži nepřelezou se spotřebou celé sestavy přes 50W, je prostě malý CPU typu Kabini "mrtvej Homolka," protože spotřeba sestavy bude nižší o pár wattů, ale dostupný výkon bude níž o desítky procent.
Na 200GE mám btw postavený NAS. Kromě toho, že nejvíce žerou disky a paměť (5x HDD, 24GB RAM), tak prostě nevidím důvod stavět to na nějakém slabém x86 CPU nebo dokonce prašivém ARMu, který nezvládá pořádně ani vlastní GUI NASu, natož aby mi umožnil virtualizovat a provozovat dostatečně komfortně další funkce jako DLNA apod.
Je pekne, ze se tu prevazne diskutuje o uspore energie v souvislosti zapojeni malych jader, ale jestli se nemylim, tak Intel se nechal slyset, ze mala jadra chce jako vypomoc pri MT. Tedy varianta, kdy jedou vsechna jadra spolecne.
Co je zrejme problem Intel big.LITTLE - rozdilnost jader. Zrejme nebude mozne pustit aplikaci na velkem jadru a pak si jej v pripade idlovani "premigrovat" na male. A to se vlastne dostavam i k problemu "chipletove konfiguraci", jak ji vidi pan DedekHrib. big.LITTLE docela popsal Radek. Prevest stejny koncept na libovolne jadro neni uplne mozne, protoze ten chip by musel kvuli uspore vypinat ALU, AGU, cast cache, apod. To by na bezicich aplikacich znamenalo ztratu dat, omezeni instrukci a dalsi. Take by musel byt implementovan ridici obvod (i ten spotrebovava energii). V budoucnu se mozna reseni problemu najde, ale zase by tento zpusob prinesl nejsruznejsi zranitelnostli souvisejici s pridelovanim prostredku a pameti.
Ja osobne zatim x86 big.LITTLE uplne neverim, na druhe strane jsem na Alder Lake zvedavy, mozna to prece jen bude evolucni skok pro x86. Co se tyka 3nm a r. 2024... ;))
tynyt 5.5.2021 at 9:08
No jsem rad, ze to takto nekdo napsal :)
Ja jsem dlouhodobe provozoval i3, ktera mela na multimedialni server + NAS super vykon, ale spotrebu vysokou (40 - 80W). J1900 byl skvely NAS, ale multimedia diky iGPU strasne (15 - 20W). Nakonec jsem zkoncil na ADM Athlonu, ktery zvlada bez problemu multimedia a NAS (18 - 24W).
Na ARMu jsem take zkousel nejake fileservery a dostal jsem se treba o 10W niz, ale jakmile od toho zacne clovek chtit sifrovani, GUI, dalsi sluzby kolem NAS a prehravani medii, zacne to byt utrpeni. Tech par usetrenych W za to nestoji.
Na co mi prijdu ARMy skvele - amaterske monitorovaci systemy, ovladani ruznych spinacu a motorku, logovaci systemy, apod.