Vypadá to, že Nvidia pokročila s vývojem příští generace GPU a už má prakticky hotovou architekturu Hopper, která bude následovat po nyní prodávaných GPU Ampere. Na internetu se totiž objevily zvěsti, že čip založený na Hopperu se v nejbližší době začne pokusně vyrábět v TSMC – Nvidia dosáhne tzv. tapeoutu. To by mohlo otevírat možnost, že hotové GPU bude vydané či odhalené ještě před koncem první poloviny příštího roku.
GPU Nvidia Hopper se přiblížilo sériové výrobě
Zprávu o tapeoutu Hopperu přinesl leaker Greymon55 – je to sice nové jméno, ale podle VideoCardz jde o alias jiného leakera, který byl aktivnější už předtím (nicméně v únicích týkajících se AMD). Podle tohoto zdroje prý Nvidia Hopper „brzo dokončí tape-out“. Nebylo to řečeno přímo, ale v hádankovém tweetu „NHWTOS“. Když však byl význam rozluštěn, Greymon55 překlad „Nvidia Hopper Will Tape Out Soon“ potvrdil. Tweety pak byly smazané, ale informace už je jednou venku.
Pokud GPU Hopper v nejbližší době bude mít za sebou tape-out, otevírá se mu cesta k vydání, které u čipů bývá možné nejdříve 9 až 12 měsíců po tape-outu. To znamená, že Nvidia by grafické karty/GPU s architekturou Hopper mohla uvést na trh již v průběhu první poloviny roku 2022, i když to bude spíš až v pozdějších jarních měsících.
Asi ale musíme upozornit, že Hopper pravděpodobně není to, na co většina z vás nejvíc čeká, tedy nová generace grafických karet, GeForce RTX 4000. Ta podle posledních zpráv možná masivně navýší výkon mimo jiné díky výrobě na 5nm procesu (ale možná i za cenu navýšení spotřeb).
Nová generace výpočetních GPU, asi ne herních
Nové herní grafiky totiž podle momentálního vyznění různých úniků od twitterových a dalších leakerů Nvidia nebude zakládat na architektuře Hopper, ale místo toho architektuře Lovelace (či Ada, případně Ada Lovelace). Vypadá to, že opět dojde k rozštěpení GPU portfolia na dvě větve, podobně jako v době GPU Volta a Turing. Herní grafiky by dostaly pro ně specializované čipy Lovelace, zatímco Hopper by byl GPU určené pro výpočty a pro akceleraci AI. Šlo by o následníka nynějšího výpočetního akcelerátoru GA100/Nvidia A100. Ostatně, i jeho architektura se liší od herního Ampere (nemá zdvojené jednotky FP32, například).
Výpočetní GPU Ampere A100 šlo také na trh, nebo alespoň bylo odhaleno a oznámeno už v první polovině roku 2020, zatímco herní karty Ampere šly na trh až na začátku podzimu. Tudíž zde by se mohlo rýsovat něco podobného, kdy nová výpočetní karta/akcelerátor Nvidie (možná H100, ale jméno ještě nevíme) bude odhalena na jaře, ale na herní grafiky GeForce RTX 4000 se pak ještě bude čekat dál. Momentálně se jejich vydání čeká spíše v druhé polovině (na podzim?) roku 2022.
Nvidia Ampere je tu: obří výpočetní GA100, 8192 shaderů. Architektura jde i do GeForce (Fotogalerie)
Hopper: čiplety a až 3× navýšení výkonu?
Jméno architektury Hopper neslyšíme poprvé, už o něm máme zprávy delší dobu. Toto označení dostanou GPU na počest průkopnice výpočetní techniky (a kontraadmirálky amerického námořnictva) Grace Hopper. Zajímavé je, že GPU této architektury mají používat čiplety, budou tedy tvořené více kusy křemíku, podobně jako třeba úspěšné procesory AMD Epyc pro servery. Spolu s tím, že by mohl být použitý velmi energeticky efektivní 5nm proces TSMC, znamená potenciál pro velmi vysoký výkon, byť je také možné, že s tím současně stoupne spotřeba.
Tip: Nová GPU architektura Nvidie se jmenuje Hopper. Může to být obří MCM čipletové řešení
Tip: Nvidia studuje vícečipová GPU. Budoucí highendové čipy by mohly být slepence
Podle nepotvrzených zvěstí, které ale pocházejí od docela dobře informovaného leakera Kopite7kimi, by Hopper možná celkově mohl mít až 288 bloků SM – oproti 128 u nejvýkonnějšího výpočetního GPU architektury Ampere (A100). Pokud by jeden blok SM měl pořád 64 shaderů, či jak Nvidia říká Cuda jader (ovšem jádrem je spíše jeden blok SM), tak by „grafika“ s 288 SM obsahovala 18 432 shaderů/Cuda jader. Ovšem komerčně prodávaný akcelerátor by podobně jako A100 asi neměl plnou konfiguraci, místo toho by byla část jednotek vypnutá pro zlepšení výtěžnosti.
https://twitter.com/kopite7kimi/status/1397185717621727234
Čiplet Hopper by snad prý mohl mít 8 bloků GPC, v každém z nich pak 9 klastrů TPC a v každém z nich pak ještě 2 bloky SM. Jeden čiplet by tedy dával 144 bloků SM/9216 shaderů. A tyto čiplety by zřejmě v pouzdru GPU byly dva, možná ještě s nějakým propojujícím dalším čipletem.
Hrubý výkon tohoto GPU akcelerátoru by tak mohl být až trojnásobný proti Ampere (A100). Ve výpočtech umělé inteligence by mohl být nárůst nejspíš ještě vyšší, protože nezávisle na počtu SM nejspíš Nvidia dál posílí i výkon tensor jader a jejich schopnosti. Takže AI výkon nejspíš opět poroste mnohem víc než hrubý výpočetní výkon v obecných výpočtech FP32 a FP64.
Zdroj: VideoCardz