AMD včera odhalilo své první 7nm procesory Epyc, které budou mít 64 jader a složitou stavbu se 14nm I/O čipem, a zároveň předestřela zlepšení v architektuře CPU jader Zen 2. Spolu s tím se ale také dostalo na GPU. Jako doprovod pro 7nm (respektive 7nm+14nm) procesory Epyc totiž AMD oznámilo výpočetní grafické karty Radeon Instinct MI50 a MI60. Jsou založené na čipech Vega 20 a jde o vůbec první 7nm GPU na světě, která také ještě do konce roku přijdou na trh. Nyní k nim již máme i parametry, takže můžeme říct, jak moc 7nm proces pomůže na 14 nm zrovna neexcelující architektuře Vega.
Vega 20, jak se toto GPU zřejmě jmenuje interně, už byla AMD prezentována vícekrát, přičemž vždy bylo zdůrazněno, že nebude určená na hry, ale čistě pro datacentra a podobná využití. A na tom se nic nemění, AMD na čipu založilo dvě karty, nyní odhalené: Radeon Instinct MI60 a AMI50. Jak si možná vzpomenete, ono „mičíslo“ v názvu odkazuje k výkonu v TFLOPS v operacích strojového učení u předchozích karet MI25 (Vega 10) znamenalo zhruba 25 TFLOPS ve výpočetech FP16. U této 7nm generace to bude trošku jinak, zdá se, že jde o výkon v „TOPS“ v operacích INT8, tedy s celočíselnými hodnotami – proto je více než dvojnásobný.
Radeon Instinct MI60
Radeon Intinct MI60 má v sobě plnou verzi čipu Vega 20 a lze o tedy brát za demonstraci toho, co tato architektura dokáže. GPU má stále 4096 stream procesorů (64 CU), ale ty nyní běží na frekvenci až 1800 MHz. Pro srovnání, 14nm Vega 10 v kartách Instinct měla maximální frekvenci 1500 MHz. Čip Vega 20 má podle AMD 13,23 miliardy tranzistorů, přičemž GPU má plochu 331 mm².
Je to při zachování stejného 300W TDP karty, ovšem GPU Vega 20 má 32 GB paměti HBM2, která má 4096bitovou sběrnici proti 2048bitové u Vegy 10. Paměti jsou navíc na taktu 2,0 GHz efektivně, takže GPU má k dispozici propustnost 1 TB/s. Mělo by to být poprvé, co bylo této hodnoty u grafiky dosaženo. Paměť a GPU mají plně podporovat ochranu dat (end-to-end ECC) a GPU má jisté RAS funkce pro vyšší spolehlivost a stabilitu, a opět také podporu pro hardwarovou virtualizaci.
Vysoký výkon v FP64 a rozšíření pro AI výpočty
GPU Vega 20 má jako hlavní přínos schopnost práce s velkou škálou datových typů. Kromě FP16 a INT8 pro strojové učení dokáže zpracovávat i 4bitové celočíselné hodnoty (INT4). A na druhé straně spektra pak nativně podporuje rychlé výpočty s dvojitou přesností (FP64) pro tradiční HPC výpočty jako jsou fyzikální simulace. Výkon v základních operacích FP32 je 14,7 TFLOPS, pro FP64 pak 7,4 TFLOPS. Pro FP16 pak je uvedeno 29,5 TFLOPS a pro hodnoty INT8 58,9 TFLOPS (správně by asi mělo být použito „TOPS“). S 4bitovými daty pak až 118 TOPS.
Radeon Instinct MI50
Dříve zmíněný Radeon Instinct MI50 je pak mírně ořezaná levnější verze postavená na stejném základu. GPU má aktivních 3840 stream procesorů, které běží maximálně na 1746 MHz. TDP je ovšem také ponecháno na 300 W. Tato karta slibuje výkon 13,4 TFLOPS v FP32, 6,7 TFLOPS v FP64, 26,8 TFLOPS v FP16 a 26,8 TFLOPS v FP16, respektive 53,6 TOPS v INT8 (a v INT4 to opět bude dvojnásobek).
Výkon levnějšího modelu tedy není o tolik nižší, kolik by naznačovalo označení MI50, ovšem zároveň má karta osazeno jen 16 GB paměti HBM2. Propustnost 1 TB/s je sice zachována, ale GPU bude méně vhodné k řešení problémů s velkým souborem pracovních dat (Vegy sice dokáží použít stránkování do operační paměti, ale větší fyzická RAM je pro výkon lepší).
PCI Express 4.0 a koherentní propojení Infinity Fabric mezi GPU
Karty Instinct MI60/MI50 mají díky čipu Vega 20 ještě několik dalších novinek. Jde zároveň o první grafiky, které používají PCI Express 4.0 (×16) pro připojení do systému, se současným PCIe 3.0 jsou ale samozřejmě kompatibilní (PCIe 4.0 bude možné použít se 7nm Epycem).
To ale není jediná konektivita. Podobně jako v případě NVLinku u Nvidie, mají GPU vyvedenou propojovací logiku pro koherentní propojení. Každé GPU má dvě linky používající propojení Infinity Fabric (odvozené od koherentní logiky v procesorech Ryzen/Epyc), přičemž propustnost jedné je údajně 100 GB/s. Není ale jasné, zda nejde o hodnotu sčítající oba směry komunikace, pak by možná reálně mohlo jít o 50 GB/s duplexně.
Na demonstraci AMD ukazovalo propojení karet pomocí hardwarových můstků (podobně jako u SLI), které budou podporovat buď pár, nebo čtveřici karet (zřejmě s propojením typu prstenec). V serveru by mohlo být těchto GPU až osm, pak by se ale s IF použilo rozdělení na dvě oddělené čtveřice.
V prodeji ještě letos
Provedení obou Instinctů je ve formě klasické 26,7 cm dlouhé karty do slotu PCI Express ×16, přičemž chladič je dvouslotový (a pasivní počítající s průvanem v serverovém šasi). Napájení obstarává jeden šestipin a jeden osmipin. Na trh mají karty přijít ještě v tomto kvartále (Q4 2018), tedy alespoň v případě Radeonu Instinct MI60. Model MI50 bude dostupný o něco později, až v prvním kvartálu roku 2019.