Intel poodhalil první samostatné GPU: všude IVR, EU turbo se shadery na dvojitém taktu

21. 2. 2018

Sdílet

 Autor: Intel

V novoročním bilančním článku za rok 2017 jsem si dovolil vyjmenovat jako významnou událost loňska (plánovaný) vstup Intelu na trh samostatných GPU. Zatím nevíme, kdy a v jakém měřítku se toto uskuteční a na trh udeří grafiky či výpočetní karty s GPU „made in Intel“. Plán je ale zřejmě rozjetý už nějakou dobu: společnost už má první prototypy. A co víc, na ISSCC o nich prezentovala zajímavé technické detaily. Máme tak vzácnou možnost nakouknout pod pokličku tohoto projektu a také něco zjistit o tom, jak si Intel asi budoucí výkonná GPU představuje.  

První samostatné GPU je zatím laboratorní prototyp

Tento prototyp není určen k uvedení na trh, jde o čistě zkušební návrh, což je vidět na parametrech. Složen je ze dvou čipů – ze zkušebního GPU vyrobeného 14nm procesem, v kterém jsou výpočetní jednotky, blok pro obrazový výstup, „system agent“ s paměťovým řadičem a další části a druhým separátním obvodem, který pro tento kus křemíku realizuje připojení na sběrnici PCI Express a komunikaci se zbytkem počítače. Tato druhá část je implementována pomocí FPGA, u standardního produktu už by asi oboje bylo v jednom čipu.

intel-isscc-gpu-prototyp-prezentace-02Prototyp vychází z grafické architektury Gen9 v procesorech Skylake, potvrzuje se tedy, že Intel samostatná GPU vyvíjí jako derivát stejné architektury, kterou má v grafikách integrovaných. Konfigurace prototypu není nijak silná, čip je složen jen z jedné tzv. slice, v níž jsou tři sub-slice po zřejmě šesti výpočetních jednotkách EU. Celkem má tedy toto GPU jen tolik jednotek co Atomy a ani takt není vysoký. Čip může běhat mezi 50 MHz (při napětí pouhých 0,51 V!) a 400 MHz (1,2 V). Rozměr je asi 64 mm², v čemž je 1,542 miliardy tranzistorů – EU ale zabírají jen malou část plochy.

intel-isscc-gpu-prototyp-prezentace-01

Regulace napětí zvlášť pro každou výpočetní jednotku

Zdá se, že na tomto prototypu si Intel zkouší zejména techniky správy spotřeby a taktů, které by mohly být hodně důležité. Výkon GPU je totiž limitován jejich TDP, a tedy se každé zlepšení energetické efektivity dá proměnit ve zvýšení absolutního výkonu. Testovací GPU se dělí na několik nezávislých domén, které mohou běžet na různých taktech a napětích a výrazně využívá integrované regulátory napětí (IVR). Ty nejsou použité pro úpravu napětí zcela na vstupu, ale distribuovaně po různých částech čipu, takže je pak možné provozovat různá napětí na mnohem větší škále – bloků s nezávislým nastavováním napětí by teoreticky mohly být třeba stovky. V prototypu mají zdá se vlastní regulátory typu DLDO i jednotlivé jednotky EU (mimochodem, regulátory DLDO pro jednotlivá jádra má například procesor Epyc od AMD).

intel-isscc-gpu-prototyp-prezentace-07intel-isscc-gpu-prototyp-prezentace-03

EU Turbo: shadery na dvojnásobné frekvenci

Takto pokročilá práce s napájením zřejmě má být základem pro podobně sofistikované řízení výkonu. Toto zkušební GPU má totiž implementováno nezávislé taktování výpočetních jednotek EU (shaderů) a dalších částí. U výpočetních jednotek přišel Intel s poměrně pozoruhodným způsobem, jak zvýšit výkon. Možná si vzpomínáte, že kdysi před architekturou Kepler měla Nvidia v GPU výpočetní jednotky běžící na dvojnásobném taktu, což ale poté zase opustila. Intel v tomto svém GPU vyzkoušel něco podobného, ale v jistých ohledech pokročilejšího.

intel-isscc-gpu-prototyp-prezentace-04EU totiž do tohoto režimu dvojnásobného taktu (u tohoto prototypu je maximum pro shadery zdá se stále 400 MHz, takže reálně to funguje tak, že se vlastně celý zbytek čipu podtaktuje na 200 MHz) umí přecházet dynamicky. Intel tento režim tudíž označuje jako EU Turbo. Dvojnásobnou frekvenci je zřejmě relativně jednoduché synchronizovat se zbytkem čipu a smyslem tohoto turba je logicky zvýšit výpočetní výkon EU. Grafika ale při nízké zátěži nebo menší potřebě výkonu shaderů oproti ostatním fixním částem pipeline může frekvenci zase snížit, takže na řekněme 200 MHz běží jak EU, tak zbytek čipu. To by nebylo možné, pokud by onu dvojnásobnou frekvenci měly EU stále. Od tohoto systému fungování si Intel zřejmě slibuje vyšší účinnost. Při stejném výkonu údajně tato architektura spotřebovává v průměru o 29 % méně energie než pokud by takt EU byl fixní a stejný jako pro zbytek čipu.

bitcoin_skoleni

Kromě toho ale provoz EU na dvojnásobném taktu dovoluje zmenšit plochu čipu (protože není třeba do něj nahustit tolik jednotek), nebo při stejné ploše čipu dosáhnout vyššího výkonu, Intel udává až 50% snížení plochy, nebo až 68% zvýšení výkonu. Tento zlepšovák by tudíž mohl dovolit implementaci výkonnějších čipů v highendu, kde je limitem maximální plocha vyrobitelná v továrně. Ale zároveň by mohl být užitečný k redukci plochy čipu, kterou zabírá integrované GPU v procesorech. To by Intelu zlepšilo marže, ale také by mohlo udělat místo pro CPU jádra navíc.

Od prvních prototypů bude ještě dlouhá cesta

Prezentace tohoto prototypu může naznačovat, jak by mohla vypadat eventuální „ostrá“ GPU, která Intel vyprodukuje. Ovšem je třeba pamatovat na to, že jde asi o do značné míry experimentální projekt. Může se stát, že například ona dvojnásobná frekvence se nakonec do produkční architektury nedostane, protože se ukáže, že nějaký alternativní přístup funguje lépe. Nicméně ono agresivní použití regulátorů napětí DLDO by se nejspíš v praxi čekat dalo. Máme informace, že Intel chystá ve své roadmapě GPU založená na architektuře čipů Tiger Lake (Gen12) a Alder Lake (Gen13). Ta jsou tedy zatím poměrně vzdálená, jelikož tento prototyp ještě staví na architektuře Skylake (Gen9) a mezitím se objeví Gen 10 a Gen11. Mezi dnešním experimentálním čipem a grafikami, které jednou Intel skutečně vpustí do obchodů, tedy nevyhnutelně budou značné rozdíly. Minimálně frekvence a počty jednotek budou někde úplně jinde.