Intel poodhalil první samostatné GPU: všude IVR, EU turbo se shadery na dvojitém taktu

21. 2. 2018

V novoročním bilančním článku za rok 2017 jsem si dovolil vyjmenovat jako významnou událost loňska (plánovaný) vstup Intelu na trh samostatných GPU. Zatím nevíme, kdy a v jakém měřítku se toto uskuteční a na trh udeří grafiky či výpočetní karty s GPU „made in Intel“. Plán je ale zřejmě rozjetý už nějakou dobu: společnost už má první prototypy. A co víc, na ISSCC o nich prezentovala zajímavé technické detaily. Máme tak vzácnou možnost nakouknout pod pokličku tohoto projektu a také něco zjistit o tom, jak si Intel asi budoucí výkonná GPU představuje.

První samostatné GPU je zatím laboratorní prototyp

Tento prototyp není určen k uvedení na trh, jde o čistě zkušební návrh, což je vidět na parametrech. Složen je ze dvou čipů – ze zkušebního GPU vyrobeného 14nm procesem, v kterém jsou výpočetní jednotky, blok pro obrazový výstup, „system agent“ s paměťovým řadičem a další části a druhým separátním obvodem, který pro tento kus křemíku realizuje připojení na sběrnici PCI Express a komunikaci se zbytkem počítače. Tato druhá část je implementována pomocí FPGA, u standardního produktu už by asi oboje bylo v jednom čipu.

Prototyp vychází z grafické architektury Gen9 v procesorech Skylake, potvrzuje se tedy, že Intel samostatná GPU vyvíjí jako derivát stejné architektury, kterou má v grafikách integrovaných. Konfigurace prototypu není nijak silná, čip je složen jen z jedné tzv. slice, v níž jsou tři sub-slice po zřejmě šesti výpočetních jednotkách EU. Celkem má tedy toto GPU jen tolik jednotek co Atomy a ani takt není vysoký. Čip může běhat mezi 50 MHz (při napětí pouhých 0,51 V!) a 400 MHz (1,2 V). Rozměr je asi 64 mm², v čemž je 1,542 miliardy tranzistorů – EU ale zabírají jen malou část plochy.

Regulace napětí zvlášť pro každou výpočetní jednotku

Zdá se, že na tomto prototypu si Intel zkouší zejména techniky správy spotřeby a taktů, které by mohly být hodně důležité. Výkon GPU je totiž limitován jejich TDP, a tedy se každé zlepšení energetické efektivity dá proměnit ve zvýšení absolutního výkonu. Testovací GPU se dělí na několik nezávislých domén, které mohou běžet na různých taktech a napětích a výrazně využívá integrované regulátory napětí (IVR). Ty nejsou použité pro úpravu napětí zcela na vstupu, ale distribuovaně po různých částech čipu, takže je pak možné provozovat různá napětí na mnohem větší škále – bloků s nezávislým nastavováním napětí by teoreticky mohly být třeba stovky. V prototypu mají zdá se vlastní regulátory typu DLDO i jednotlivé jednotky EU (mimochodem, regulátory DLDO pro jednotlivá jádra má například procesor Epyc od AMD).

EU Turbo: shadery na dvojnásobné frekvenci

Takto pokročilá práce s napájením zřejmě má být základem pro podobně sofistikované řízení výkonu. Toto zkušební GPU má totiž implementováno nezávislé taktování výpočetních jednotek EU (shaderů) a dalších částí. U výpočetních jednotek přišel Intel s poměrně pozoruhodným způsobem, jak zvýšit výkon. Možná si vzpomínáte, že kdysi před architekturou Kepler měla Nvidia v GPU výpočetní jednotky běžící na dvojnásobném taktu, což ale poté zase opustila. Intel v tomto svém GPU vyzkoušel něco podobného, ale v jistých ohledech pokročilejšího.

EU totiž do tohoto režimu dvojnásobného taktu (u tohoto prototypu je maximum pro shadery zdá se stále 400 MHz, takže reálně to funguje tak, že se vlastně celý zbytek čipu podtaktuje na 200 MHz) umí přecházet dynamicky. Intel tento režim tudíž označuje jako EU Turbo. Dvojnásobnou frekvenci je zřejmě relativně jednoduché synchronizovat se zbytkem čipu a smyslem tohoto turba je logicky zvýšit výpočetní výkon EU. Grafika ale při nízké zátěži nebo menší potřebě výkonu shaderů oproti ostatním fixním částem pipeline může frekvenci zase snížit, takže na řekněme 200 MHz běží jak EU, tak zbytek čipu. To by nebylo možné, pokud by onu dvojnásobnou frekvenci měly EU stále. Od tohoto systému fungování si Intel zřejmě slibuje vyšší účinnost. Při stejném výkonu údajně tato architektura spotřebovává v průměru o 29 % méně energie než pokud by takt EU byl fixní a stejný jako pro zbytek čipu.

Kromě toho ale provoz EU na dvojnásobném taktu dovoluje zmenšit plochu čipu (protože není třeba do něj nahustit tolik jednotek), nebo při stejné ploše čipu dosáhnout vyššího výkonu, Intel udává až 50% snížení plochy, nebo až 68% zvýšení výkonu. Tento zlepšovák by tudíž mohl dovolit implementaci výkonnějších čipů v highendu, kde je limitem maximální plocha vyrobitelná v továrně. Ale zároveň by mohl být užitečný k redukci plochy čipu, kterou zabírá integrované GPU v procesorech. To by Intelu zlepšilo marže, ale také by mohlo udělat místo pro CPU jádra navíc.

Od prvních prototypů bude ještě dlouhá cesta

Prezentace tohoto prototypu může naznačovat, jak by mohla vypadat eventuální „ostrá“ GPU, která Intel vyprodukuje. Ovšem je třeba pamatovat na to, že jde asi o do značné míry experimentální projekt. Může se stát, že například ona dvojnásobná frekvence se nakonec do produkční architektury nedostane, protože se ukáže, že nějaký alternativní přístup funguje lépe. Nicméně ono agresivní použití regulátorů napětí DLDO by se nejspíš v praxi čekat dalo. Máme informace, že Intel chystá ve své roadmapě GPU založená na architektuře čipů Tiger Lake (Gen12) a Alder Lake (Gen13). Ta jsou tedy zatím poměrně vzdálená, jelikož tento prototyp ještě staví na architektuře Skylake (Gen9) a mezitím se objeví Gen 10 a Gen11. Mezi dnešním experimentálním čipem a grafikami, které jednou Intel skutečně vpustí do obchodů, tedy nevyhnutelně budou značné rozdíly. Minimálně frekvence a počty jednotek budou někde úplně jinde.

Vstoupit do diskuse (4 názory)

Jan Olšan

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Témata:

Všetko z toho by sa tým dalo vysvetliť ak by to boli odchýlky vrámci pár percent ale toto je 2 až 3 násobný rozdiel v porovnaní s tým čím sa Intel chváli. Aj tie ARMy majú určité rozdiely v parametroch ale vrámci rovnakého jadra niesu tak veľké.

bez přezdívky

Sdílet

První samostatné GPU je zatím laboratorní prototyp

Regulace napětí zvlášť pro každou výpočetní jednotku

EU Turbo: shadery na dvojnásobné frekvenci

Od prvních prototypů bude ještě dlouhá cesta

Autor článku

Jan Olšan

Témata:

Anketa

Přejdete k Revolut Mobile, jakmile bude dostupný v Česku?

Kvíz týdne

Komerční sdělení

Lenovo Smart Connect: Jeden ekosystém, nekonečné možnosti propojení

Intel poodhalil první samostatné GPU: všude IVR, EU turbo se shadery na dvojitém taktu

Sdílet

První samostatné GPU je zatím laboratorní prototyp

Regulace napětí zvlášť pro každou výpočetní jednotku

EU Turbo: shadery na dvojnásobné frekvenci

Od prvních prototypů bude ještě dlouhá cesta

Autor článku

Jan Olšan

Témata:

Anketa

Přejdete k Revolut Mobile, jakmile bude dostupný v Česku?

Kvíz týdne

Komerční sdělení

Lenovo Smart Connect: Jeden ekosystém, nekonečné možnosti propojení

Dále u nás najdete

Chřipka dorazila o měsíc dřív. Očkování nemusí nákaze zabránit

Streamingové služby zpřísňují sdílení účtů

Fiasko McDonald’s: Když AI reklama ztratí duši

Změny ve zdravotním pojištění pro rok 2026 v oblasti zaměstnávání

Vykrádá Google obsah z webů pro svou AI?

Y Soft hledá vývojáře na počítačové vidění a AI

Prohlídky a testy u praktiků budou od ledna důkladnější

Odhalte zákulisí výběru barvy roku, která ovlivňuje design a marketing

Levně koupené máslo do mrazáku nedávejte

Ošetřovné 2026: Kdo dosáhne na vyšší dávku

Sociální pojištění 2026: změny v důchodech, odvodech i dávkách

Od ledna skokově vzrostou invalidní důchody

Na ministerstvo dopravy míří expert ze Slovenska

Ani slavní kuchaři nemají tak drahé cukroví jako pražská cukrárna

Zahraniční stravné 2026: Jak ho vypočítat a kolik reálně dostanete?

CIOtrends: střízlivění z AI, návrat do kanceláří a privátní cloud

Je tu aktualizovaný Chrome v pořadí již číslo 143

Jak chutná a jak se jí physalis, karambola a cherimoya

Zaměstnanecké benefity 2026: Co byste měli vědět

OpenAI reaguje na Nano Banana novým generátorem