Velká premiéra je zde. Od roku 2017 víme, že Intel vstupuje na trh samostatných GPU. Čekala se už na trhu v roce 2020, nicméně to vyšlo jen spíš pokusné GPU DG1. Herní GPU, která jste asi vyhlíželi nejvíc, měla dorazit v roce 2021, ale nakonec se opozdila. Ale teď tyto grafiky konečně přicházejí. Intel jim říká Arc a právě vydal první z jejich první generace „Alchemist“. Zatím pro notebooky, ale desktopové karty následují.
GPU Architektura Alchemist by měla asi evolučně vycházet z předchozí architektury Xe LP (která je v grafikách Iris Xe Max a v iGPU procesorů Tiger Lake, Rocket Lake a Alder Lake), ale je výrazně inovovaná.
Architektura Xe HPG první generace (Alchemist)
Výpočetně-grafická architektura se člení do tzv. Render Slice, což je blok s shadery, rasterizačními, texturovacícmi i geometrickými jednotkami, obsahuje vlastně vše potřebné. Nově jsou v tom i jednotky pro raytracingovou grafiku (Ray Tracing Unit) a pro maticové výpočty AI, kterým Intel říká XMX Matrix Engine, zatímco soubor klasických shaderových jednotek (pro FP32 výpočty) se jmenuje Xe Vector Engine. Tento termín by měl odpovídat bloku doteď označovanému EU.
V architektuře Alchemist by jedna Render Slice měla obsahovat 512 shaderů, které jsou rozdělené do čtyř „jader Xe“ (Xe-Core). Jedno jádro má 128 shaderů (16 Vector Enginů/EU po 8 shaderech), 192KB L1 cache a sdílené paměti a 16 jednotek XMX pro AI. V jedné slice je zdá se vždy stejný počet raytracingových jednotek jako Xe jader, na každých 128 shaderů jedna. Render Slice tedy má čtveřici Ray Tracing Unit. A jedna jednotka XMX připadá na každých osm shaderů.
Výpočetní jednotky mají poměrně velkou pružnost datových formátů. Shadery podporují standardní výpočty FP32, ale také poloviční přesnost FP16 (s dvojnásobným výkonem) a 8bitové INT8 (4× výkon). Podporovány jsou také výpočty s daty DP4a, které by měly být užitečné pro vyšší výkon třeba při škálování obrazu.
Kromě podpory akcelerace raytracigových efektů (DXR, RTX v žargonu Nvidie) tato architektura podporuje i ostatní novinky DirectX 12 Ultimate.
Maticové jednotky XMX pro AI, které jsou obdobou Tensor jader u Nvidie, mají 8× až 32× výkon v TFLOPS/TOPS proti jednomu Xe Vector Enginu (s 8 shadery). XMX podporuje výpočty 16bitovými s datovými typy FP16 nebo BFloat16, v kterých zvládá 128 operací za cyklus. Kromě toho umí také celočíselné hodnoty INT8 (2× výkon proti FP16, 256 operací za cyklus), INT4 a INT2 (u těch je výkon 4×, 512 za cyklus).
Dva čipy: ACM-G11, ACM-G10
Grafiky generace Alchemist jsou založené na zatím dvou čipech, přičemž v dalších následujících generacích bude Intel pokrytí trhu rozšiřovat, čímž by měly přibýt i výkonnější varianty. Jako první jde na trh menší varianta. Dříve jsme ji znali pod pracovním označením SOC2, ale oficiální jméno čipu je ACM-G11.
Toto GPU je složené ze dvou Render Slice, má tedy 8 Xe jader (1024 shaderů, 128 jednotek XMX) a 8 raytracingových jednotek. Čip má 4MB L2 cache a 96bitovou paměťovou sběrnici podporující GDDR6. Rozhraní PCI Express má ořezané na PCIe 4.0 ×8.
Čip je vyráběný na 6nm procesu TSMC a má mít 7,2 miliard tranzistorů. S plochou 157 mm² je o dost větší, než velmi malé GPU Navi 24 (107 mm², 5,4 miliardy tranzistorů) od AMD, které je také 6nm a má 1024 shaderů. Nicméně je o dost víc ořezané (jen 64bitová sběrnice, PCIe 4.0 ×4, chybí dekódování AV1, enkodér, také nemá maticové jednotky pro AI).
Druhé výkonnější GPU (dřív jsme pro něj měli označení SOC1) se jmenuje ACM-G10. Toto GPU obsahuje osm Render Slice a tím pádem 4096 shaderů, což je maximální počet, který architektura Alchemist podporuje. Je zde tedy zdá se reálný limit jejího škálování, který brání ve vyrobení ještě výkonnější highendové varianty (pamětníci si asi vzpomenou na nápadný limit 4096 shaderů, který jako by mělo AMD v době GPU Fiji, Vega 10 a Vega 20, kdy počet shaderů ne a ne překročil toto číslo).
ACM-G10 má tedy 4096 shaderů (ve 32 Xe jádrech, 512 jednotek XMX) a 32 raytracingových jednotek. Ve většině věcí je čtyřnásobkem menšího čipu, má tedy i 16MB L2 cache, ale paměťová sběrnice je 256bitová (v tomto je asi 96 bitů u menšího čipu výjimka a sedělo by mu spíš 64 bitů – širší sběrnice má však asi za cíl umožnit osazení lepší kapacity pamětí 6 GB). Rozhraní PCIe zde má 16 linek (PCIe 4.0 ×16).
Tento čip má údajně plochu 406 mm² a 21,7 miliardy tranzistorů, rovněž na 6nm procesu TSMC. Lze srovnat se 7nm AMD Navi 22 (17,2 miliardy tranzistorů, 336 mm²), které má ovšem o hodně méně shaderů a kompenzuje to vysokými takty. Nvidia tomuto GPU konkuruje 8nm GA104 s plochou 392 mm² a 17,4 miliardami tranzistorů. Proti oběma je asi ACM-G10 trošku těžší váha co do parametrů, možná ovšm poněkud držená zpátky frekvencemi.
Podpora monitorů, videa
V čem se oba čipy neliší, je multimediální výbava a obrazové výstupy. Oba mají dvojici multimediálních dekodérů/enkodérů (Xe Media Engine, „MFX“) a čtyři pipeline pro výstup na monitor (Xe Display Engine). Ty podporují HDMI 2.0b (ne HDMI 2.1) a DisplayPort 1.4a a 2.0 (Intel uvádí, že je připraven na DP „2.010G“). Umožňují rozlišení až 8K s 60 snímky za sekundu (dvě obrazovky najednou) nebo 4K při 120 snímcích za sekundu (čtyři obrazovky), obojí i s HDR. Rozlišení 1920×1080 nebo 2560×1440 zvládnou až při 360 snímcích za sekundu. Jedna z těchto čtyř výstupních pipeline má optimalizace na nižší spotřebu pro použití v noteboocích.
Multimediální obvod MFX/Xe Media Engine v architektuře Alchemist má umět dekódovat rozlišení 8K při 60 snímcích za sekundu a podporuje nejen 10bitové a 8bitové, ale i 12bitové video (to by měla umět i GPU od Nvidie). Podporováno je HEVC, VP9, AV1 a samozřejmě H.264 (AVC).
První hardwarový enkodér AV1 videa
Enkódování je možné také v rozlišení 8K, ale jen v 10bitech na YUV složku (toto není na závadu, víc pro GPU asi nemá smysl). Hlavní zajímavost je, že MFX umí enkódovat do formátu AV1, jako úplně vůbec první GPU nebo obecně hardwarový enkodér v grafice/procesoru pro PC. Všechno enkódování a dekódování by měl blok MFX dělat ve fixním hardwaru, což obecně jako u všech hardwarových enkodérů znamená vysokou energetickou efektivitu a výkon, ale také nepružnost (oproti softwarovým řešením).
Modely grafik
Intel bude u samostatných GPU mít podobné členění jako u procesorů. Nejlevnější grafiky jsou „Intel Arc 3“, výkonnější Intel Arc 5 a Intel Arc 7. Toto číslo ovšem nebude stát samostatně, ale bude první číslicí v modelovém označení. Celé jméno konkrétní grafiky „Arc 3“ bude tedy například Arc A350M.
První číslo tedy znamená cenovou/výkonnostní kategorii, druhé pak dál rozlišuje pozici/výkon v jejím rámci. Mimochodem, jak vám možná došlo, ono A by mělo označovat generaci, tedy zde první generaci Alchemist, příště to bude „B“ jako Battlemage a tak dále. Na písmenko tedy hleďte, má stejnou funkci jako počáteční číslo modelu u Radeonů nebo GeForce.
Eventuálně se možná přidají ještě Arc 9, až v příštích generacích Intel půjde i do highendu (nebo se o to aspoň pokusí), ale zatím devítkové modely nebudou.
Intel teď odhalil parametry prvních pěti modelů, což jsou grafiky generace Alchemist pro herní notebooky. Jejich vypouštění začíná netypicky odspodu, protože Intel má čip AMC-G11 připravený dříve než výkonnější G10.
Už nyní jsou tedy dostupné dva levnější modely A350M a A370M. Výkonnější model Intel Arc A370M má téměř plnou konfiguraci čipu G11 – aktivních je všech 8 Xe jader (1024 shaderů, 128 XMX) a 8 raytracingových jednotek. GPU běží na taktu až 1550 MHz. Ovšem není využitá plná paměťová sběrnice. Intel se rozhodl poskytnout jen 4 GB GDDR6 na 64bitové šířce. TDP této grafiky je 35–50 W. Podle toho, jak výrobce notebooku spotřebu nastaví, také bude vypadat její herní výkon – uvedená frekvence je boost, v praxi může běžet pomaleji.
Levnější model Intel Arc A350M je čtvrtinu ořezaný, má jen 6 Xe jader (768 shaderů, 96 XMX) a 6 raytracingových jednotek. Jeho takt je také snížený na maximálně 1150 MHz. TDP bude nastavitelné mezi 25 až 35 W. Paměti jsou ale pořád 64bitové v plné kapacitě 4GB GDDR6.
Tyto grafiky asi budou konkurovat hlavně modelům GeForce MX550/MX570 a u AMD proti lowendovým Radeonům RX 6500M a RX 6300M. Malá paměť i výkon podobných GPU umožňují hlavně méně náročné hraní. Uvidíme, jak si grafiky Arc 3 proti zmíněným soupeřům povedou, Intel zatím ukazuje hlavně benchmarky proti vlastním integrovaným GPU Iris Xe, ne proti konkurenci.
Výkonné modely: „začátek léta“
Zatímco Arc 3 (respektive notebooky s nimi) by se měly objevovat na trhu již nyní, což je velmi těsné splnění slibu Intelu o vydání grafik Arc v Q1 2021, výkonnější modely s čipem ACM-G10 budou až později. Parametry ale už máme.
Nejvýkonnějším modelem bude Intel Arc A770M. Bude mít plnou konfiguraci čipu ACM-G10. Tedy 32 Xe jader s 4096 shadery, 512 jednotkami XMX a 32 raytracingovými jednotkami. K tomu pak 256bitovou paměťovou sběrnici s 16 GB GDDR6. Frekvence GPU bude maximálně 1650 MHz a TDP bude moci být 120 až 150 W. Intel asi bude chtít konkureovat mobilním GeForce RTX 3080 a Radeonům RX 6800M (6850M XT?), uvidíme ale v praxi.
K mání bude také pomalejší a levnější verze Intel Arc A730M. Ta toto GPU ořeže o čtvrtinu, takže bude mít 3072 shaderů, 384 XMX a 24 raytracingových jednotek. Zejména ale také poběží na o hodně nižší frekvenci, maximálně jen 1100 MHz. Také paměti budou mít 192bitovou sběrnici, takže 75% propustnost a 75% kapacitu 12 GB. TDP bude 80–120 W.
Model Arc A550M bude stále založený na stejném čipu, ale už z něj bude používat jen polovinu jednotek – 2048 shaderů (16 Xe jader), 256 XMX, 16 raytracignových jednotek, s pamětí osekanou na 128 bitů a kapacitou 8 GB GDDR6. Jeho TDP bude 60–80 W. Také má značně nízkou frekvenci, jen 900 MHz.
Tyto modely podle Intelu vyjdou „začátkem léta“, což by snad mohlo znamenat červen nebo začátek července.
Obecně dost nízké frekvence jsou docela překvapením a mohly by ukazovat na problém. U top modelů Arc A370M a Arc A780M (1550–1650 MHz) to není špatné, ale jen 900–1150 MHz u nižších verzí je dost nápadné. I když nepředbíhejme, důležitý bude výkon v recenzích, respektive tedy hlavně v praxi. Také je možné, že hlavní zápas bude na úrovni softwarové podpory a ovladačů, a hardwarový výkon bude až druhotná otázka.
Každopádně tímto by měla opravdu začínat ona očekávaná éra, kdy herní grafiky pro PC nabízejí tři firmy a nejen dvě. První notebooky s grafikami Arc 3 by měly teď přicházet na trh (Intel uvádí, že za ceny začínající na 899 $). Postupně by mělo být na výběr od vícero různých výrobců notebooků. Intel by se zřejmě mělo dařit dostávat tyto karty do notebooků celkem dobře, protože má s jejich výrobci velmi nadstandardní vztahy díky procesorům a dalším komponentám a často také asistuje s vývojem platforem.
Galerie: Prezentace GPU Intel Arc Alchemist při uvedení
Zdroje: Intel, ComputerBase, VideoCardz