Trhliny v GPU ambicích Intelu? Next-gen výpočetní GPU zrušená, revoluční XPU se odkládá

6. 3. 2023

Sdílet

 Autor: Intel, via: AnandTech
Intel škrtá a ruší nadcházející výpočetní GPU. Next-gen „XPU“ Falcon Shores je zatím jen opožděné, ale také může být osekáno a přijít o svou vůbec nejdůležitější inovaci.

V posledních týdnech se objevovaly ve zprávách informace o údajných problémech Intelu s vývojem budoucích 4nm procesorů Meteor Lake3nm Arrow Lake. Firma má ale, zdá se, potíže i jinde – ve svém projektu špičkových GPU pro superpočítače. První generace Ponte Vecchio byla velmi opožděná, ale teď Intel ke všemu ještě zrušil jejich druhou generaci a také se stahují mraky nad „XPU“ Falcon Shores, kterými měly ambice Intelu v GPU vyvrcholit.

Zlověstné zprávy o osudu budoucích produktů se obvykle nejdřív objevují z různých neoficiálních zdrojů (zde je třeba zmínit, že zrovna ty o zpoždění 3nm a 4nm CPU Intel popírá). Ale v tomto případě to tak není. Viceprezident Intelu Jeff MecVeigh nyní publikoval na webu Intelu oficiální blogpost, v němž oznamuje úplná a částečná zrušení následujících dvou generací výpočetních GPU, což je prý zefektivnění roadmapy (česky by se asi dalo říct „fárplánu“) a její sladění s očekáváními zákazníků.

Intel tímto oznámil, že výpočetní GPU, která v listopadu oficiálně začala první generací akcelerátoru Intel Max (s kódovým jménem „Ponte Vecchio“), přejdou na dvouletý interval příchodu nových generací. Podle Intelu to odpovídá očekáváním zákazníků a tomu, co víc preferují, ale to asi je spíš snaha podat to co nejméně negativně. Ve skutečnosti to znamená, že je zrušená následující generace GPU. Ta již byla oficiálně oznámená pod kódovým označením Rialto Bridge loni v létě a měla zvýšit počet výpočetních jednotek (ale i spotřebu) proti Ponte Vecchio.

Intel Rialto Bridge Intel Rialto Bridge, druhá generace HPC GPU Intel (zdroj: Intel)

Rialto Bridge mělo původně vyjít letos (asi také až koncem roku, vzorky prý měly být v létě). Otázka je samozřejmě, zda Intel stíhal a nedošlo by třeba zase ke zpoždění jako u Ponte Vecchio. Rialto Bridge bylo inkrementální evolucí Ponte Vecchio a plánované zvýšení výkonu asi nebylo na novou generaci moc velké oproti tomu, o kolik se zvyšuje výkon v nových generacích Nvidie a AMD. Nicméně zrušení znamená, že proti těmto konkurentům Intel bude mít jen předchozí (opožděnou) generaci Ponte Vecchio, takže jeho pozice bude ještě horší.

Více: Nejvýkonnější GPU Intelu Rialto Bridge má 20 480 jednotek FP32 a spotřebu 800 W. Po něm přijdou „XPU“ Falcon Shores

Situace XPU je teď nejistá

Nicméně zrušení Rialto Bridge není jediná znepokojivá věc na tomto oznámení. Intel totiž ťal i do důležitější následující generace Falcon Shores. Ta měla být extrémně významná, protože místo aby šlo o samostatné GPU, už mělo dojít k integraci do spojeného akcelerátoru „vše v jednom“ s procesorovými jádry, podobně jako to plánuje AMD s Instinctem MI300 (a podobný případ je asi i Nvidia Grace Hopper Superchip, byť tam je zřejmě integrace menší). Intel proto Falcon Shores označoval jako „XPU“.

Roadmapa HPC akcelerátorů a procesorů Intel ukázaná na ISC22 Roadmapa HPC akcelerátorů a procesorů Intel ukázaná na ISC22. Rialto Bridge je zrušené (Zdroj: Intel, via: AnandTech)

Falcon Shores mělo dle předchozí roadmapy vyjít v roce 2024, jenže teď Intel uvádí, že je cíleno na uvedení v roce 2025. Došlo tedy k jeho posunutí, nebo alespoň k nastavení realističtějšího termínu (pokud už Intel věděl, že bude mít zpoždění).

Intel Falcon Shores Intel Falcon Shores bude první XPU integrující procesor a akcelerátor do jednoho (Zdroj: Intel)

Nejde ale zřejmě jen o zpoždění. Patrick J. Kennedy z webu ServeTheHome dokonce uvádí, že Intel udělal kompromisy v plánované architektuře. V onom roce 2025 prý má vyjít verze Falcon Shores, která nakonec nebude XPU, ale pořád jen samostatné výpočetní GPU připojené k procesoru zvlášť přes PCI Express a případně další koherentní propojovací logiku, tedy jako u Ponte Vecchio a zrušeného Rialto Bridge. Opět nevýhoda pro Intel v konkurenci s Nvidií a AMD, které zmíněná integrovaná řešení mají uvést letos.

https://twitter.com/Patrick1Kennedy/status/1631789908023996417

Unifikované řešení XPU není úplně mrtvé a architektura Falcon Shores s ním počítá, ale pokud XPU verze vyjde, pak až v následujících letech (2026?). Intel se asi rozhodl nekumulovat najednou moc rizik. Falcon Shores má být nová architektura, takže asi chce nejprve vyrobit jednodušší implementaci v podobě jen GPU a až v dalším kroku podstoupit náročný úkol integrace s CPU.

Vývoj Intel Flex také okleštěn

Intel má vedle výpočetních GPU Max, která používají vlastní design čipů (přesněji, skládají se z velkého množství čipletů), pro servery ještě jednu linii grafik, pojmenovanou Intel Flex. Ta používá stejné čipy, jako herní grafiky Arc, a její role v serverech jsou hlavně multimediální operace nebo se dají použít pro virtualizaci SR-IOV. I zde ale roadmapa prošla řezem.

Intel má teď na trhu loni uvedenou generaci kódově označenou Arctic Sound-M, která je založená na čipech s architekturou Alchemist (Flex 140 má 2048 shaderů ve dvou čipech ACM-G11 a 75W TDP, Flex 170 má ACM-G10 s 4096 shadery a 150W TDP).

Výpočetní GPU Intel Flex Výpočetní GPU Intel Flex (zdroj: Intel)

Po tomto měla přijít generace Lancaster Sound, snad letos. Ta je ale také zrušená a opět má být používaná dvouletá kadence, kdy příští generace asi vyjde až v roce 2024 – má jít o generaci Melville Sound. Zrušení mezikroku má Intelu umožnit soustředit víc prostředků na Melville Sound. Tato GPU prý mají přinést výrazný architektonický skok a pokrok ve funkcích a výkonu.

Úklid po Rajovi Kodurim – nebo jenom šetření?

Podle blogpostu jde o zjednodušení a zeštíhlení/zefektivnění (streamlining) roadmapy, které také umožní klientům „maximalizovat jejich investice do nynější generace GPU“. Takovéto formulace jsou vždy volené vágně a je otázka, zda má smysl snažit se je nějak vykládat. Ale přece jenom trošku budí pochybnosti. Zrušení jedné plánované generace a posunutí té následující na pozdější termín, nebo alespoň její osekání o důležitou část plánovaných funkcí, to nelze interpretovat jinak, než že Intel dodá klientům méně, než původně plánoval. Na druhou stranu toto může být i v koordinaci s budoucími zákazníky, kteří mohli Intelu signalizovat nezájem o zrušené produkty. Intel také uvádí, že toto umožní investovat více do následujících GPU, a to by měla být pravda.

Building on this momentum, with close customer engagement on their requirements, we are simplifying and streamlining our data center GPU roadmap. This enables our customers and the ecosystem to maximize their investments on currently available Max Series and Flex Series GPUs, while ensuring next-generation products deliver significant leaps in performance and developer productivity. [...]

With a goal of maximizing return on investment for customers, we will move to a two-year cadence for data center GPUs. This matches customer expectations on new product introductions and allows time to develop their ecosystems.

Jeff McVeigh je vedle role jednoho z viceprezidentů také dočasným generálním ředitelem pro segment Accelerated Computing and Graphics (AXG). Tu Intel v prosinci přeorganizoval tak, že týmy pracující na herních grafikách Arc přičlenil ke klientské divizi (tedy nejhlavnější části vyvíjející procesory Core) a týmy pracující na výpočetních GPU, kterých se týká nynější zpráva, zase k serverové divizi. Tehdy ztratil pozici šéfa AXG známý Raja Koduri a Jeff McVeigh nyní zastává jeho místo.

bitcoin_skoleni

Co si z toho vzít? Dost možná Intel zhodnotil původní plány a roadmapu a shledal, že Raja Koduri měl nereálné cíle a Rialto Bridge a původní verzi Falcon Shores by firma nezvládla vyvinout a dodat v termínu, takže by zase došlo k ostudu nesoucímu zpoždění jako u Ponte Vecchio – u druhé a třetí generace produktu by to ale bylo pro reputaci asi ještě horší. Na druhou stranu, nemusí to nutně být tak, že Raja Koduri v šéfování selhal a nedokázal dosáhnout toho, čeho měl. Intel totiž také v posledních kvartálech přistoupil ke škrtům a omezování některých aktivit kvůli slabým finančním výsledkům. Je proto možné, že důvodem okleštění roadmapy a zrušení Rialto Bridge je to, že na vývoj teď bude méně prostředků nebo od těchto produktů nebyl očekáván finanční úspěch.

Zdroje: Intel, Tom's Hardware, ServeTheHome (Twitter)