Intel proti hlavní síle Nvidie: AI akcelerátor Gaudi 3 slibuje víc výkonu za míň peněz

11. 4. 2024

Gaudi 3 je oproti GPU od Nvidie a AMD akcelerátor specializovaný čistě na umělou inteligenci. Má být výkonnější i efektivnější než H100 a H200 od Nvidie, ale brzo se bude muset měřit s její příští generací Blackwell.

Nvidia letos odhalila novou generaci svých GPU, či možná především AI akcelerátorů Blackwell, čímž zvedne výkon proti nyní prodávaným H100. Intel, který také o trh umělé inteligence usiluje, tomu bude kontrovat vlastní novou generací akcelerátorů, které teď představil: Gaudi 3. Ty budou dost podobné Blackwellu, také používají dva čiplety v jednom pouzdru.

Intel oficiálně odhalil akcelerátor Gaudi 3 na akci Vision 2024, kde také byly oznámeny procesory Meteor Lake-PS pro socket LGA 1851. Technologie AI akcelerátorů Gaudi pochází od firmy Habana, kterou Intel koupil v roce 2019, Gaudi 3 je v souladu s názvem její třetí generací.

Gaudi 3 je tvořený ze dvou čipletů či čipů, jde vlastně o symetrickou dvojici akcelerátorů v jednom pouzdru (byť asi koherentně propojených s propustností 12,8 TB/s). Každý je tvořen 32 TPC (Tensor Processing Core) a 4 MME (Matrix Match Engine) a obsahuje 48MB cache či pracovní paměť (jde o SRAM) a 4096bitové paměťové rozhraní pro externí paměť HBM2e. Celkem tedy akcelerátor disponuje 64 TPC, 8 MME a 96 MB paměti SRAM a 8192bitovým paměťovým rozhraním. Oba čipy mají přístup do paměti toho druhého a tváří se jako jedno zařízení.

Intel Gaudi 3

Autor: Intel, via: Tom's Hardware

Architektura Gaudi 3 by měla vycházet z Gaudi 2, který byl tvořený jediným čipem (plus HBM2), ale místo 7nm procesu je použitá 5nm výroba u TSMC.

Gaudi 3 bude vyráběný ve dvou verzích. HLB-325L je v mezaninovém provedení OAM (OpenCompute Project Accelerator Module) a HL-338 je dvouslotová karta PCIe. V provedení OAM má akcelerátor TDP celých 900 W a dosahuje výkonu 1835 TFLOPS při použití datového typu FP8. Tyto moduly je možné chladit vodou, ale i vzduchem.

Intel Gaudi 3

Autor: Intel, via: Tom's Hardware

Pro kartu PCIe se uvádí TDP 600 W a stejný výkon, nicméně zde to má být špičkový výkon. Vzhledem ke snížené spotřebě asi může být dostupný po omezenou dobu, zatímco u OAM verze je to základní či stabilní výkon (nebo je schopná boostovat na vyšší výkon, než je pro ni udávaný).

Intel Gaudi 3

Autor: Intel, via: Tom's Hardware

Obě verze jsou osazené 128 GB paměti HBM2e v celkem osmi pouzdrech s celkovou propustností 3,7 TB/s. Pro komunikaci s dalšími akcelerátory nebo CPU je použitý 200Gb/s Ethernet s RDMA, přičemž každý akcelerátor by měl obsahovat 24 těchto rozhraní.

V provedení OAM se počítá s osazením osmi modulů na jednu základní desku, u kartového provedení s osazením čtyř karet v jednom systému. Propojovací linky se však dají použít k postavení větších klastrů složených z více systémů. Maximum je až 1024 systémů s celkem 8192 akcelerátory Gaudi 3 (v provedení OAM).

Intel Gaudi 3

Autor: Intel, via: Tom's Hardware

Podle Intelu má Gaudi 3 být o 50 až 70 % výkonnější než Nvidia H100 při trénování neuronových sítí (pro nové B200 zatím srovnání není, tento akcelerátor také ještě není na trhu, dostupný má být koncem roku, ale ve větších množstvích možná až v roce 2025). Je třeba upozornit na to, že tyto výsledky se asi mohou velmi lišit podle toho, jaký software se měří.

Při inferenci je výkon údajně zhruba na úrovni H100, ale Gaudi 3 má údajně výhodu výrazně lepšího výkonu při použitý delších výstupních sekvencí. Akcelerátory Intelu by také údajně měly být levnějším řešením proti GPU Nvidie.

Intel Gaudi 3

Autor: Intel

Reálně dostupné by akcelerátory Gaudi 3 měly být od třetího kvartálu letošního roku, kdy je bude možné koupit v různých serverech. Testovat a vyvíjet software pro ně bude také možné v rámci Intel Developer Cloudu. Jako první by měly být k dostání servery s OAM verzí akcelerátoru, karty PCI Express se začnou prodávat v Q4 2024.

Zdroje: Intel, Tom’s Hardware

Vstoupit do diskuse (4 názory)

Jan Olšan

Redaktor portálu Cnews.cz. Zaměřuje se na procesory, mobilní SoC, grafické karty, disky a další počítačový hardware. Profil autora →

Témata:

Skoro tak výkonné jak MI300X. Dobrá práce Intel. Více konkurence v tomto segmentu potěší.

Salty Daddy

Sdílet

Intel koupil stoupající hvězdu AI čipů Habana Labs. Prorazí konečně proti Nvidii?

Autor článku

Jan Olšan

Témata:

Anketa

Přejdete k Revolut Mobile, jakmile bude dostupný v Česku?

Kvíz týdne

Komerční sdělení

Lenovo Smart Connect: Jeden ekosystém, nekonečné možnosti propojení

Intel proti hlavní síle Nvidie: AI akcelerátor Gaudi 3 slibuje víc výkonu za míň peněz

Sdílet

Intel koupil stoupající hvězdu AI čipů Habana Labs. Prorazí konečně proti Nvidii?

Autor článku

Jan Olšan

Témata:

Anketa

Přejdete k Revolut Mobile, jakmile bude dostupný v Česku?

Kvíz týdne

Komerční sdělení

Lenovo Smart Connect: Jeden ekosystém, nekonečné možnosti propojení

Dále u nás najdete

Zenbook Duo: elegán se dvěma displeji a několika kompromisy

Zdravotní a sociální pojištění 2026 u OSVČ: Opět výrazný růst záloh

Y Soft hledá vývojáře na počítačové vidění a AI

Fiasko McDonald’s: Když AI reklama ztratí duši

Máte záložní plán, pokud byste chtěli odjet z ČR?

Těžba dat versus strojové učení

Důchody 2026: Jak vypočítat, o kolik vám vzroste penze?

V chaosu veřejných zakázek létá bilion, technologie pomůžou

Google vylepšil živé překlady, už nejsou třeba Pixel Buds

Zálohy na zdravotní pojištění: minimálně 3306 korun

Firma iRobot zkrachovala, nestačila na čínskou konkurenci

Rozbili jste web? Napodobte Cloudflare a hoďte to na něj

Jak chutná a jak se jí physalis, karambola a cherimoya

Provoz krypto burzy? Podobný jako v bance

Změny u pojištění vkladů: Delší ochrana a jistota u velkých částek

Pravda vs. lež: Ukažte, jak se vyznáte v mýtech o potravinách

U jmelí či sirek otrava nehrozí, pozor na prskavky a gelové svíčky

V EU roste černá ekonomika v najímání IT odborníků

Spoření v prosinci: Přehled všech nabídek na trhu

Pokuty pro Albert za „slevy“, které byly ve skutečnosti zdražením