Generativní AI levně: Nvidia vypouští mobilní profi grafiky RTX 1000 a RTX 500 Ada pro notebooky

27. 2. 2024

Sdílet

 Autor: Nvidia
Nejlevnější profesionální GPU Nvidie s architekturou Ada Lovelace, která se na jaře začnou prodávat v noteboocích, jsou někde na úrovni mobilní GeForce RTX 4050 – ale s výhodami profi verze ovladačů.

Jen nedávno jsme tu psali o vydání úsporné grafiky Nvidia RTX 2000 Ada, která poskytuje nejnovější architekturu Ada Lovelace s profesionálními ovladači a funkcemi i v lowendové kategorii (což ale stále znamená o dost vyšší cenu). Teď Nvidia vydala podobně mířené grafiky také pro notebooky: mobilní GPU Nvidia RTX 500 a RTX 1000. Obě jsou založená na nejlevnějším čipu 4nm generace AD107, ale v osekané verzi.

Mobilní grafiky RTX (bez GeForce – jde o pokračovatele linie profesionálních grafik Quadro a Quadro RTX) doteď měly jako nejlevnější možnost v nabídce kartu RX 2000 Ada, která je založená na plnotučném čipu AD107 spolu s 8GB pamětí. Jde tedy o něco jako profi verzi desktopové nebo notebookové GeForce RTX 4060. Nyní se k tomu přidávají dvě karty, které jsou obdobou mobilní GeForce RTX 4050.

Nvidia RTX 1000 Ada

Nvidia RTX 1000 Ada má čip AD107 osekaný z 24 na 20 bloků SM, takže poskytuje 2560 shaderů, 80 tensor jader a 20 RT jader. Podle specifikací Nvidie má tato grafika podávat teoretický výpočetní výkon ve výpočtech s přesností FP32 na úrovni 12,1 TFLOPS. To asi znamená, že RTX 1000 Ada pro notebooky má zhruba stejný takt boostu jako RTX 2000 Ada (tj. 2115 MHz), protože rozdíl v TFLOPS odpovídá prakticky přesně zredukování výpočetních jednotek z 24 na 20 SM. Výkon akcelerace AI má být až 193 TOPS (ve výpočtech INT8 s funkcí sparsity, bez ní by výkon byl poloviční).

Důležité omezení této grafiky je v paměti. Nvidia osekala paměťovou sběrnici jen na 96 bitů, což také znamená, že kapacita je jen 6 GB GDDR6. Propustnost kvůli tomu dosahuje jen 192 GB/s (jsou použité 16GHz čipy).

TDP tohoto modelu je přes ořezání a malý počet jednotek vytažené stejně vysoko jako u výkonnějších modelů. Výrobci notebooků ho mohou zvolit v rozsahu 35–140 W (maximum je 115 W + dalších 25 W, které lze grafice přesunout z TDP procesoru pomocí technologie Dynamic Boost). Podle zvolené spotřeby se bude hodně měnit výkon, konfigurace nastavené na 35 W budou mít zlomek praktického výkonu implementace s maximálně štědrým limitem spotřeby.

Mobilní grafiky Nvidia RTX generace Ada Lovelace

Mobilní grafiky Nvidia RTX generace Ada Lovelace

Autor: Nvidia

Nvidia RTX 500 Ada

Nižší model RTX 500 Ada je založený na stejném křemíku, ale je dále osekaný. Aktivních má jen 16 SM, tedy 2048 shaderů, 64 tensor jader a 16 RT jader. Výkon v akceleraci AI má být až 154 TOPS (opět v INT8, včetně použití sparsity). Nvidia uvádí teoretický výkon v FP32 na úrovni 9,2 TFLOPS, podle čehož by frekvence boostu asi měla být někde okolo 2000 MHz.

Základní takt bude asi o dost nižší. Toto GPU má totiž výrazně sníženou spotřebu, jeho TDP může výrobce nastavit z rozsahu 35–60 W, je u něj tedy povolené jen nižší spektrum limitů příkonu. Mezi notebooky umožňujícími 60W režim a těmi, které kartu budou limitovat na 35 W, ale pořád bude značný rozdíl.

RTX 500 Ada má zejména dále osekané paměti na pouze 64bitovou sběrnici. Kvůli tomu má také kapacitu sníženou jen na 4 GB. Propustnost je 128 GB/s. Vzhledem ke kapacitě a TDP by se možná dalo říct, že toto GPU je spíše čímsi jako „profi“ modelem někdejší linie GeForce MX.

Nvidia tyto grafiky uvádí jako řešení pro umělou inteligenci, RTX 500 má například poskytovat „až 14× lepší“ výkon v generativní AI v porovnání s během na CPU (což ale na poměry GPU není úplně velké zlepšení). Je otázka, zda zrovna pro tu generativní AI už nebudou překážkou malé kapacity paměti těchto karet – například demo aplikace Chat With RTX přímo od Nvidie na nich nebude kvůli kapacitě podporovaná.

Chcete doma vlastní AI? Nvidia uvádí chatbot, který se dá snadno pustit na grafice GeForce Přečtěte si také:

Chcete doma vlastní AI? Nvidia uvádí chatbot, který se dá snadno pustit na grafice GeForce

Nicméně tato GPU pořád budou mít přístup k profesionální softwarové podpoře a ovladačům pro řadu RTX, což bude výhoda proti levnějším grafikám GeForce. Poskytují také architektonické novinky GPU generace Ada, jako je podpora DLSS 3 s generováním snímků nebo enkódování videa do formátu AV1. Podobně jako ostatní GPU této generace ale také nemají podporu DisplayPortu 2.1.

bitcoin_skoleni

Mobilní grafiky Nvidia RTX generace Ada Lovelace

Mobilní grafiky Nvidia RTX generace Ada Lovelace

Autor: Nvidia

Tyto modely budou osazovány do levnějších modelů pracovních notebooků (přesněji takových, které nebudou rovnou mít jenom integrované GPU). Mají se objevit v noteboocích HP, MSI, Dellu a Lenova (nejspíš i dalších) během jara.

Zdroje: Tom’s Hardware, VideoCardz