Víkendové zamyšlení: strategie AMD a nVidie

24. 4. 2009

Posledních několik týdnů jsem sbíral nápady a postřehy o tom, jaké by RV870 a GT300 mohly být, a zákulisní informace o tom, jaké budou. Jelikož však někdo vyžvanil poměrně detailní specifikace obou čipů, nemusím jen planě spekulovat. Přesto ale cítím, že některé informace zasluhují hlubší zamyšlení či vysvětlení.

RV870 a sweet spot strategy

Prakticky ihned po zveřejnění údajných specifikací čipu ATI RV870 se začaly ozývat mírně zklamané reakce. Že prý s takovými specifikacemi a výkonem přibližně 50 % nad Radeonem HD 4890 nebude „Radeon HD 5800“ žádným velkým překvapením a ATI s kartou moc velkou díru do světa neudělá – zcela jistě ne takovou, jako s Radeony HD 4800. AMD má ovšem promyšlenou strategii, které byly podřízeny všechny Radeony série HD 4000 a bude ji podřízena i následující generace. Řeč je o strategii „sweet spot“.

Strategie sweet spot (překlad „sladký bod“ nezní moc hezky, tak prosím o odpuštění anglicismu) se zformovala někdy v době před vydáním Radeonů HD 4800, pravděpodobně i na základě zkušeností s generací HD 3800. Nejlépe ji vystihuje následující diagram:

AMD zjistilo, že jisté cenové kategorie grafických karet se prodávají lépe, než jiné. Počítáno na kusy se nejlépe prodávají karty za 50 dolarů, atraktivitu tohoto segmentu však snižují nízké marže. Pro RV770 si ATI vyhlédla sweet spot mezi 200 a 300 dolary a navrhla čip tak, aby se za tuto cenu dal prodávat s rozumnou marží. Celosvětově se do sweet spot strefil Radeon HD 4870, v našich končinách si větší oblibu našel slabší Radeon HD 4850.

Další „kopeček“ poptávky je až někde u 500 dolarů. To jsou lidé, kteří nehledí na poměr cena/výkon a nespokojí se s ničím horším, než tím nejlepším. Do tohoto segmentu mohla ATI pohotově zaútočit s dvoučipovou kartou. Na poslední dva sweet spoty, kolem $100 a $50, byly zaměřeny čipy RV730 (Radeon HD 4670) a RV710 (Radeon HD 4350/4550). A protože grafické karty musí postupem času zlevňovat a zákazníci očekávají za stejné sumy výkonnější hardware, stávající produkty se posunují pryč z atraktivních pozic. Právě toto byl důvod k vydání Radeonu HD 4890, ačkoliv na první pohled nemusel být smysl o pár procent výkonnější karty zcela zřejmý. Na segment kolem $100 zase brzy zaútočí Radeon HD 4770 s jádrem RV740.

Stejným způsobem se rodí i RV870. Do doby jejího vydání současné produkty opět „sklouznou“, zákazníci budou s novou generací očekávat nějaké to skokové zvýšení výkonu, a aby se Radeon HD 5800 umístil někam mezi 200 a 300 dolarů, zní specifikace zveřejněné serverem ATI-Forum.de docela uvěřitelně, ač na papíře asi nevypadají tak úžasně, jako loni 800 stream procesorů RV770.

Určitě vám neuniklo, že srovnáváme počty výpočetních jednotek u čipů různých generací, jakoby se nechumelilo. Zdá se však, že Direct3D 11 nepřináší zdaleka tak významné změny, jako verze desátá, a tak lze architekturu podporující D3D 10.1 upravit bez příliš velkých změn. Pro ATI je ironií, že zrovna tesselator, který je v jejích čipech standardně přítomen už od R600 (Radeon HD 2900), musí upravit, aby požadavkům D3D 11 vyhověla. Avšak pokud se potvrdí informace z ATI-Forum.de, bude to výborná zpráva, neboť ATI může vyjít z pevných základů a snad se alespoň částečně vyhne problémům s ovladači pro nové hardware.

Právě problémy s ovladači postihly ve velké míře R600. A to společně s dalším problémem, kterým byla příliš robustní „kostra“ celé architektury: umožňovala sice velkou flexibilitu, ale vinou toho zkrátka podpora Direct3D 10 stála příliš mnoho tranzistorů a na samotné funkční jednotky zbylo méně místa, než by bylo žádoucí. Byla to ale právě ta flexibilita, která umožnila v rámci „D3D 10“ generace přidat podporu D3D 10.1, podle potřeby libovolně měnit poměr ALU:TEX, překopat interní komunikaci mezi jednotkami v čipu, překopat přimknutí shaderů k texturovacím jednotkám, odlehčit texturovací jednotky o téměř zbytečnou podporu FP16 formátů, překopat RBE jednotky, nakonec si i zdánlivě fixní poměr RBE jednotek a paměťových kanálů dal říct… a to celé za dobu, kdy se Nvidia (až na pár výjimek, a se subtilnějšími změnami) držela architektury G8x/G9x. A konečně, co tím chci vlastně říct: pokud byla architektura R600 navržena pro takovou pružnost, aby se na ni bez větších problémů dala naroubovat podpora Direct3D 11, snad cena za tuto investici do budoucna v podobě jednoho nepovedeného čipu nakonec nebyla tak vysoká.

GT300: Je čas na další revoluci

GT300: revoluce, nebo pokračování starých pořádků?

V reklamě na rumunský automobil říká Che Guevara kolegům revolucionářům, že je čas na další revoluci. I tak by se možná dala vystihnout současná situace Nvidie na trhu grafických akcelerátorů. G80 Nvidia vyvíjela přes čtyři roky a investovala do ní nemalé peníze. Na konci stál úspěšný čip, ale v první řadě architektura, která si až dodnes zachovala konkurenceschopný poměr výkonu ku počtu tranzistorů, aniž by ji bylo potřeba překopávat, jako se tomu dělo u ATI.

Všechno nasvědčuje tomu, že stejný „držák“ by měla být i GT300. Opět jde o architekturu, kterou Nvidia vyvíjí asi čtyři roky a která má podobnou dobu vydržet na trhu, pokud možno s co nejmenšími zásahy. Igor Staněk tvrdí, že GT300 bude „něco úplně jiného“, než na co jsme dnes zvyklí. Avšak z jednoho prostého důvodu si Nvidia nemůže dovolit architekturu zcela změnit – alespoň co se týče části shaderů. Tím důvodem je CUDA, která je šitá na míru G80 a z ní vycházejícím čipům. Kvůli tomu budou zachovány skalární jednotky s vlastní frekvenční doménou, mimo to se ale zřejmě přeci jen budou v mnohém lišit od současných čipů.

Podle všeho bude mít GT300 širší bloky výpočetních jednotek: G80 měla clustery po 16 stream procesorech, GT200 po 24, u GT300 by to mělo být 32 SP na cluster. Z hlediska designu čipu je to výhodné, protože se tak dá snáze zvýšit poměr ALU:TEX a šetří se řídící logika. Z hlediska grafických aplikací je to jedno, z hlediska GPGPU aplikací ale už tolik ne – zde se jádro čas od času setká s dynamicky se větvícím kódem a široké SIMD clustery (které v jednom okamžiku provádějí jednu instrukci na velké množině dat) jsou neefektivní. Proto budou výpočetní jednotky a jejich řízení upraveno tak, že bude možno je řídit v menších dávkách. Tomu se říká MIMD – multiple instructions, multiple data. Jak přesně to ale bude realizováno a jak velké tyto dávky budou, to zatím nevíme. A jelikož GPGPU je pro Nvidii důležitá oblast (a profesionální high-performance computing segment slibuje tučné zisky), pravděpodobně se shadery budou muset naučit i provádět výpočty s 64bitovou přeností (double precision).

Nvidia postupuje podle klasické strategie, při které se nejprve navrhuje co největší a co nejvýkonnější čip, který na sebe strhne pozornost a pomáhá prodávat své slabší deriváty. Zřejmou výhodou tohoto přístupu je výkon v high-endu. Nevýhodou je naopak obtížnější zacílení mainstreamových produktů na sweet spoty; u architektur jako Nvidia G8x/G9x nebo ATI R5xx také poměr ALU:TEX, který je vhodný pro high-end, ale ne už tak segment, ve kterém působí slabší derivát.

Ačkoliv Nvidia i s G(T)200 nakonec rezignovala na prosazování jednočipových karet a vydala GeForce GTX 295, evidentně má stále v koncept mamutího monolitického GPU důvěru. 512 shaderů a dvojnásobný počet tranzistorů proti GT200 mají být pojistkou, aby výkon GT300 příliš nezaostával za dvoučipovými kartami konkurence (ideálně aby byl rychlejší) a aby si čip dokázal obhájit vysokou cenu – přesně v těchto bodech totiž GT200 selhala.

Od doby vydání G80 Nvidia vydávala další čipy, do architektury se však kromě GT200 příliš nezasahovalo. ATI během té doby také vydávala další čipy a vedle toho vylepšovala architekturu. Za předpokladu, že by obě firmy dokázaly dát do vývoje a výzkumu stejné prostředky, se mohla Nvidia lépe soustředit na vývoj GT300. Ale nebude tato výhoda jen zdánlivá? ATI už má v současných čipech implementovány funkce Direct3D 10.1 (kterým se Nvidia nevyhne, chce-li podporovat Direct3D 11), paměťový řadič jejích čipů podporuje GDDR5 (které jsou pro čipy vyráběné 40nm postupem nutností) a také má nějaké ty zkušenosti s tesselační jednotkou.

Tyto části jádra tedy Nvidia musí navrhovat od základů. Ale nenechte se mýlit, Nvidia má prostředky na to, aby na konci vývojového procesu byl skvělý kousek hardware s vysokým výkonem. Od zeleného týmu se také všeobecně očekává, že ovladače budou v použitelném stavu – a kdyby nějaké problémy přeci jen nastaly, díky jednočipové koncepci to zřejmě stále bude lepší, než u konkurenčního Radeonu se dvěma čipy RV870 spojenými v CrossFire.

Kolik stojí Direct3D 11?

O jednu věc jsem se v článku zatím ani náznakem neotřel, přestože je to záležitost docela stěžějní. Kolik tranzistorů navíc spolyká podpora Direct3D 11? Počet tranzistorů RV870 neznáme, o GT300 máme pouze neověřený údaj 2,8 miliardy. Do dvojnásobku tranzistorů oproti GT200 by se tedy mělo vtěsnat více než dvojnásobek stream procesorů (zřejmě ještě vylepšených o podporu dual precision a řízení v jemnějších dávkách) a o 60 % více texturovacích jednotek (ty ale vůbec nemusí být stejné jako u GT200).

Pouštím se zde na tenký led, ale dovolím si tvrdit, že podpora D3D 11 tolik tranzistorů stát nebude a tudíž více prostoru zbyde pro navyšování surového výkonu, který narozdíl od podpory nové verze Direct3D využijete ihned.

„Zprava dobrý…“

I letos jsem optimista a věřím, že ATI se podaří nabídnout dobrý produkt do střední třídy a Nvidia se pevně usadí v high-endu. Nějaký zádrhel se ale vždy může objevit. Chyba v návrhu čipu a její oprava zpravidla znamená zpoždění vydání o tři měsíce, potíže by ale mohl dělat i samotný výrobní postup. 40nm výroba u TSMC má podle všeho zatím velmi špatnou výtěžnost i pro malý čip, jakým je RV740. Dokáže tchajwanská výrobna včas vychytat mouchy, aby bylo možné v létě s rozumnou výtěžností vyrábět čip přibližně dvakrát větší (RV870) a na podzim mamutí jádro s plochou mezi 400 a 500 mm² (GT300)?

Bohužel, odpověď na tyto otázky zatím leží ve hvězdách a ti z vás, kteří uvažují o koupi nového počítače (či upgrade grafické karty) se ještě několik měsíců musí spokojit se současnou generací.