Co je téměř jisté
Většina zdrojů, ať už The Inquirer, Fudzilla nebo NordicHardware, se shoduje na tom, že čip GT200 nese 240 stream processorů, přičemž u GeForce GTX 260 je jich aktivních pouze 192. O 512bitové paměťové sběrnici a z toho plynoucích 32 rasterizačních jednotek (RBEs) už nepochybuje prakticky nikdo. U varianty GTX 260 se hovoří o 24 RBEs a 448bitové paměťové sběrnici, z čehož plyne kapacita pamětí 896 MB.
CJ z Beyond3D fóra získal část zatím interní prezentace Nvidie, kde je uveden jednak již zmíněný počet shaderů, počet tranzistorů a také teoretický výkon ve výpočtech s plovoucí desetinnou čárkou.
GT200 má tedy 1,4 miliardy tranzistorů, což ho řadí na úroveň takových velikánů, jako jsou některá Itania od Intelu. Nutno ale poznamenat, že tam tvoří valnou část plochy jádra cache, naopak u GT200 jsou to téměř výhradně logické obvody.
Další snímek ukazuje doporučené ceny nových karet. GeForce GTX 280 bude stát $649, tedy více, než současná vlajková loď GeForce 9800 GX2 (ta oficiálně stojí $550, dá se ale sehnat levněji). Slabší GeForce GTX 260 pořídíme za přijatelnějších $449, v přepočtu na českou měnu se těsně vejdeme do čtyřmístných částek.
Kromě toho ze 3D modelů karet víme, že GeForce GTX 280 bude pro napájení potřebovat osmipinový a šestipinový „PCI Express Power“ konektory a že na kartách je osazen čip NVIO. Na XtremeSystems fóru jsou už fotky opravdové karty, uživatel INKster z Beyond3D fóra tvrdí, že NVIO čip je jiný, než ten na GeForce 8800 s jádrem G80, ale to už se přesouváme do další kapitolky…
O čem spekulujeme
O interním uspořádání výpočetních jednotek v čipu nebo o počtu texturovacích jednotek oficiální materiály mlčí. A tak zatím koexistují dvě teorie. Podle první je 240 shaderů složeno z 15 bloků po 16 jednotkách a „kulatý“ šestnáctý cluster je záložní, kvůli výtěžnosti, a je tedy i na GeForce GTX 280 deaktivován. Tato teorie počítá se zachováním počtu 16 stream procesorů v bloku, jak je tomu u G80 a G92; počet texturovacích jednotek by pak musel být 60 nebo 120. (G80 má 32 jednotek pro adresování textur a 64 pro jejich filtraci, běžně se uvádí 32; G92 má 64 jednotek pro adresování i filtraci.)
Druhá teorie je odvážnější a tvrdí, že GT200 má clustery po 24 shaderech, přičemž jich je v čipu deset a žádný není záložní. Jelikož na každý blok stream procesorů připadá blok čtyř nebo osmi texturovacích jednotek (podle způsobu počítání), GT200 by tak měla 40 texturovacích jednotek typu G80 nebo 80 jednotek typu G92.
GeForce 8800 Ultra
Živě se diskutovalo také o verzi Direct3D, kterou bude GT200 podporovat. Zůstane Nvidia u DX10, nebo se pochlubí nejnovější verzí 10.1? Většina zdrojů se přiklání k variantě číslo jedna, potvrzená informace to ale není. A já vám to samozřejmě prozradit nemohu.
Charlie Demerjian
Čím si tento redaktor The Inquireru vysloužil vlastní kapitolku? To bylo tak: Nvidia Charlieho nepozvala na Editor's Day (a nemohl tak sbírat fotky a videa jako kolega Radek Bábíček) a to pisálek těžce rozdýchával. Rozhodl se tedy, že se kalifornskému dodavateli grafických čipů pomstí. A sice tak, že prozradí specifikace GeForce GTX 260/280, což vlastně může, protože není vázán NDA. Jenže protože z jeho v afektu psaných článků přímo čiší protizelená nálada a navíc Charlie mezi docela důvěryhodné informace zamíchal zprávy pravděpodobně zcela mylné, nikdo mu nevěří ani slovo.
S materiály od Nvidie souhlasí informace, že výpočetní výkon GT200 nedosáhl na magickou hranici 1 TFLOPS a zůstal na 933 GFLOPS. Charlie píše, že jádro GeForce GTX 280 běží na 602 MHz, doména shaderů tiká na 1296 MHz a paměti typu GDDR3 na 2214 MHz (efektivně). Minimálně takt shaderů odpovídá – výpočtem 240 × 1,296 × 3 (vysvětlím později) dojdeme k číslu 933,120. Protože jsme násobili taktem v GHz, výsledek je v GFLOPS. Přestože Charlieho informace potvrdit nemohu (a tentokrát proto, že frekvence opravdu nevím), vypadají docela uvěřitelně.
O GeForce GTX 260 se dozvídáme, že její jádro běží na 576 MHz a paměti na 1998 MHz. Takt shaderů Charlie neuvádí, zato prozrazuje, že přesné TDP karet je stanoveno na 236 W pro model GTX 280, respektive 182 W u GTX 260. Na jiném serveru se pak objevila informace o tom, že narozdíl typické PC s GeForce 8800 GTX má spotřebu asi 160 W ve 2D režimu (idle), tak PC s GeForce GTX 280 by mělo mít jen asi 90 W. Z toho se dá usuzovat na nasazení podobných nebo ještě vyspělejších technologií než má v současnosti ATI/AMD (PowerPlay). Spotřeba nových GTX ve 2D by se totiž pak dala odhadovat pod 30 W, což by na kartu s 1 GB videopaměti a 1,4 miliardy tranzistorů v jádře bylo vynikající. V ČR už byly tyto informace ale špatně interpretovány jako spotřeba samotné karty, nikoli PC s kartou.
Následně nám ale Charlie tvrdí, že GeForce GTX 260 bude soupeřit se značně levnějším Radeonem HD 4870 a GeForce GTX 280 bude rozdrcena (opět levnějším) Radeonem HD 4870 X2. Sami asi tušíte, že budoucnost pravděpodobně nebude tak růžová (nebo červená?). Není se tedy čemu divit, že i jeho následující tvrzení většina čtenářů pochopila jako prachsprosté vylévání si vzteku na Nvidii.
Charlie totiž tvrdí, že GT200 je o půl roku opožděn, že Nvidia nedosáhla původně zamýšlených frekvencí, že výtěžnost je velmi špatná a výrobní náklady na jeden čip se šplhají až ke 150 dolarům. Ačkoliv tyto informace Charlie podává poněkud zaujatou formou, neodvážil bych se tvrdit, že úplně lže.
Kdysi před rokem se Nvidia nechala slyšet, že plánuje vydávat high-endový akcelerátor (jako GeForce 8800 GTX) každý rok před Vánoci a mírné osvěžení high-endové nabídky (jako GeForce 8800 Ultra) vždy v polovině roku. Osobně jsem za nový high-end považoval GeForce 9800 GX2 (byť byla vydána až v březnu/marci namísto prosince/decembra) a očekával, že GT200 přijde až koncem roku, nicméně nedlouho po vydání dvoučipového monstra bylo nadmíru jasné, že dlouhodobého plánu se Nvidia už dávno nedrží. Je ale pravděpodobné, že prapůvodně měl čip GT200 vyjít koncem roku 2007, a dalo by se tak hovořit o zpoždění. Ale vzhledem k tomu, že Nvidia je už nyní výkonovým leaderem, nikdo žádné zpoždění ani nezaregistroval.
Ohledně frekvencí – je nadevše jasné, že >1 TFLOPS vypadá na marketingovém letáku lépe, než 933 GFLOPS. Vědí to i marketingoví odborníci z Nvidie a jsem si jist, že nedosažení psychologické bariéry je velice zamrzelo. Navíc, vzhledem k tomu, že GT200 je vyráběn 65nm technologií, je s podivem, že takty shaderů jsou nižší, než u 90nm G80. Jsem tedy ochoten věřit, že Nvidia skutečně čekala od svého mamutího čipu více.
65 nanometrů nebyl překlep. Podle Charlieho Demerjiana jsou první čipy GT200, které se dostanou na trh, skutečně vyráběny tímto postupem, až o několik měsíců později nastoupí 55nm die-shrink s prozatímním pracovním názvem GT200b. Že Nvidia zvolila starší 65nm proces namísto nejnovějšího 55nm, se podepsalo také na velikosti jádra, ta je údajně 576 mm2 (pro srovnání: G80 má 484 mm2, G92 přibližně 325 mm2 a R600 420 mm2).
GT200 je podle těchto zpráv největším grafickým čipem všech dob, a to se pak není čemu divit, že výtěžnost není ideální. Podle Charlieho je použitelných asi 40 procent čipů, mnoho z nich je ale částečně vadných a dá se prodat pouze jako GeForce GTX 260. Výrobní cenu jednoho jádra odhaduje Charlie v rozmezí 100–150 dolarů. Pokud je pravda, že 55nm postup je lineárním zmenšením 65nm na 90 %, plocha 55nm GT200b by byla kolem 466 mm2 (576 × 0,92).
„Znovuobjevená MUL“
Takto se na Beyond3D fóru mluví o výpočetních jednotkách, které obsahovala už G80, nejdříve se ale myslelo, že jsou rozbité, pak že se používají jen při některých operacích a dodneška nikdo pořádně neví, co tam vlastně dělají. U G80 se jim říkalo SFU neboli Special Function Unit. Ve skutečnosti jsou to docela obyčejné jednotky schopné násobit (multiply, proto MUL) dvě floating-point čísla. Ke každému stream procesoru je přimknuta jedna, stream procesory jsou tzv. MADD jednotky – umí násobit (multiply) a sčítat (add) v jednom taktu. V anglických textech se proto často setkáte s termínem „dual issue“.
U G80 se do teoretického výkonu v GFLOPS druhá jednotka zpravidla nezapočítávala, výsledkem násobení 128 SP × 1500 MHz × 2 (MADD) tedy bylo 384 GFLOPS. Stejně se počítalo u G92 a ostatních čipů odvozených od G80. U GT200 se ale MUL jednotka započítává. Proto jsem ve výpočtu, kde jsem vám slíbil vysvětlení, dosazoval tři operace za takt namísto dvou. A opět existují dvě teorie: buď se ve stavbě stream processorů odehrály změny, které dovolují využívat MUL jednotku častěji, nebo je to pouze vynález marketingového oddělení Nvidie.
Závěrem doplním jen to, že oficiální vydání (tedy konec NDA) GeForce GTX 280 a GTX 260 je naplánováno na 17. června/júna. Jako vždy v 6:00 ráno pacifického času, tedy v 15:00 toho našeho.
Zdroje: The Inquirer 1 | 2
Beyond3D fórum