Tesla také pokořuje 1 TFLOPS

17. 6. 2008

Sdílet

 Autor: Redakce

AMD se zřejmě bude chlubit prvenstvím, i když oficiální oznámení od Nvidie mělo zpoždění jen několik hodin. Na trhu GPGPU akcelerátorů nabízí Nvidia produkty série Tesla, nyní vydala nové modely na bázi čipů G200. Konkrétně je to karta Tesla C1060 a systém do 19" 1U racku se čtyřmi kartami, Tesla S1070. Původně do řady Tesla patřila ještě externí stanice ve skříni typu tower, ta ale již dále nebude nabízena.

Stejně jako předchozí generace, ani Tesla C1060 nemá výstupy na monitor. To kvůli tomu, že tuto funkci zajišťuje NVIO čip a ten by u tohoto akcelerátoru byl zbytečný. V jádře je aktivních všech 240 stream processorů, ty běží na 1,33 GHz (oproti 1,3 GHz u GeForce GTX 280), na dosažení magické hranice 1 TFLOPS to ale stále nestačí. Frekvence celého jádra uvedena není, ale je zřejmě zbytečná. Karta má k dispozici celkem 4 GB pamětí typu GDDR3, ty pracují na 1,6 GHz efektivně.

Chlazení Tesly S1070 je zřejmě účinnější, než to u samostatné karty, a tak si Nvidia dovolila nataktovat stream processory na 1,5 GHz. Díky tomu se stroj se čtyřmi grafickými jádry může pyšnit teoretickým výkonem mírně přesahujícím 4 TeraFLOPS. Tesla S1070 bude Nvidia prodávat za $7999 (přes 150 tisíc korun), samostatná Tesla C1060 vyjde na $1699 (přes 30 tisíc korun).

Stejně jako současné a budoucí GPGPU akcelerátory AMD/ATi FireStream, i jádro G200 zvládá výpočty s přesností na 64 bitů. Není v nich ale zrovna oslnivě výkonné, Anandtech počítá, že lepšího poměru výkon/watt dosáhne stanice s 32 Xeony. Nízký výkon v double-precision výpočtech je způsoben tím, že v každém čipu G200 je pouze 30 jednotek pro tyto operace. Tyto jednotky jsou přitom nezávislé na stream processorech (oproti tomu, čipy ATi RV670 a RV770 provádí FP32 i FP64 výpočty přes své stream processory). Takže pokud by aplikace vyžadovala oba typy výpočtů zároveň, G200 by mohla dosahovat relativně lepších výsledků. Kdyby naopak program využil pouze double-precision jednotky, Tesla S1070 by pravděpodobně nedosáhla spotřeby 700 W a výpočet Anandtechu by byl tedy chybný.

bitcoin_skoleni

Podobnou tabulku jste mohli vidět v recenzi GeForce GTX 280, pouze tam chyběl Playstation 3 a Tesla na bázi GeForce 8 (G80) a červené GPU se jmenovalo Radeon HD 3870. Nutno ovšem poznamenat, že x86 procesory, Cell v Playstationu 3 a grafická jádra provádí každé jiné druhy simulací a takovéto srovnání tedy není zcela přesné. Výpočty na GPU jsou velmi závislé na optimalizaci programu. Vijay Pande, hlavní vývojář Folding@home, se nechal slyšet, že v laboratoři se na čipu RV670 podařilo dosáhnout rychlosti odpovídající 500-600 nanosekundám simulace za den.

Zdroj: Anandtech

Autor článku