Ampere s HBM2e. Nvidia vydala verzi čipu A100 pro těžaře, CMP 170HX má výkon 164 MH/s

3. 9. 2021

Sdílet

 Autor: Codefordl
Nejvýkonnější GPU generace Nvidia Ampere, 7nm GA100, teď Nvidia začala prodávat i těžařům kryptoměn, pod označením CMP 170HX. Je ovšem poněkud ořezané.

Když píšeme o nejvýkonnějších GPU Nvidia jako bylo GV100 nebo GA100, většinou u toho říkáme, že běžný člověk si na ně nesáhne, protože jsou pekelně drahá a hlavně určená pro výpočetní oblast, takže do PC se s nimi nepočítá. Jsou z toho ale výjimky a vypadá to, že nejvýkonnější čip Ampere GA100 (jako jediný používající paměti HBM2e a také 7nm proces) teď bude nabídnut širší veřejnosti. Přesněji té, která tzv. těží kryptoměny.

Nvidia totiž teď vyrobila specializovaný akcelerátor pro kryptotěžbu, který je založený na čipu A100, tedy onom nejvýkonnějším výpočetním čipu Ampere, a to v provedení karty PCI Express ×16. V tomto případě se není třeba zlobit, že jdou na těžbu čipy, které by mohly být v herních kartách, protože A100 nelze na 3D herní grafiku použít. A dost možná by se tyto čipy nedaly použít ani pro svůj původní účel. Nvidia používá silně ořezanou konfiguraci a tyto těžební speciály jsou pravděpodobně složené z velké části nebo zcela z vadného křemíku, který by se nedal jinak použít.

Karta se jmenuje Nvidia CMP 170HX, což implikuje, že by měla dosahovat výkonu až 170 MH/s. Čip GA100 má v kartě aktivních 4480 shaderů („Cuda jader“) z 8192. Mělo by jít o 70 bloků SM ze 128, které čip obsahuje, zatímco regulérní akcelerátor Nvidia A100 disponuje 6912 shadery (108 SM). Nvidia uvádí frekvenci boostu 1410 MHz, základní frekvence je zřejmě 1140 MHz.

Tip: Nvidia Ampere je tu: obří výpočetní GA100, 8192 shaderů

Teoretický výkon má být 13 TOPS ve výpočtech INT32, ale údajně jen 0,4 TFLOPS ve FP32, což zní jako dost málo – teoreticky je možné, že výkon výpočtů je uměle omezený, aby se karta nedala použít k ničemu jinému, než těžbě. Nvidia totiž nechce, aby si tuto kartu kupovali jiní uživatelé místo dražšího akcelerátoru A100. Kvůli tomuto je údajně dokonce osekané i připojení PCI Express do systému – zatímco GPU podporuje PCI Express 4.0 ×16, na této kartě je povolen zřejmě jen PCI Express 1.1 ×4 (s propustností 1 GB/s celkově), asi právě aby karta nebyla užitečná k jiným než těžebním aplikacím.

Paměti HBM2e je na kartě také poměrně málo – jen 8 GB, protože těžba Etherea víc nepotřebuje. Zřejmě jsou aktivní čtyři pouzdra s pamětí (takže každé s 2 GB) a tím pádem 4096bitová sběrnice z fyzicky přítomných 6144 bitů. Je ale možné, že fyzicky je osazených více čipů nebo vyšší kapacita a jen je to uměle omezeno. Propustnost pamětí, tedy nejdůležitější parametr pro těžbu kryptoměn, je 1,5 TB/s. Přetaktovat se paměti údajně nedají, nebo alespoň ne s BIOSem, který v kartě nyní je podle prvních uživatelských hlášení.

S výchozí frekvencí pamětí karta údajně dosahuje 164 MH/s v těžbě Etherea při použití algoritmu Ethash. Je to skoro dvojnásobný výkon proti druhému nejvyššímu modelu těžební řady – modelu CMP 90HX. To je 320W karta s čipem GA102 a 10 GB paměti GDDR6X na 320bitové sběrnici dosahuje okolo 86 MH/s.

Nvidia CMP 170HX má TDP 250 W a provedená je jako karta PCI Express s dvouslotovým chladičem. Ten je asi stejný jako na standardních výpočetních kartách. Je pasivní, to znamená, že tyto karty budou potřebovat osazení do rackové skříně se silnými ventilátory, aby u nich chlazení fungovalo. Pro klasický otevřený „rig“ by se musely chladiče nahradit nebo byste kartám nějak partyzánsky museli dodat profukování.

Také je lehce nestandardní napájení, které používá 8pinový konektor pro CPU (EPS) místo obvyklého osmipinu pro grafiky (lze ale použít adaptér ze dvou PCIe osmipinů na jeden osmipin EPS).

bitcoin_skoleni

Tyto karty pravděpodobně budou prodávané hlavně těžařům působícím ve velkém měřítku, na volném trhu tedy nemusí být moc vidět. Jednou by se možná mohly objevovat na aukčních serverech z druhé ruky, ale je otázka, jak moc pak budou užitečné k jiným aplikacím, vzhledem k malé kapacitě paměti.

Galerie: Těžební karta Nvidia CMP 170HX s čipem GA100 a HBM2e

Zdroje: VideoCardz, Codefordl