Zatím není, a vzhledem k tomu, jak paperlaunchová byla P100 (reálně dostupná až 2017, víc jak půl roku po "odhalení"), se mi to zdálo předčasný.
Jinak tedy je třeba říct, že i ty AMD Instinct nejsou asi ještě na trhu - moc jasný to není, mají být dostupné v "Q3". Ale mělo by to být blíž a menší vaporware.
Edit: možná tam měla být napsaná spíš ta Frontier Edition, která je taky částečně míněná jako vývojářský hardware pro AI/neuronové sítě.
Mimochodem, https://www.cnews.cz/nvidia-uvadi-voltu-obrovsky-815mm%C2%B2-cip-na-12nm-procesu-hbm2-5376-shaderu/
120 TFLOPS s Tensor Cores, 300W, to mě tedy vychází přesně na 400 GFLOPS/W, ne na "skoro 500".
Tri veci Maudit:
1. Si si istý, že vôbec porovnávaš porovnateľné keď sem pletieš Tensor Cores? Tie sú predsa iba na špecifické úkony. Nebol by som si vôbec istý, či je reálne ich plne vyloadovať a dosiahnuť tak ten proklamovaný výkon, nakoľko sama Nvidia uvádza pri porovnaní s predošlou Teslou cca 2,4x zlepšenie v AI learning a cca 3x zlepšenie v inference. A to pri viac ako 5x vyššom teoretickom výkone.
2. Kde si prišiel na to, že pri použití Tensor Cores máš k dispozícii ešte "vypocetni vykon zbytku karty"?
3. Odkiaľ máš istotu, že pri plnom zaťažení Tensor Cores bude karta držať max boost a neprekročí pri tom TDP?
@ifkopifko
1. Tak ono u těch teoretickcýh výkonů je to vždycky dost hypotetické, protože předpokládají maximální využití, které v praxi není. A taky se uvádějí pro maximální turbo, které nevím jestli ty výpočetní karty úplně v serverech budou běžně dosahovat na 100 %. Tady ale jde o úplně jiné kategorie velikostí, takže bych asi ty FLOPSy ani moc neporovnával. Dal jsme to tam jenom pro ilustraci.
2. Naráz pravděpodobně nebo spíš skoro určitě oboje použít nelze (naplno). A to proto, že jen ty běžné jednotky sežerou při plné zátěži +-celé TDP. Kolik sežerou Tensor cores při plné zátěži celkově, to těžko říct, ale bude to hodně - všechny ty výpočty v té matici zadarmo nebudou plus zátěž registrů (viz AVX/AVX-512).
3. Teoreticky by mohla, ale asi jenom když budou zatížené jenom ty tensor cores a nic jiného. Tipl bych si, že to spíš bude dělat špičky spotřeby a takty při tom poběží níž, jako to má Intel u AVX/AVX-512