4096bitová sběrnice, nativní podpora FP64, 1800MHz frekvence, alternativa k NVLinku, dostupnost v nejbližší době: já bych řekl, že je tu konečně dobrá konkurence pro výpočetní sektor, protože jsou odstraněny hlavní nedostatky, kvůli kterým výpočetní 14nm Vegy nejsou tak zajímavé.
Teď ještě aby na 7nm zvládli udělat dobré herní karty s GDDR6 a nižšími výrobními náklady, než u 14nm Vegy s předraženou HBM2 a velkým jádrem.
Nvidia si na sebe uplatla bič v podobě ještě vyšších výrobních nákladů u Turingu, takže kdyby se AMD podařilo na 7nm udělat něco dost levného s výkonem třeba po úroveň 1080Ti/2080, tak by to byla naprostá bomba.
Plánované Hi-end Free Sync monitory s vyšším rozlišením a frekvencemi budou vyžadovat high end grafické karty. Provozovat současnou Vegu nebo dvě RX590 v Crossfire se mi stále nezdá jako dobré řešení a věřím, že AMD překvapí. Minimálně 7nm mainstreamové NAVI bude zajímavý krok vpřed a tam už bych třeba o Crossfire i uvažoval... ale snad se přeci jenom dočkáme i něčeho lepšího.
Problem je v tom že AMD high end neplanuje, nova RX590 je len pretaktovana RX480, a nova herna GPU je len upravena VEGA na lepšich taktoch a s menšou pamaťou. NAVI vraj vyzera dobre ale ta kedy pride na trh... Čo viem tak AMD na monopol Nvidii neplanuje utočiť.
Vyzera to blbo ale najblišia konkurencia pre RTX na 12nm bude RTX na 7nm :(
Takhle slaboucky vykon v AI vypoctech? Nemela ta architektura byt zamerena na AI? Kde jsou dedikovana tensor jadra?
Ta karta ma v AI jen ctvrtinu vykonu RTX 2080 Ti - 25 TFLOPS proti 107.6 TFLOPS v FP16 (jestli se to vubec da srovnavat). A to pritom Turing jeste muze provadet normalni CUDA vypocty, zatimco ta Vega uz nema cim. I obycejna RTX 2070, consumer karta za $500, ma dvakrat vetsi vykon v AI nez ta Vega :D To snad AMD (a autor) ani nemuze myslet vazne, ze ma "vysoky vykon v AI". LOL
A kde je schopnost koherentne propojit 16 GPU vcetne jejich pametoveho prostoru a navic s vysokou propustnosti, jako to umi NVLink? Nemel by "Infinity Fabric" (infinity - nekonecno) umet propojit vic, nez 4 GPU? :D Mozna by to meli prejmenovat na "Finite Fabric" ;)
Tohle je jeste vetsi fail nez puvodni Vega.
To je něco jiného, prostě běžné CrossFire/SLI. Tam je ve hře o dost nižší přenosová kapacita, a jen nějaká synchronizace a posílání kusů snímků.
Koherentní propojovací logika (NVLink a tohle) je úplně jiný kafe než primitivní věc typu SLI a CF, tohle je synchronizace obsahu pamětí a cache dvou procesorů. Jako mají mezi sebou CPU ve vícesocketových serverech. To znamená zamezení problému, že procesor A změní nějaká data a ta změna je u něj v jeho cache a jeho paměti. Ale co když na stejnou adresu chce zapsat nebo ji přečíst procesor B? Je nutné, aby si navzájem daly vědět, že hodnotou byla změněná, ab každý nepočítal s nějakou jinou. je to dost náročná věc, pokud to nemá zabíjet výkon.
Mainstream bude co, něco s výkonem řekněme RTX 2070? Proč na tom dělat crossfire? Když je tu 2080Ti, která bude mít v průměrnu podobný výkon jako lépe optimalizované CF tituly a výrazně vyšší výkon tam kde škálování není aspoň 60% nebo zcela postrádá přínos. MultiGPU stavím až tehdy když mi nestačí výkon jedné - nejvýkonnější karty.
Tak RX590 má být tuším na 12nm ne? Takže tam je jasné, že nebude zajímavé.
Ale jestli teď půjde do prodeje 7nm výpočetní grafika, tak by snad někdy příští rok mohla být herní (asi ta Navi). A byť jak říkáš - byly informace, že to bude jen mainstream/lowend, ale oficiální informace nejsou ztím žádné. A výkon na úrovni 1080Ti = Titanu X Pascal z r. 2016 by nebyl v r. 2019 zrovna útok na absolutní hi-end, takže bych takovou možnost nezatracoval.
Např. na tu konstrukci Epiců taky nebyly snad žádné leaky, takže vše se neví dopředu před oficiálním infem.
Ale ano, bohužel je najpravděpodobnější, že další hi-end řada bude až Nvidia na 7nm, která přijde kdoví kdy (chtěl bych věřit, že cca za rok, ale bez té konkurence bych se divil).
Nehádzál by som "flintu do žita" s touto výpočtovou Vegou....čas a potenciálny zákazníci ukážu, či Deep Learnig pôjde cestou INT8/INT4 alebo je to schodné iba iba cez tradičné FP32/Fp16 (angličtina nieje môj silný obor, ale nejaký článok o tom je tu https://nervanasystems.github.io/distiller/quantization/ ). A navyše to pre istú časť trhu má zaujímavý výkon v FP64... má vyšší výkon ako má Tesla V100 PCI-e... a to nehľadiac na plochu čipu (aj keď vďaka 7nm).
Je to jednoduché - tam kde se opravdu využijí Tensor Core, tak tato karta používaná nebude. Jenže TC rozhodně nevyužívá nějaká drtivá většina zákazníků, co kupují výpočetní karty, je to použitelné jen na určité typy výpočtů.
Na zmínil Zero - pro nějakou část trhu je naopak FP64 důležitější, takže nativní podpora FP64 této kartě otevírá dosud zavřený kus trhu.
Nevím přesně jaké jsou podíly poptávky po jednotlivých typech výpočetního výkonu, ale každopádně absence Tensor Cores s akcelereací INT8/INT4 ještě neznamená, že by ta karta byla nanic.
A to víš odkud? AMD snad min. rok již nevydalo nějakou roadmapu a tudíž nikdo vlastně neví co bude. S RX 590 se vůbec nepočítalo a přesto to vypadá, že tady bude ještě tento měsíc, bez nějakého dlouhodobého plánu.
Osobně prostě nevěřím tomu, že by AMD mrhali prostředky jen na profi karty. A když už budou mít Vegu na 7nm a výroba bude bez problémů, byli by blázni nevydat ji i jako herní kartu.
Tvůj offtopic příspěvek pramení z nepochopení kontextu mé odpovědi Mauditovi, který porovnával 2 produkty patřící do různých tržních segmentů, což on evidentně nechápe.A to je opravdu trapas,
Ty se Crha ale ztrapňuješ na různých forech každý den, takže mě vůbec nepřekvapuje, že daný kontext je pro tebe bez vysvětlení nepochopitelný :))
V době, kdy se tohle řešilo, konektivita PCIe iirc stačila bohatě na řešení CF a tehdy ten můstek u Nvidie taky zas tak velkou přenosovou kapacitu neměl. A to řešení AMD fungovalo přes DMA do paměti GPU, možná to mělo i svoje přínosy proti dedikovanému rozrhaní/můstku (proč by to AMD jinak dělalo, že jo). Ale o tom, jestli můstkové rozhraní u Nvidie proti tomu bylo horší, zase těžko mluvit, když se o něm zas tak moc ani nevědělo.
Každopádně myslím, že tehdy na tom moc nesešlo. Ona konektivita PCIe je těma GPU využívána silně hlavně při výpočtech a hlavně pro výpočty je taky NVLink/tady tohle u AMD.
Je možný, že teď s 4K+ rozlišením se ta vyšší propustnost začne rentovat i v herním SLI, ale zase na druhou stranu multi-GPU dost skomírá/hry ho kolikrát nepodporují, tak je otázka, jak důležité je.
Btw, ten Radeon nema v double-precision vyssi vykon, nez Tesla V100. Ta ma taky 7,4 TFLOPS (presne 7,405): https://en.wikipedia.org/wiki/Nvidia_Tesla
jenže - proč by to dělali? Vega20 bude maximálně konkurence GTX1080Ti a prodávat ji tak budou muset za podobně nízkou cenu, což jim úplně zbytečně podsekne marže. Místo toho ji můžou prodat jako Instinct MI50/60 model za o dost vyšší cenu, reflektující cenu výroby 7nm, HBM a celé té package.
Jestli se v AMD poučili, tak předpokládám, že podobnou chybu jako s Vega10 už neudělají.
máš aj nemáš pravdu...a navyše ja to v komentári píšem presne: Tesla V100 Pci-e (má 7TFlops) ale verzia pre NvLink má 7,8TFlops (to ale nepripojíš úplne len tak hoci kde) zdroj: https://www.nvidia.com/en-us/data-center/tesla-v100/
Ako presne si miestny programator predstavuje "limitaciu cipu pomalsim PCIE rozhranim"? Ak pocitam vsetko na strane GPU, s datami v jej vlastnej pamati, mozem ju mat kludne zavesenu na dvoch dratoch cez rozhranie RS232 a spocita to naprosto rovnako rychlo. ;-) Rychle rozhranie potrebujes len ak potrebujes sustavne presuvat velky objem dat medzi CPU a GPU pamatami.
CNN, hadam ze nevis, ze ma V100 na IBM platforme pres NVLink pristup primo k CPU a naopak ..
To samozrejme znamena mensi latence, ucinnejsi scheduling, atd. nez kdyz jdes pres PCIe. Rozdil neni velky, ale je tam. Daleko vetsi rozdil by asi byl ve skalovani vice GPU, ale k tomu jsem data nikde nenasel. Tusim ze snad na AnandTechu o tom byl v dobe vydani V100 pekny clanek.
...rozdiel medzi Tesla V100 PCI-E a Tesla V100 NvLink je v max. TDP (250W vs. 300W), tým pádom NvLink verzia dosiahne výšších frekvencii (tam je skrytý rozdiel výkonu).
Podľa mňa je len otázkou času (zrejme uvedenie na trh Epyc 2), a výjde verzia MI60 aj do SP3 socketu (ten socket je taký veľmi, že sa tam vôjde Vega20 s HBM2 pamäťami s prehľadom :-) ), kde to pôjde cez Infinity Fabric zbernicu
Co se tyce 250W a 300W, tak tam jsi mozna zamenil pricinu s nasledkem. Kvuli limitaci rozhrani co se tyce bandwidth/features nemuselo mit smysl jit na vyssi takty - zadny dalsi zisk. Protoze ale rychlejsi rozhrani kartu nelimituje, je mozne povolit power limit a jit dal i vykonem.
"Critically, NVLInk 2 also introduces cache coherency allowing the GPUs to be cache coherent with CPUs. Expect to see this play a big part in the eventual Power 9 + Volta systems."
https://www.anandtech.com/show/11367/nvidia-volta-unveiled-gv100-gpu-and-tesla-v100-accelerator-announced
Myslím že to nemá moc smysl. Ve většině serverů se totiž používá těch karet co nejvíc a kdyby se to mělo dávat do socketů, tak tím hodně klesne míra integrace, protože desky jsou většinou jen 2S a 4S by už bylo hodně drsné. Ty karty jsou prostorově poměrně efektivní řešení. Pokud by se dělala "socket" verze tak spíš něco jako mezannine provedení u Nvidie.