Názory k článku AMD uvádí první 7nm Radeony: poprvé s PCIe 4.0, 1TB/s pamětí a Infinity Fabric

Zasílat nově přidané názory e-mailem

Přidat názor

7. 11. 2018 18:55

Gildor

4096bitová sběrnice, nativní podpora FP64, 1800MHz frekvence, alternativa k NVLinku, dostupnost v nejbližší době: já bych řekl, že je tu konečně dobrá konkurence pro výpočetní sektor, protože jsou odstraněny hlavní nedostatky, kvůli kterým výpočetní 14nm Vegy nejsou tak zajímavé.

Teď ještě aby na 7nm zvládli udělat dobré herní karty s GDDR6 a nižšími výrobními náklady, než u 14nm Vegy s předraženou HBM2 a velkým jádrem.
Nvidia si na sebe uplatla bič v podobě ještě vyšších výrobních nákladů u Turingu, takže kdyby se AMD podařilo na 7nm udělat něco dost levného s výkonem třeba po úroveň 1080Ti/2080, tak by to byla naprostá bomba.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 20:53

PetebLazar

Jestliže dosavadní MI25 byla v cenách okolo 5000US$, tak ty nové modely na tom asi nebudou cenově výrazně lépe. Takže na cenově dostupné SR-IOV řešení můžeme zatím s klidem zapomenout.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 20:56

ElPavel (neregistrovaný)

Plánované Hi-end Free Sync monitory s vyšším rozlišením a frekvencemi budou vyžadovat high end grafické karty. Provozovat současnou Vegu nebo dvě RX590 v Crossfire se mi stále nezdá jako dobré řešení a věřím, že AMD překvapí. Minimálně 7nm mainstreamové NAVI bude zajímavý krok vpřed a tam už bych třeba o Crossfire i uvažoval... ale snad se přeci jenom dočkáme i něčeho lepšího.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 21:02

HWSpeedy

To ne, to bude nějaká dezinformace. DementníDebilko říkal, že AMD je technologicky vpředu, když umí komunikovat přes PCIE sběrnici mezi GPU. A nějaké můstky jsou jak z pravěku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 22:08

Crha (neregistrovaný)

jako pěkné a nějakou umělou inteligenci k tomu dodají taky?
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 19:10

snajprik

Problem je v tom že AMD high end neplanuje, nova RX590 je len pretaktovana RX480, a nova herna GPU je len upravena VEGA na lepšich taktoch a s menšou pamaťou. NAVI vraj vyzera dobre ale ta kedy pride na trh... Čo viem tak AMD na monopol Nvidii neplanuje utočiť.
Vyzera to blbo ale najblišia konkurencia pre RTX na 12nm bude RTX na 7nm :(
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 21:20

Maudit (neregistrovaný)

Takhle slaboucky vykon v AI vypoctech? Nemela ta architektura byt zamerena na AI? Kde jsou dedikovana tensor jadra?

Ta karta ma v AI jen ctvrtinu vykonu RTX 2080 Ti - 25 TFLOPS proti 107.6 TFLOPS v FP16 (jestli se to vubec da srovnavat). A to pritom Turing jeste muze provadet normalni CUDA vypocty, zatimco ta Vega uz nema cim. I obycejna RTX 2070, consumer karta za $500, ma dvakrat vetsi vykon v AI nez ta Vega :D To snad AMD (a autor) ani nemuze myslet vazne, ze ma "vysoky vykon v AI". LOL

A kde je schopnost koherentne propojit 16 GPU vcetne jejich pametoveho prostoru a navic s vysokou propustnosti, jako to umi NVLink? Nemel by "Infinity Fabric" (infinity - nekonecno) umet propojit vic, nez 4 GPU? :D Mozna by to meli prejmenovat na "Finite Fabric" ;)

Tohle je jeste vetsi fail nez puvodni Vega.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 23:51

Jan Olšan (neregistrovaný)

To je něco jiného, prostě běžné CrossFire/SLI. Tam je ve hře o dost nižší přenosová kapacita, a jen nějaká synchronizace a posílání kusů snímků.

Koherentní propojovací logika (NVLink a tohle) je úplně jiný kafe než primitivní věc typu SLI a CF, tohle je synchronizace obsahu pamětí a cache dvou procesorů. Jako mají mezi sebou CPU ve vícesocketových serverech. To znamená zamezení problému, že procesor A změní nějaká data a ta změna je u něj v jeho cache a jeho paměti. Ale co když na stejnou adresu chce zapsat nebo ji přečíst procesor B? Je nutné, aby si navzájem daly vědět, že hodnotou byla změněná, ab každý nepočítal s nějakou jinou. je to dost náročná věc, pokud to nemá zabíjet výkon.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 12:12

gogo1963 (neregistrovaný)

jen inteligenci
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 17:54

JirkaK

Mainstream bude co, něco s výkonem řekněme RTX 2070? Proč na tom dělat crossfire? Když je tu 2080Ti, která bude mít v průměrnu podobný výkon jako lépe optimalizované CF tituly a výrazně vyšší výkon tam kde škálování není aspoň 60% nebo zcela postrádá přínos. MultiGPU stavím až tehdy když mi nestačí výkon jedné - nejvýkonnější karty.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 19:35

Gildor

Tak RX590 má být tuším na 12nm ne? Takže tam je jasné, že nebude zajímavé.
Ale jestli teď půjde do prodeje 7nm výpočetní grafika, tak by snad někdy příští rok mohla být herní (asi ta Navi). A byť jak říkáš - byly informace, že to bude jen mainstream/lowend, ale oficiální informace nejsou ztím žádné. A výkon na úrovni 1080Ti = Titanu X Pascal z r. 2016 by nebyl v r. 2019 zrovna útok na absolutní hi-end, takže bych takovou možnost nezatracoval.
Např. na tu konstrukci Epiců taky nebyly snad žádné leaky, takže vše se neví dopředu před oficiálním infem.

Ale ano, bohužel je najpravděpodobnější, že další hi-end řada bude až Nvidia na 7nm, která přijde kdoví kdy (chtěl bych věřit, že cca za rok, ale bez té konkurence bych se divil).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 20:02

Terepin

Hrnú Vegu 20 AMD nechystá. Budúci rok má vyjsť Navi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 22:08

zero8324

Nehádzál by som "flintu do žita" s touto výpočtovou Vegou....čas a potenciálny zákazníci ukážu, či Deep Learnig pôjde cestou INT8/INT4 alebo je to schodné iba iba cez tradičné FP32/Fp16 (angličtina nieje môj silný obor, ale nejaký článok o tom je tu https://nervanasystems.github.io/distiller/quantization/ ). A navyše to pre istú časť trhu má zaujímavý výkon v FP64... má vyšší výkon ako má Tesla V100 PCI-e... a to nehľadiac na plochu čipu (aj keď vďaka 7nm).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 23:53

Maudit (neregistrovaný)

"Tam je ve hře o dost nižší přenosová kapacita, a jen nějaká synchronizace a posílání kusů snímků."

Byvavalo. V dobe 4k/8k/120Hz uz kapacity SLI/CrossFire moc nestaci.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 22:22

Gildor

Je to jednoduché - tam kde se opravdu využijí Tensor Core, tak tato karta používaná nebude. Jenže TC rozhodně nevyužívá nějaká drtivá většina zákazníků, co kupují výpočetní karty, je to použitelné jen na určité typy výpočtů.
Na zmínil Zero - pro nějakou část trhu je naopak FP64 důležitější, takže nativní podpora FP64 této kartě otevírá dosud zavřený kus trhu.

Nevím přesně jaké jsou podíly poptávky po jednotlivých typech výpočetního výkonu, ale každopádně absence Tensor Cores s akcelereací INT8/INT4 ještě neznamená, že by ta karta byla nanic.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 11:40

steny (neregistrovaný)

FP64 Performance:
MI60: 7,4 TFLOPS
RTX 2080TI: 0,4 TFLOPS

Trapas
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 13:12

CNN (neregistrovaný)

Je uplne jedno k comu sa to pouziva, proste mostik naviac znamena bandwidth naviac a jeho dedikacia k niecomu eliminaciu potencialneho kolisania rychlosti, ci latencii. Ale to by Ddebilek musel mat aspon zakladny Ahnung ako pocitace a hardware naozaj funguje. ;-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 21:33

snajprik

Vlasne ano, ja som mal za to že AMD vyda jak vegu pre profi trh tak vegu pre herny a až potom pride NAVI. VEGA pre herni trh sa nekona, tak že NAVI je nastupca.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 22:40

Maudit (neregistrovaný)

To samozrejme ne. Jde o ten marketing. Jak muze tahle karta byt propagovana na AI vypocty, z toho mi jde hlava kolem.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 2:33

siddhi (neregistrovaný)

A to víš odkud? AMD snad min. rok již nevydalo nějakou roadmapu a tudíž nikdo vlastně neví co bude. S RX 590 se vůbec nepočítalo a přesto to vypadá, že tady bude ještě tento měsíc, bez nějakého dlouhodobého plánu.
Osobně prostě nevěřím tomu, že by AMD mrhali prostředky jen na profi karty. A když už budou mít Vegu na 7nm a výroba bude bez problémů, byli by blázni nevydat ji i jako herní kartu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 11:42

del42sa (neregistrovaný)

daleko důležitější než absolutní výkon nebo přítomnost tensor cores či rychlost propojovací logiky je použitý software a poskytovaná podpora. tam amd pořád pokulhává za nvidií ....
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 11:58

Crha (neregistrovaný)

Bugati Veyron : 407,5 km/h
Scania R730 : 167 km/h

Trapas
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 12:04

gogo1963 (neregistrovaný)

možná jeden nepodstatný detail ... pokud má AMD akceschopný 7nm čip, má jej také nVidie ... takže s tím bičem bych nejásal ...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 12:46

steny (neregistrovaný)

Tvůj offtopic příspěvek pramení z nepochopení kontextu mé odpovědi Mauditovi, který porovnával 2 produkty patřící do různých tržních segmentů, což on evidentně nechápe.A to je opravdu trapas,
Ty se Crha ale ztrapňuješ na různých forech každý den, takže mě vůbec nepřekvapuje, že daný kontext je pro tebe bez vysvětlení nepochopitelný :))
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 14:55

Maudit (neregistrovaný)

Ooo, FP64, ktere je na RTX 2080ti umyslne omezenej. No to je meritko kvality cipu jak noha. Amd fans .. LOL
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 17:51

JirkaK

2080Ti je herní grafika, není to výpočetní grafika a má záměrně FP64 ořezané na kost aby to k tomuto účelu nebylo zneužíváno.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 20:43

Jan Olšan (neregistrovaný)

V době, kdy se tohle řešilo, konektivita PCIe iirc stačila bohatě na řešení CF a tehdy ten můstek u Nvidie taky zas tak velkou přenosovou kapacitu neměl. A to řešení AMD fungovalo přes DMA do paměti GPU, možná to mělo i svoje přínosy proti dedikovanému rozrhaní/můstku (proč by to AMD jinak dělalo, že jo). Ale o tom, jestli můstkové rozhraní u Nvidie proti tomu bylo horší, zase těžko mluvit, když se o něm zas tak moc ani nevědělo.
Každopádně myslím, že tehdy na tom moc nesešlo. Ona konektivita PCIe je těma GPU využívána silně hlavně při výpočtech a hlavně pro výpočty je taky NVLink/tady tohle u AMD.
Je možný, že teď s 4K+ rozlišením se ta vyšší propustnost začne rentovat i v herním SLI, ale zase na druhou stranu multi-GPU dost skomírá/hry ho kolikrát nepodporují, tak je otázka, jak důležité je.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
7. 11. 2018 22:46

Maudit (neregistrovaný)

Btw, ten Radeon nema v double-precision vyssi vykon, nez Tesla V100. Ta ma taky 7,4 TFLOPS (presne 7,405): https://en.wikipedia.org/wiki/Nvidia_Tesla
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 4:00

Gildor

V této koncepci se 4096bit sběrnicí, apod, to vážně pochybuji.
Ale ono "Navi" (nebo jiná herní grafika co přijde) může v praxi být taková "herní 7nm Vega", ať už se to bude jmenovat jakkoli = nějak zjednodušená a zlevněná verze této Vegy.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 8:33

tynyt

jenže - proč by to dělali? Vega20 bude maximálně konkurence GTX1080Ti a prodávat ji tak budou muset za podobně nízkou cenu, což jim úplně zbytečně podsekne marže. Místo toho ji můžou prodat jako Instinct MI50/60 model za o dost vyšší cenu, reflektující cenu výroby 7nm, HBM a celé té package.

Jestli se v AMD poučili, tak předpokládám, že podobnou chybu jako s Vega10 už neudělají.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 21:55

Crha (neregistrovaný)

aha tak to sorry, já jen znovu zopakuji, že nevidím na jaký příspěvek reaguješ, takže tak...
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 6:58

zero8324

máš aj nemáš pravdu...a navyše ja to v komentári píšem presne: Tesla V100 Pci-e (má 7TFlops) ale verzia pre NvLink má 7,8TFlops (to ale nepripojíš úplne len tak hoci kde) zdroj: https://www.nvidia.com/en-us/data-center/tesla-v100/
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 9:06

Maudit (neregistrovaný)

Ja to chapu. Ake to je jako udavat vykon high-end grafiky sparovane s Celeronem. Jinymi slovy ten cip zvladne vic, kdyz neni limitovany pomalejsim PCIe rohranim.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 11:46

del42sa (neregistrovaný)

navi = odebrat z vegy 10/20 všechny zbytečné a neherní featury ( fp64, hbcc, xgmi, hbm, ecc, atd.) + nutná optimalizace spotřeby/taktovací frekvence.

ideální dostat se přes limit 4 SE a tím zvednout celkový výkon nebo konečně zprovoznit ngg fast path a primitive shader
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 13:05

CNN (neregistrovaný)

Ako presne si miestny programator predstavuje "limitaciu cipu pomalsim PCIE rozhranim"? Ak pocitam vsetko na strane GPU, s datami v jej vlastnej pamati, mozem ju mat kludne zavesenu na dvoch dratoch cez rozhranie RS232 a spocita to naprosto rovnako rychlo. ;-) Rychle rozhranie potrebujes len ak potrebujes sustavne presuvat velky objem dat medzi CPU a GPU pamatami.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 14:53

Maudit (neregistrovaný)

CNN, hadam ze nevis, ze ma V100 na IBM platforme pres NVLink pristup primo k CPU a naopak ..

To samozrejme znamena mensi latence, ucinnejsi scheduling, atd. nez kdyz jdes pres PCIe. Rozdil neni velky, ale je tam. Daleko vetsi rozdil by asi byl ve skalovani vice GPU, ale k tomu jsem data nikde nenasel. Tusim ze snad na AnandTechu o tom byl v dobe vydani V100 pekny clanek.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 14:57

zero8324

...rozdiel medzi Tesla V100 PCI-E a Tesla V100 NvLink je v max. TDP (250W vs. 300W), tým pádom NvLink verzia dosiahne výšších frekvencii (tam je skrytý rozdiel výkonu).

Podľa mňa je len otázkou času (zrejme uvedenie na trh Epyc 2), a výjde verzia MI60 aj do SP3 socketu (ten socket je taký veľmi, že sa tam vôjde Vega20 s HBM2 pamäťami s prehľadom :-) ), kde to pôjde cez Infinity Fabric zbernicu
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 22:55

Maudit (neregistrovaný)

Co se tyce 250W a 300W, tak tam jsi mozna zamenil pricinu s nasledkem. Kvuli limitaci rozhrani co se tyce bandwidth/features nemuselo mit smysl jit na vyssi takty - zadny dalsi zisk. Protoze ale rychlejsi rozhrani kartu nelimituje, je mozne povolit power limit a jit dal i vykonem.

"Critically, NVLInk 2 also introduces cache coherency allowing the GPUs to be cache coherent with CPUs. Expect to see this play a big part in the eventual Power 9 + Volta systems."
https://www.anandtech.com/show/11367/nvidia-volta-unveiled-gv100-gpu-and-tesla-v100-accelerator-announced
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
8. 11. 2018 20:37

Jan Olšan (neregistrovaný)

Myslím že to nemá moc smysl. Ve většině serverů se totiž používá těch karet co nejvíc a kdyby se to mělo dávat do socketů, tak tím hodně klesne míra integrace, protože desky jsou většinou jen 2S a 4S by už bylo hodně drsné. Ty karty jsou prostorově poměrně efektivní řešení. Pokud by se dělala "socket" verze tak spíš něco jako mezannine provedení u Nvidie.