Názor k článku Podoba referenčního Radeonu RX Vega je venku. AMD ho chce stavět proti GTX 1080 od Jan Olšan - Pozor, texturovací jednotky ne, ty se právě používají...

  • 27. 7. 2017 14:34

    Jan Olšan (neregistrovaný)

    Pozor, texturovací jednotky ne, ty se právě používají jenom pro hry a dělají něco jiného než shadery (filtrujou/samplujou pixel podle data z textury). Ve výpočtech GPGPU se uplatňují shadery, na texturovacích jednotkách se kdysi dělaly jen vyloženě experimentální věci předtím, než se programovatelné jednotky, teda shadery, dostaly do popředí.

    Jinak k tomu, že FLOPS může být cokoli - to jo, ale v tomhle případě to podle mě za tím rozdílem nebude. Všechny ALU v těch shaderech jsou stejné, tj. všechny musí umět ty hlavní operace (ADD, MUL), jinak by to GPU nemohlo nic dělat. Tam fakt pochybuju, že bude velkej rozdíl ve výbavě ALU u Nvidie a AMD. Teoreticky by tam mohlo být podpora FMA nebo třeba to, že DIV umí jen některé jednotky v tom bloku. Ale ono to dělení u GPU je hodně zjednodušené kvůli spotřebě a rychlosti (prý to dělají jako násobení převrácenou hodnotou, kterou aproximujou z nějaké LUT - jsem teď někde četl, čert ví, jak je to přesné).

    No v krátkostí tím, že jsou ty shadery replikované, musí mít všechny schopnost výpočtu hlavních operací, takže pochybuju, že by tam byly některé, které by uměle nafukovaly hodnotu FLOPS a přitom uměly jenom nějaké "NOPy". Takže podle mě raw throughput by určitě měl sedět. Nvidia by teoreticky třeba mohla mít lepší latence instrukcí, což by v reálu pomohlo proti závislostem, ale to jsou fakt spekulace, klidně to může být i opačně. Tipl bych si, že nějakej rozdíl danej menšíma bottleneckama, lepším řazením instrukcí a takovýma věcma tam i bude, ale čistě ty teoretické FLOPS, tohle holt nezachycují.

    Podle mě je to fakt i o tom, že u AMD je ten poměr výkonu v shaderech (tj. compute) proti fixed-function (texturování, geometrie, rasterizace, delta komprese obrazových dat) vychýlen na stranu programovatelných shaderů a u Nvidie naopak. A hry víc sedí tomu mixu Nvidie (teoreticky by to mohlo být i proto, že má majoritu a tak to prostě vývojáři nastaví na její architekturu, ale klidně to prostě může být ideální poměr pro game grafiku), proto má v poměru k teoretickému výkonu ve FLOPS (což jsou jenom shadery) vyšší herní výkon. U AMD/GCN jinými slovy ty shadery nevyužívají plnej výkon.

    P.S.
    Ad Maudit - přiznám se, že jsem tě pak už nečetl. Dílem když jsem viděl ten wall of text, tam něco o trojčlence, tak jsem si řekl, že to nejspíš nemá cenu číst, po tom, co jsem s tebou už viděl. Zase celej den na to nemám.