Názor k článku Nvidia vydala GeForce GTX 1660 Ti: Turing s „RTX Off“, ale levnější. Jak dopadl? od Jan Olšan - Jestli si myslíte, že ten 7nm proces u...

  • 23. 2. 2019 11:03

    Jan Olšan (neregistrovaný)

    Jestli si myslíte, že ten 7nm proces u toho GPU nefunguje nebo že to AMD nějak zbabralo, tak IMHO špatně chápete, jak to funguje.
    To není tak, že uděláte čip, a ten má ve výsledku nějaké TDP. TDP může být celá škála, podle toho, jaké frekvence tomu zvolíte.

    Protože má Vega 20 o dost vyšší takty tam, kde Vega 64 evidentně měla výrazný limit, tak evidentně 7nm proces funguje. Kdyby AMD nechalo takty stejné jako u RX 64, tak to asi mělo dejme tomu o těch 40 % lepší spotřebu (nebo kolik se pro ten proces přesně uvádí). Jenž dejme tomu 160-170W Vega 64 AMD nechtělo a mělo cíl, že TDP může být až těch 300 W. Tak narvali frekvence až tam, kde to těch 300 W dávalo (i když iirc podle recenzí má VII nakonec znatelně nižší spotřebu než RX 64), takže zase vysoko do neefektivního pásma, jako u RX 64. Ale jak víte z těch parametrů procesu, tak zlepšení je obvykle "o 50 % lepší spotřeba při stejné frekvenci" NEBO "o 15 % lepší takt při stejné spotřebě". Takže logicky ten zisk ve výkonu je vždycky nižší, když se to žene taktem.

    Celý problém tady je, že AMD podle všeho nemělo prostředky na to, u Vegy 20 (ale ani u Vegy 10, protože tam taky byla ve velikosti čipu ještě rezerva) vyvinulo čip s víc než 4096 stream procesory, které mělo už Fiji. Proč přesně, to nevíme, ale asi je to problém architektury GCN - muselo by to mít víc shader enginů než čtyři (což by bylo fajn, protože pak by bylo víc geometrie) nebo víc jednotek CU na shader engine než 16. Zdá se, že je problém to udělat. Přitom má Vega 20 rozměr ne o moc větší, než tenhle čip TU116, tj. těch shaderů tam mohlo být kolik, o 2000, 3000 víc?
    Kdyby mohly na Vegu 10 a teď i na Vegu 20 dát víc jednotek (je ovšem možné, že by to potřebovalo i víc ROPs, to je možná další věc, se kterou válčí), tak mohli mít takt níž a při stejném konečném TDP by finální výkon byl výš. Reálně má Radeon VII ještě tu smůlu, že nemůže používat plně aktivní čipy, ale jen 3840shaderové, no, takže ještě "lepší".

    Podobnej problém má 12nm proces u RX 590 - kdyby měli peníze/lidi, tak mohli čip navrhnout s novýma knihovnama/design rules a využít vyšší hustotu - byl by menší a asi by i míň žral (nemluvě o tom, kdyby to už nemělo 2,5 roku starou architekturu). Jenže oni evidentně měli prachy jenom na to, vzít stejný návrh jako na 14nm a přesunout ho na 12nm technologii, což dává jenom omezené zlepšení a žádnou úsporu. To samé Ryzen 2000 (Pinnacle Ridge), jinak.
    A zase je problém v tom, že tím pádem nemohli přidat víc jednotek. Víc jednotek by bylo efektivnější, než ty nahoněné frekvence.

    Takže sečteno podtrženo, výkon Navi v potenciálním highendu bude záviset hlavně na tom, jestli se jim povede zvednou počet jednotek nad 4096, nebo ne. Architektura by samozřejmě mohla pomoct, ale hlavní bude tohle.
    V nižším segmentu by to mohli zvládnout bez toho, pokud by třeba už karta za ~200$ měla těch maximálních 4096 stream procesorů... ale pak by už neměli nic nad tím, že jo.