Hlavní navigace

Odpověď na názor

Odpovídáte na názor k článku AMD oficiálně potvrdilo big.LITTLE procesory a APU Phoenix2 se Zenem 4c. Měří 137 mm². Názory mohou přidávat pouze registrovaní uživatelé.

  • Tento text je již více než dva měsíce starý. Chcete-li na něj reagovat v diskusi, pravděpodobně vám již nikdo neodpoví.
  • 6. 7. 2023 8:22

    Jim_Keller

    Olšan ty SVE vektory vůbec nechápe.
    "
    SVE vektory umí virtuálně NEKONEČNOU délku vektoru, kdy v C++ lze použít typ SIZELESS. To umožňuje kompilátoru označit data na kterých má provést autovektorizaci. Už tohle samo o sobě je REVOLUCE.
    "
    Dále SVE oddělilo délku vektoru od samotné instrukce. Typicky fixní vektory jako SSE a AVX musí mít definovanou délku třeba FADD_128SSE takže pro 3 různé délky musí mít x86 také 3 různé instrukce (128 / 256 / 512-bit). Protože ARM SVE umí 16 různých délek (od 128-bit až do 2048-bit s krokem 128-bit) což by bylo naprosté mrhání kodováním instrukcí (takové 1920-bit by zbytečně zabíraly místo a nejspíš je nikdo nikdy nepoužije, protože tam jsou kvůli orthogonalitě ISA), tak CPU nastaví 128-bit mode a pak všechny SVE jsou automaticky zpracovány v 128-bit šířce. Tím se ARM vyhne tomu x86 peklu s duplikovanými instrukcemi jejichž jediný rozdíl je délka vektoru. Je to geniální řešení protože CPU má stejně fyzicky pouze jednu délku SIMD výpočetních jednotek - viz třeba Zen 4 má 256-bit SIMD a AVX512 instrukce musí vnitřně rozkládat na 2x256-bit jak Potěmkinova vesnice. Kdyby x86 uměla tyto revoluční vektory s flexibilní délkou SVE tak by si AMD nastavilo 256-bit mode pro AVX512 a hotovo vyřešeno. Tedy dizajn FPU/SIMD by mohl být mnohem jednodušší, rychlejší, méně tranzistorů, méně promrhané energie atd.
    "
    Další výhoda SVE je že budoucí CPU s 512-bit SVE jednotkami bude zpracovávat dnešní SW 4x rychleji, protože dnes ARM má většinou 128-bit SIMD SVE (4x 128-bit takže výkon to má stejný (o něco lepší kvůli skalárním instr) jako Zen 4 který má 2x256-bit). To třeba x86 neumí, protože AVX512 neumí zrychlit starší 128-bit SSE aby běželi 4x rychleji. Revoluční SVE to umí a teoreticky na 2048-bit SVE ten SW poběží 16x rychleji. Prostě geniální.
    "
    SVE jsou revoluční a ten kdo tvrdí že ne, tak nerozumí tomu jak funguje CPU. Třeba úplně nový RISC-V fixní SIMD ala x86 rovnou zavrhl a vydal se rovnou cestou flexibilních vektorů SVE/RVV. Dokonce ještě vylepšíli SVE tím, že jejich RVV umí flexibilně měnit i počet samotných registrů a počet elementů ve vektoru. A to je podle mne správná cesta. Už jenom tím, že tyto flexibilní vektory lze dle potřeby degradovat do těch fixních když je potřeba zpětná kompatibilita při konverzi SW z jedné ISA na druhou. Prostě geniální revoluce.
    "
    Fixní vektory x86 jsou technologie z 1990 ala MMX. Olšan třeba nezmíní že Intel Alder Lake backportoval VNNI instrukce z AVX512 do AVX2 kvůli těm malým jádrům Atom Gracemont. A nový Meteorlake má backportovat údajně další AVX512 instrukce do AVX2 a tím vytvořil v podstatě třetí a čtvrtou verzi 256-bit AVX, což je naprostý mega bordel, protože tyhle verze zase nepodporuje žádný CPU od AMD. Intel to tradičně dělá aby poškodil AMD, protože on je vlastník x86.