Názor k článku AMD vydalo 96jádrové procesory s 3D V-Cache Genoa-X. Zen 4 s víc než gigabajtem cache od Jim_Keller - A) Revoluční SVE/SVE2 tu máme prakticky tyto (z...

  • 17. 6. 2023 12:51

    Jim_Keller

    A) Revoluční SVE/SVE2 tu máme prakticky tyto (z rozsahu 128...2048-bit):

    1) 512-bit .......... ARM Fujitsu A64FX
    2) 256-bit ......... ARM Neoverse V1
    3) 128-bit .......... všechny ostatní ARMy od little až po big X4 jádra

    Ukaž mi x86 SIMD sadu co umí alespoň tyto 3 délky a zůstala navzájem kompatibilní. Neukážeš, protože x86 jede pořád 30 let staré fixní délky registrů. Naposledy Intel portoval BF16 a NI z AVX512 zpět do 256-bit AVX2 pro jádra Gracemont. Což je prasárna a další sub-verze AVX2 a další fragmentace. Právě proto že 256-bit verze AVX512 neexistuje. A už vůbec si může nechat zdát o 128-bit verzi AVX512, kterou by potřeboval pro Gracemont, protože ten má vnitřně 128-bit SIMD. Tohle vše má ARM s pomocí flexibilních SVE vyřešené. To je ta revoluce.

    1024-bit SVE2 za dva roky? Není problém. Už teď je to kompatibilní a tvůj dnešní SW ti na tom poběží 4x rychleji.

    Nedivím se, že to uživatelé x86 nechápou.
    .
    .
    .
    B) Výkon
    Tady někdo zapomíná na ARM CPU-only superpočítač, v době vydání nejvýkonnější na světě, který výkonstně porazil i obří GPU Nvidia Volta. Až tohle alespoň vzdáleně dokáže x86 CPU tak dej vědět.
    .

    Neoverse V2 má ....... 4x 128-bit FMA
    AMD Zen 4 má ........... 2x 256-bit FMA

    Takže stejný max teoretický výkon když už.
    Navíc při čistě obyč nevektorovém FP64 kódu bude mít V2 výhodu v teoreticky 2x větší IPC než ten Zen 4, protože má 4 vs 2 FPU jednotky.