Názor k článku Intel možná vstoupí do ARMu. Firma s ním jedná o koupi části akcií před IPO od Jim_Keller - 1) ARMové revoluční vektory SVE2 jsou už dva...

  • 15. 6. 2023 10:21

    Jim_Keller

    1) ARMové revoluční vektory SVE2 jsou už dva roky v mobilech (od Cortexu X2 z 2021). Tak jaký vaporware proboha? :-)
    .
    .
    2) SVE je revoluční právě v tom, že má flexibilní šířku vektoru od 128-bit až po 2048-bit. SW pro superpočítač s 2048-bit každému poběží i na low-end mobilu na little jádře které má jen 128-bit SIMD (navíc u A510 ještě může být sdílená pro dvě jádra). Poběží pomalu, ale poběží.

    Pointa je přece kompatibilita instrukční sady nezávisle na šířce SIMD. Zabránit katastrofální situaci jako na x86, kdy AVX512 je pro HPC servery OK, ale v desktopu to ani po 6 letech není standard. A hromada Intel CPU to vnitřně rozkládá na 256-bit a AMD to dělá pouze 256-bit. Takže overkill i pro žravé desktopy. Co teprve e-jádra Gracemont, ty jedou v nitřně 128-bit SIMD a AVX512 neumí vůbec. Nebo teoreticky malé jádra kdyby x86 dělalo CPU pro telefony. AVX512 je katastrofa, které se chtěl ARM vyhnout.
    .
    .

    3) Šířka 2048-bit je o budoucích CPU

    x86: SW pro 128-bit SSE ti na AVX512 rozhodně neběží 4x rychleji.
    ARM: SW pro dnešní SVE2 ti běží na 128-bit, ale v budoucnu ti stejný SW poběží 16x rychleji na CPU který bude umět 2048-bit SIMD SVE4.

    2048-bit je o kompatibilitě do budoucna na dalších třeba 50 let. Už teď ji ARM má. To je ta pravá revoluce - nezávislost na šířce SIMD a tedy to může mít úplně každý CPU od little v mobilu až po mega superpočítače. Naprosto geniální.
    .
    .
    4) CPU-only Superpočítač ARM
    Samozřejmě že udělat CPU-only nejrychlejší superpočítač na světě je úplně jednoduché, dám víc nodů a je to. Proto to x86 vůbec nedělá a dobrovolně přenechává miliardy Nvidii. To si může myslet jen blázen.

    Ve skutečnosti Nvidia těží ze stagnace x86 CPU, která díky zastaralé a neefektivní x86 instrukční sadě neumožňuje efektivně vykonávat výpočty (kdyby ano, tak by Intel a AMD prodávali CPU do telefonů, protože v mobilech jsou větší prachy než v serverech.... ale možná to dělají z dobročinosti a chtějí ARMu přenechat ty miliardy protože už sami neví co s prachama).

    Takže
    ultra-efektivní ISA .............­.............­....... ARM má
    čistě 64-bit bez starého bordelu ............ ARMv8 / v9 umí
    revoluční SVE vektory s až 2048-bit........ ARM má
    maticové instrukce .............­.............­...... ARM má (SVE)

    Vše výše vyjmenované x86 AVX512 ........... NEMÁ
    (ikdyž alespoň ty matice umí Intel AMX, ale stejně je to k ničemu, protože bez těch ostatních věcí GPU neporazí)

    Ono je za tím docela dost práce a přemýšlení ze strany ARMu.