A další ironie je, když se podívám, co mělo vlastně SVE/SVE2 řešit: problém, že aplikace a software nevyužívají širší vektory. Tj. například že aplikace pro x86 používají jenom 128bitové SSEx a relativně málo jich používá i 256bit AVX(2), nemluvě o AVX-512.
ARM/SVE tento problém navrhují řešit tak, že instrukce SIMD budou abstraktní od šířky a díky tomu se jednou napíše jeden kód, který pojede jak na těch 128bitových i těch 256bitových jednotkách a tím nebude problém, že procesory s 256/512bitovými jednotkami je mají nevyužité.
Ale co se reálně stalo: ARM se místo těch širších jednotek vrátil ke 128bitové šířce, kterou už měly instrukce NEON. Takže plánovaný přínos SVE/SVE2 se ani nikde nemá jak uplatnit. Ale kód si nese zátěž overheadu a komplikací, které variabilní šířka přináší. Revoluční :)
Tím nechci říkat, že by to byla mizerná technologie jako tady pan expert šíří o x86 SIMD, jenom je třeba trochu zkorigovat tu extrémní adoraci
V současnosti to prostě neplní to, co se od toho očekávalo a jestli to stálo za to a je to dobrý nápad, tedy pořád ještě nebyla šance moc prokázat.
(inb4 řečnění o Fujitsu - k tomu je můj názor takový, že je to HPC procesor, používaný pro numerické aplikace coby konkurence GPGPU a to IMHO moc opravdu moc nedokazuje. O tom, jak dobrá a použitelná architektura to je, ani nejsou moc informace, protože se k tomu málokdo dostane/pro málokoho má smysl se tím zabývat.)
27. 6. 2023, 20:00 editováno autorem komentáře