Nebudu tady spekulovat, kdo rozšířil jaký předpoklad. Jen k tomu takzvanému neúspěchu. Rozšířit backend o 50 a 100 % zní možná jednoduše, má to ale své háčky.
Přidání dvou ALU ke stávajícím čtyřem znamená dost velké změny ve frontendu, tedy víc dekódovaných mikroinstrukcí a víc vyřešených závislostí výpočtů (tedy aby jste výsledkem nepřepsali registr, ze kterého má teprve být čten operand do jiného výpočtu) čím širší jádro, tím to je složitější. Taky tomu všemu musí odpovídat výkon load/store jednotek a vůbec datová propustnost.
A rozšíření vektorových jednotek je zase závislé na využití AVX-512 v kódu.
Ono brblalů, co by to udělali líp než inženýři, je vždy plno.
Já si s nějakými závěry počkám až na nezávislé testy. Jen se vyjádřím k tomu Geekbench, docela chápu že k testu desktopového CPU nechtěli moc používat primárně mobilní test napsaný původně pro ARM.
Intel například nacpal do Lunar Lake 8 ALU
ze 4 ALU na 8 ALU Gracemont - Skymont
ale je fakt, že tyhle nové jednotky dokážou nejlíp zohlednit syntetické benchmarky jako SPEC nebo Geekbench, které nesou optimalizace pro konkrétní architektury, takže tam pak vypadá nárust výkonu mobasticky, ale v reálném světě běžných x86 aplikací je přínos minimální nebo žádný. Je proto vždycky důležité při návrhu nové CPU arch. správně vybalancovat tyto poměry, protože každý port navíc a jednotka žere tranzistory a zvedá spotřebu, zatímco výkon nestoupá lineárně
4. 6. 2024, 07:37 editováno autorem komentáře