Já bych řekl, že ten Phantom trottling souvisí s tou nedostatečnou paměťovou propustností. Tomu totiž přesně odpovídá snížení příkonu, kdy se procesor fláká, protože čeká, až mu to pameťový subsystém dotlačí. Do těch 8 vláken to ještě s vypětím všech sil stíhá a pak narazí. A jak jednou nestihne dodat data, už se to veze a dopadne to stejně jako s kolonou na silnici. Čím víc aut se snaží procpat zúženým místem, tím pomaleji jedou a tím menší je propustnost toho místa.
Na druhou stranu to v praxi asi nebude na závadu. Ty instrukce jsou mířeny hlavně do serverů, které vykonávají paralelně různé druhy úloh, takže když pár z nich bude využívat AVX-512, pojedou na plný výkon.
Ale že jim to trvalo :-)
Viz zdejší článek "Co přijde po AVX2? Nové instrukce SIMD od Intelu se budou jmenovat AVX-512" z roku 2013
https://www.cnews.cz/co-prijde-po-avx2-nove-instrukce-simd-od-intelu-se-budou-jmenovat-avx-512/
Našel jsem informaci od jednoho vývojáře, že ty power limity taky vedou taky k snížení frekvence uncore pod zátěží, což spomaluje komunikaci mezi jádry, zvyšuje latenci a snižeje propustnost pamětí. Řídící jednotka zřejmě sráží frekvenci (třeba na 1,8 GHz) dřív, než začne snižovat takt jader, takže to taky může přispívat k horšímu škálování.
Přetáčení uncore na druhou stranu zřejmě dost zvyšuje výkon, ale samozřejmě pak taky zvedá spotřebu a zátěž čipu.
Paměť to není, podle těch jeho testů (asi ví o čem mluví, a podle toho blogu ví, jak to testovat odděleně s microbenchmarkem, který na paměti není závislý).
Pokud by to byla paměť, pak by nedošlo k té velké regresi výkonu, kterou v jeho výsledcích vidíte v té tabulce. A když ten propad odstraní zvýšení termálních limitů, tak je to asi jasné.
Jediná otázka je, jak to přesně působí, jestli se vypínají některé jednotky nebo CPU nepovolí zapnutí horních bitů AVX/AVX-512, nebo se tam vkládají prázdné cykly, to těžko říct. Předchozí generace jenom shazovaly frekvenci dolů, al eje možné, že tady přispívá to přetaktovávání CPU na krev ze strany výrobců desek. Yee píše, že jeho deska v turbu defaultně nechá běžet jednotlivá jádra na 4,5 GHz i s AVX-512, i když to to CPU prostě nedává a končí to BSoDem. Je možné, že tahle manipulace frekvencema nějak znefunkčňuje normální obrané techniky těch CPU (tedy snížení frekvence s AVX, AVX-512) a ten phantom throttling je nějaké nouzovka, která se za běžných okolností projevovat nemá.