No teda fascinuje mě, jak jsou pro vás některé věci extrémně určující a jiné zase naprosto zanedbatelné. Na všechno teda reagovat nebudu, ale:
"Load, Store jednotky nemají na IPC vliv, protože OoO Rename provádí tzv. eliminaci Load/Store párů, takže třeba Intel má obrovské množství LSU, ale IPC tomu moc neodpovídá."
A co když výpočetní smyčka čte stream jedněch dat z paměti a druhý stream zapisuje?
IPC je taková statistická věc, aplikací jsou tisícovky a víc a mají různé charakteritisky, věci, které jim pomáhají se mění, nakonec se z toho dá udělat nějaké způrměrované číslo. Když se na load/store vykašlete, tak vám u části z nich vyjde nižší procento a do průměru se to na konci promítne...
Jinak to SME2 už je v nějakém procesoru nasazené? Intel má maticové instrukce AMX s podobným určením a už na trhu jsou (ač ta CPU měla rok a půl zpoždění, takže ARM ekosystém dostal nějakou tu možnost je předběhnout...)
14. 6. 2023, 13:50 editováno autorem komentáře