To IMHO není pravda, jenom je to kombinace toho, že
a) x265 má jen omezené zrychlení, i když těch +8-9 % výkonu podle mě s přihlédnutím k tomu charakteru kódu taky není málo (a z části to může být i tím, že AVX-512 nemusí být použité úplně všude, kde by se to při maximálně brutální optimalizace dalo udělat)
b) implementace Intelu na 14nm procesu. Ten procesor prostě příliš žere a Intel ho nechává běžet na neoptimálních frekvencích a napětích.
Myslím, že na 10 nm, tj. Ice Lake-SP (třeba těch Xeonech W-3300) a na Tiger Lake by ta efektivita mohla dopadnout už o dost líp.
Jinak co tak vidím, tak lidi, co se věnují optimalizování kódu na procesorech x86, mají prakticky vždycky nebo ve velké většině případů AVX-512 rádi a chtějí ho.