"Ono ten rozdíl je vpodstatě měnit do té fázi dekódování, dál už ne (plus to, že kvůli náročnosti dekódování se používá micro-op cache), pak už to ve stádiu micro-opů funguje stejně jako ty ARMy"
S tím +- souhlasím, ale myslím že důležitá je právě ta variabilní délka u instrukcí x86. To ve své podstatě zesložiťuje pipeline, protože její design musí počítat jak s dlouhými, tak krátkými instrukcemi. Takže ty delší instrukce můžou být v pipeline vedeny o pár bloků zpátky nebo zůstat v jedné ALU více taktů, aby byla komplexní operace dokončena. V tom bude mít ARM větší výhodu, i když i u něj samozřejmě existují instrukce, které jsou třeba 8 taktů v jedné ALU, typicky dělení doublů apod.