"A nechápu jako ty cykly, místo toho aby je zkracovali a zpracovávali paralerně, tak jako ještě přidají a prodlouží cestu aby to bylo ještě delší a program čekal na výsledek ještě dýl ?"
Jestli myslíte ten přidaný stupeň pipeline behěm dekódování a o jeden cyklus horší postih za špatně odhadnuté větvení, to není nic nad čím by se bylo třeba pozastavovat.
Ten procesor je pipelinovaný jako všechny, takže přidaný stupeň v pipeline znamená, že to má o ten jeden cyklus delší latenci, než jedna pomyslní operace proleze z úplného začátku zpracování na úplný konec. Pokud je ta hloubka třeba 17, tak se během fetche, dekódování, všech těch řazení, pak přiřazení do jednotek a vykonání postupně posouvá těmi stupni pipeline a každý ji trvá jeden cyklus. Současně jde ale o jeden cyklus pozadu hned další instrukce (a paralelně s ní mohou jít také další instrukce ve stejném stádiu, samozřejmě). V jednom okamžiku má ten procesor rozpracované najednou instrukce ve všech těch 17 stupních zpracování.
Přidání supňů do pipeline neznamená automaticky, že se tím snižuje výkon na 1 MHz. Pokud se predikce větvení dostatečně vylepší, aby absorbovala větší postih při mispredikci, tak ve výsledku nevadí, že je pipeline hlubší.
Je pravda, že je výhoda mít pipeline o míň stupních, může to pomáhat IPC, ale zase to sníží frekvenci, kterou to CPU může dosáhnout.