Odpovídáte na názor k článku I v roce 2023 a 2024 budou ve stolních PC dvoujádra. První „Intel Processor“ pro LGA 1700 unikl. Názory mohou přidávat pouze registrovaní uživatelé.
Ten VISC je jinak nazvaný Reverzní SMT, protože princip je stejný. Je to prostě o exploitaci ILP nad rámec co může vidět omezené okno OoO Reorder Bufferu. Akorát R-SMT to dělá HW prostředky v CPU a ten VISC se o to snaží SW cestou zkze instrukční sadu.
Ten VISC se mi zamlouvá víc, protože kompilátor má víc času na analýzu kódu a tedy vidí ILP dál než OoO. Jenže špatně provedený VISC může dopadnout jak VLIW Itanium, kdy SW může sice poskytnout hint na části kodu které se dají provést na jiném jádře/vlákně, ale samotné rozhodnutí musí záležet na CPU (dle aktuálních latencí a dostupných HW prostředků, a v tomto právě Itanium selhalo), takže R-SMT je zase sázka na jistoru. I tu sázku na jistotu u AMD zvorali.
ROB v té době byl od 40 entry u PIII až po monstrózních 72 entry u K7 (dnešní Golden Cove má 512 a M2 má 630), takže R-SMT v CPU byl tehdy vlastně docela "nízko vysící ovoce".
Další důvod proč byl Kellerův Hammer a R-SMT v 1998 velká věc byla neexistence SIMD vektorů (MMX byla parodie na vektory, první 128-bit SIMD vektory SSE se objevily s PIII v 1999). Takže v SW kodu byly hromady FOR smyček ať už pro INT tak pro FP výpočty. Navíc byly pouze 1-jádrové CPU, takže ani na vlákna se tehdy asi moc nehrálo. Tudíž R-SMT měl podle mne super vyhlídky.
Z dnešního pohledu 600-entry ROB procesorů s ultra-wide výpočetním backendem až 8+3 ALU, plus široké SIMD vektory, si myslím že většina funkcionality Kellerova Hammeru byla dávno pohlcena současnými obřími CPU.
Důležitá je otázka efektivity. Tohle Long-distance hintování kodu pro extrakci ILP přes speciální VISC instrukce může dosáhnout daleko vyššího IPC spřažením několika normálních CPU jáder a ve výsledku být daleko efektivnější než jedno obří monstr jádro od Applu.
Dále je možné že to nové rošíření x86 APX může obsahovat právě VISC instrukce pro podporu R-SMT a Rental Core u budoucích Intel CPU. To by byl dobrej vyjeb s AMD, kterýmu by trvalo 6-7 let tohle implementovat.
A nebo to bude druhý Bulldozer, tentokrát od Intelu jakožto Kellerova pomsta Intelu za zničení DEC Alphy :DDDD