Odpovídáte na názor k článku Tiger Lake/Gen12 zásadně inovuje architekturu GPU Intel. Největší změna od roku 2006. Názory mohou přidávat pouze registrovaní uživatelé.
JJ, já myslím, že tohle koherentní propojení celého GPU a CPU na úrovni pamětí (a cache) neohrozí, jen to holt bude ovlivňovat programovací model - když člověk nepoužije přímo k tomu určený kompilátor, tak bude (v asembleru) muset zachovat nějaké zásady navíc. A když kód běžící na tom GPU bude správně zkompilovaný, tak si tohle pohlídá a koherentní logika nebude mít na úrovni pamětí problém.
Intel přišel s vlastním standardem koherentního propojení přes PCIe (CXL) a určitě ho bude chtít s těmito GPU používat.
Tady je to asi o tom, že se ukazuje, že "udělat to pořádně už v hardwaru, ať se zjednoduší software" není na rozdíl od x86 CPU výhodný přístup, protože vám to nakonec omezí celkový dostupný výkon. Naproti tomu když se na kód (kompilátor) uvalí určitá omezení, která musí zachovávat a hardware se zjednoduší, aby už některé věci nemusel nadále řešit, tak to dovolí z něj vyrazit víc výkonu.
Ta základní jednotka shaderu/ALU v GPU prostě musí být hodně jednoduchá a efektivní (takže žádná out-of-order execution například). Když ji bude člověk chtít udělat "víc pořádně" aby byla robustní jako CPU, tak spotřebuje moc energie, moc tranzistorů, omezí si takt, a celek nebude mít dost výkonu.