Názor k článku Unikly detaily architektury Turing: cache, schéma GPU, výrazně rychlejší shadery? od Crha - Doublethink: "L1 cache, která je vždy jedna pro...

24. 8. 2018 11:40

Crha (neregistrovaný)

Doublethink:
"L1 cache, která je vždy jedna pro jeden blok SM, byla zvětšena z 24 KB v architektuře Pascal na 64 KB. Sdílená paměť má 32 KB, ovšem na slajdu je zmíněna i možnost obráceného rozdělení (co to znamená, to ještě nevíme). Nejen kapacita L1 ale stoupla. Důležité (možná i důležitější) bude, že Nvidia zdvojnásobila propustnost této cache, v jednom cyklu bude možno z ní nebo do ní dostat dvojnásobnou šířku dat. Navíc prý Nvidia i snížila její latenci. Kromě L1 cache jinak byla zvětšena i L2 cache celého čipu, která má u Turingu 6 MB (není úplně jasné, zda je tento údaj pro TU102, TU104 nebo pro obě GPU). "

"Kde by se tento výkon navíc mohl vzít?"

Nejnovější