Rozhovor: Eric Demers nejen o RV770 a R700

23. 9. 2008

O R600 a současné architektuře

Pokud jste jméno Sir Eric Demers už někdy slyšeli, tak pravděpodobně tušíte, že je to jeden z nejdůležitějších členů inženýrského týmu ATI. Je to zpravidla právě on, kdo si po vydání nových grafických akcelerátorů najde čas a o technologických novinkách pohovoří s novináři. Takto můžete vygooglit například rozhovory o čipech R580 nebo R600 (jehož byl šéfinženýrem). Nyní vám přinášíme překlad rozhovoru na téma jádra RV770 a dvoučipové karty R700 (Radeon HD 4870 X2), na jehož zveřejnění má ExtraHardware exkluzivní právo v rámci České republiky. Originál vyšel na serveru Rage3D.

Eric Demers na fotce z roku 2003

Protože rozhovor hýří technickými pojmy, kterým by někteří z vás nemuseli rozumět, s pomocí Jirky Součka, místního odborníka přes architekturu RV770, jsem sestavil několik vysvětlivek, kterými v podobě barevně odlišeného odstavečku sem tam do interview vstoupím. Už vás nebudu déle zdržovat, můžete začít hltat zvídavé otázky a vyčerpávající odpovědi.

R600 alias Radeon HD 2900

Rage3D: Než se dostaneme k RV770, mohli bychom mohli začít otázkou ohledně R600. Byl její neúspěch výsledkem špatného odhadu, jakým směrem se bude trh vyvíjet? Bylo kladení důrazu na technologie potenicálně dobré do budoucna (například 64bitové filtrování v plné rychlosti) špatným rozhodnutím?

Eric: Když se podíváte na RV670, což byla víceméně R600 po die-shrinku, to byl velmi úspěšný čip – takže ta architektura nemohla být tak špatná, ne? Jestli se nám s R600 něco opravdu nepovedlo, tak to byla volba výrobního postupu: na 80nm, který jsme použili, byl čip prostě příliš velký a moc hřál. Kdybychom věděli, kdy bude dostupný 65nm proces, zvolili bychom raději ten. Co se týče 64bitového filtrování, R600 byla celkově zaměřena na použití floating-point formátů – propustnost paměti na to byla, texturovací jednotky na to byly stavěné – ale nepoužívalo se to tolik, jak jsme očekávali. Takže tohle jsme u RV770 změnili, 64bitové filtrování je nyní prováděno s poloviční rychlostí.

Rage3D: Z nynější perspektivy, bylo dobré rozhodnutí udělat superskalární shadery, proti skalárním, které používá konkurence?

Eric: Ony vlastně nejsou úplně superskalární, spíš VLIW (very long instruction word). A ano, pořád si myslím, že to byl velmi dobrý nápad. Typická zátěž, kterou vytváří 3D grafika, naší architektuře sedí dobře. Řekl bych, že dostat ze stream procesorů maximální výkon nikdy nebyl problém. Samozřejmě, že lze napsat vysoce serializovaný kód, ve kterém by naše uspořádání bylo v nevýhodě, ale to je čistě teoretická záležitost a v praxi se to nikdy nestane. Budeme tohle uspořádání používat už navždycky? Na tuto otázku neznám odpověď, stále zkoumáme, co bychom mohli vylepšit, ale budete si muset počkat, jak naše budoucí architektury budou vypadat.

Rage3D: Jak by se dal popsat vývoj kompilátoru od doby uvedení Radeonu HD 2900 do současnosti? V nedávné době jsme v některých velmi náročných případech zaznamenali značné zlepšení – znamená to, že lidé, kteří pracují na kompilátoru, pořád vymýšlí nové způsoby zacházení s kódem?

Eric: Náš kompilátor se pořád vyvíjí a zlepšuje a tým, který za ním stojí, pořád hledá nové, lepší způsoby využití hardware. Ten tým není moc početný, myslím, že v něm je ani ne tucet kluků, ale všichni jsou velmi dobří. Stále nalézají inovativní řešení.

Rage3D: To musí být veselá parta, celý den koukat do kódu…

Eric: (smích) To nevím. Znám jejich vedoucího a to je skvělý člověk. Myslím, že pro ně je hledání lepších řešení pro kompilátor výzva.

Rage3D: Když už mluvíme o tomhle, možná by se hodilo zeptat se na GPGPU. Vy jste se teď zcela přeorientovali na OpenCL?

Pozn.: ATI hodila přes palubu své dosavadní rozhraní Close-to-Metal a oznámila, že se chce soustředit na otevřená API OpenCL a DirectX 11 Computational Shaders.

Eric: Jsme silnými přívrženci OpenCL. Spolupracovali jsme s Apple, jsme členy komise Khronos Group pro OpenCL. Chceme se zaměřovat na otevřené standardy, které posunou průmysl někam dál. Být závislí na proprietárních řešeních není dlouhodobě schůdná cesta. Od OpenCL si hodně slibujeme.

Rage3D: To je elegantní způsob, jak říct, že nebudete podporovat CUDA, když Nvidia tvrdí, že byste mohli/měli/musíte.

Eric: Bez ohledu na to, co Nvidia tvrdí, CUDA je jejich proprietární technologie. To znamená, že kdybychom ji měli podporovat, vždy budeme na druhém místě, následovat vedení Nvidie. To není pozice, ve které bychom chtěli být. Kromě toho, jednou z charakteristik platformy CUDA je, že je šitá na míru G80, takže abychom měli důvod ji používat, museli bychom postavit G80. Takže ne, nehodláme používat nebo podporovat CUDA v nějaké dohledné době.

O RV770

RV770 alias Radeon HD 4800

Rage3D: Jaké tajemství se skrývá za téměř neuvěřitelnou úsporou velikosti čipu RV770 (je malý a přesto nabízí velký výkon)? Prováděli jste významné úpravy návrhu čipu "ručně"? Byly velké části čipu navrženy od základu nově?

Eric: Tajemstvím spočívá v mnoha měsících špičkové práce našich inženýrů. Poměrně dlouhou dobu jsme přezkoumávali naše předcházející čipy (všechny) a hledali jsme místa kde by bylo možné zlepšit jak hrubý výkon, tak výkon na mm². Velké úsilí jsme věnovali přepracování bloků na základě analýzy předchozích generací GPU v novém čipu tak, aby byly efektivnější a menší. Zároveň jsme hledali novou rovnováhu mezi výpočetním výkonem a datovou propustností, která by lépe vyhovovala požadavkům dnešních programů a her. Změnili jsme také uspořádání paměťového rozhraní – zvolili jsme lépe vyladěnou strukturu kanál/klient, která poskytuje klientským obvodům lepší datovou propustnost.

Velké množství práce bylo odvedeno také v oblasti rozvržení jednotlivých částí GPU, což nám umožnilo vytvořit malý čip. Téměř rok před tím, než jsme zahájili výrobu jsme začali plánovat rozvržení jednotek a vlastní práce na fyzickém designu čipu. Poslední měsíce jsme pak strávili prakticky výhradně úpravami fyzického designu a prací na dosažení plochy, do které jsme se chtěli vejít. Na každém čipu je spousta specifické práce, například veškeré I/O obvody. Vlastní výpočetní jádro je poskládáno z předem navržených buněk, ale paměti (cache) se kvůli lepšímu využití plochy navrhují zvlášť.

Bezpochyby je v tom ale i trocha magie. Je to obětavá oddanost našich inženýrů pracujících v laboratořích na návrhu čipu, ovladačích a software – počínaje nováčky a konče vedoucím architektem celého projektu. Naši lidé pracovali obdivuhodně tvrdě a vytvořili dost možná nejlepší výrobek, jaký jsme kdy uvedli na trh a jak věříme svého druhu nejlepší v současné době dostupný produkt. Jsem na ně a na to co dokázali velmi pyšný.

Rage3D: Jak jste změnili UTDP (ultra thread dispatch processor – řídící procesor shaderů) v RV770? Předpokládám, že byl rozšířen s ohledem na šest dalších SIMD bloků, zachovali jste ale duální uspořádání Arbiter/Sequencer, jaké měla architektura R6xx? Mají jednotky pro načítaní vertexů a textur stále dedikovaný pár řadičů, tak aby bylo možné je využívat nezávisle na výpočtech prováděných v SIMD blocích? Byly zvětšeny příkazové fronty?

Pozn.: Každý blok SIMD obsahuje určitý počet shaderů (ALUs) propojený s jedním blokem texturovacích jednotek. R600 a RV670 mají čtyři SIMD bloky po 16 5D ALUs (celkem 64), RV770 má SIMD bloků deset (celkem 160 5D ALUs).

Eric: Dispatcher (UTDP) byl změněn na základě bezmála 18 měsíců práce vývojového týmu. Navrhli jsme jej škálovatelnější, tak aby zvládl více SIMD a zároveň nabídl nové funkce a vyšší výkon. Jedná se o evoluci předchozí verze, od které zdědila to nejlepší, jako je schopnost řídit několik bloků současně – například texturovací jednotky, ALUs a další. Co se týče příkazových front, provedli jsme jistou dávku ladění a optimalizací pro dosažení lepší výkonnostní rovnováhy.

Rage3D: Jaký je rychlost zpracování trojúhelníků (triangle setup) v RV770? V případě R600 to byl jeden trojúhelník na takt, RV670 tuto hodnotu snížila pokud vím na polovinu, ale nezveřejnili jste, zda se RV770 chová jako starší či mladší z předchůdců. Považujete rychlost triangle setupu za omezení, které se v poslední době stalo až příliš svazujícím a které by se mělo nějak řešit, aby došlo k výraznějším nárůstům výkonu u nových generací GPU?

Eric: Všechny naše čipy mají maximální hodnotu 1 primitive/takt. Dokonce i RV610 byl schopný této hodnoty za určitých okolností dosáhnout. Ostatně při technologických ukázkách tesselace dosahují jak ATI Radeon HD 3870, tak i ATI Radeon HD 4870 stabilních hodnot přes 600 milionů trojúhelníků za sekundu, ne-li ještě víc. Existuje ale mnoho faktorů, které ovlivňují reálné hodnoty, včetně propustnosti, takže skutečný výkon se může u jednotlivých čipů výrazně lišit, podle toho, jak daná hra či aplikace funguje. Co se celkových omezení týče, jsou určitě případy kdy současná GPU nestačí – například tesselace krátkých vektorových úseček, kdy je rychlost triangle setupu nedostatečný. V současné době se ale jedná spíše o výjimečný problém – častěji narazíme na výkonnostní omezení jinde. Samozřejmě s tím, jak budou hry stále častěji využívat tesselaci či displacement mapping pro zvýšení detailů pomocí geometrie, budou nároky na geometrický výkon stoupat. Na to, jaké změny to v budoucnu přinese, si budete muset počkat.

Pozn.: V souvislosti s geometrií ve 3D se pojmem „primitive“ obvykle označují ty nejjednodušší geometrické útvary (body, přímky, trojúhelníky a další polygony).

Rage3D: Na téma tesellatoru, kdy se dočkáme SDK (software development kit) a dokumentace popisující, jak ho využít? Pokud vím, tak nic takového doposud v podstatě neexistuje.

Eric: To je zajímavá otázka. SDK pro tesselator ještě není hotové, a momentálně není pro jeho vydání stanovené pevné datum. S vývojáři, kteří se o tesselator zajímají, spolupracujeme přímo. Také podpora v ovladačích ještě není úplně hotová, hodláme ji přidat v listopadových Catalystech (8.11). Takže než si s ním začnete hrát, musíte ještě chvilku počkat.

Rage3D: Jak funguje detekce hran u Edge-Detect AA? Jedná se o čistě analytický postup, tedy takový který využívá filtru Sobel/Canny-Deriche, nebo využíváte diferenciální detekci hran, či snad spoléháte na porovnání Z-hodnot („hloubka“ v trojrozměrném prostoru, vzdálenost bodu od pozorovatele) a kontrolu, zda je daná „dlaždice“ plně komprimována?

Eric: Nechceme toho o našem algoritmu prozrazovat příliš mnoho – je to tak trochu náš tajný recept. Ve stručnosti se ale jedná o směs hardwarových a softwarových funkcí. Používá techniku, s níž je možné detekovat hrubé hrany, oddělit oblasti obrazovky, které tyto hrany obsahují a následně na tyto oblasti aplikovat filtr, který hrany přesně zaměří. Poté je na ně použit filtr s adaptivním jádrem, který hrany vyhladí.

Rage3D: Teď k jednomu poněkud palčivému problému. Myslíte si, že byl dobrý nápad nastavit chladiče na RV770 s ohledem na tichý provoz namísto účinnějšího chlazení?

Eric: Prošli jsme mnoho ohlasů, které jsme obdrželi, a věnovali jsme se tomu tématu docela důkladně. Vyšlo najevo, že většina uživatelů je citlivější na hluk, který chlazení vytváří, než na teploty, kterých GPU dosahuje, takže jsme se snažili o co nejtišší provoz karet. I přesto je chlazení, které jsme použili, dostatečně dimenzované pro standardní napětí a takty. Naše čipy snesou teploty do 105 °C, což je více, než normálně dosáhnete, takže chladiče udrží čipy v rámci provozních parametrů. Samozřejmě, pokud uvažujete o výraznějším přetaktování, pak vám asi lépe poslouží chladiče, které na karty osazují někteří naši partneři. Některé z nich jsou pro přetaktování vhodnější než referenční řešení.

Rage3D: Je skutečnost, že jak ATI Radeon HD 4870, tak i ATI Radeon HD 4870 X2 snižují svou frekvenci při nízké zátěži na 500 MHz (narozdíl od karet HD 4850, které ji snižují na 160 MHz) způsobena tím, že oba vyšší modely využívají GDDR5 paměť?

Eric: Karty ATI Radeon HD 4870 s GDDR5 pamětí jsou vyladěny pro práci na vyšších frekvencích jádra a pamětí, aby mohly dosahovat vyšších výkonů. Výsledkem jsou jisté limitace (oproti HD 4850) co do možnosti snižovat svůj takt v nečinnosti. Pramení to z několika omezení, ale není to nic, co by bylo nevyhnutelně spjato s protokolem GDDR5. Pracujeme ale na rozšíření spektra taktovacích frekvencí u karet s GDDR5, abychom mohli snížit spotřebu při nízké zátěži, aniž bychom tím omezili maximální výkon. V současné době mají karty ATI Radeon HD 4870 „volnoběžnou“ spotřebu typickou pro výkonné modely.

Rage3D: Ještě na toto téma, odkud pramení rozdíl mezi HD 4870 a HD 4870 X2? X2 se v nečinnosti podtaktovává na 507/2000 MHz, ale jednočipová karta paměti vůbec nepodtaktovává. Přitom obě karty používají GDDR5, takže tím to asi nebude?

Eric: Pracuje se na GDDR5 s nižším taktem, takže to není omezení technologie GDDR5. Problém s jejich podtaktováním pod fyzických 500 MHz je, že musíte změnit způsob práce řadiče na takový, který se podobá práci s GDDR4. A to vyžaduje nějakou práci na softwaru. U Radeonu HD 4870 jsme se tím nezabývali, protože přednost měly jiné věci a karta už tak měla dobré tepelné charakteristiky a spotřebu. Zkrátka takovou, jakou byste od karty této výkonové třídy očekávali. U Radeonu HD 4870 X2 jsme se ale museli poprat vlastně se dvěma HD 4870 na jednom PCB a s gigabajtem paměti navíc, takže jsme implementovali agresivnější podtaktování. To samé bychom mohli udělat s jednočipovou kartou, ale momentálně to není na pořadu dne.

O R700 a CrossFire

R700 alias Radeon HD 4870 X2

Rage3D: Co je se sideportem pro CrossFire? Proč je deaktivován? Jsou pravdivá tvrzení, že záleží na výrobci, zda se rozhodne propojení na vlastní kartě vytvořit, a že se většina z nich patrně rozhodne tak neučinit?

Eric: Rozhraní sideport je u referenčních karet plně funkční. Přišli jsme ale na to, že při použití současné multi-GPU metody střídavého vykreslování snímků (AFR – alternate frame rendering) nenabízí sideport takovou propustnost, aby to zajistilo podstatný nárůst výkonu. Neustále ale pracujeme na optimalizaci škálování výkonu technologie ATI CrossFire™ a zkoušíme rozličné metody. Pokud v budoucnu nalezneme postup, který nabízí lepší výsledky při použití sideportu, můžeme se ještě rozhodnout jej znovu aktivovat.

Rage3D: A co se vlastně stalo? Jak dobrý nápad přestal být dobrým nápadem? Deaktivovali jste propojení kvůli problémům se spotřebou (teplem)?

Eric: Pořád je to dobrý nápad. Musíte si uvědomit, že CrossFire a AFR už postupně optimalizujeme několik let. Vlastně jsme se dostali do bodu, kdy je škálování už velmi dobré a je těžké dále vylepšit výkon. Spotřeba a teplo není problém, propojení je vlastně druhá PCIe 2.0 x16 sběrnice, to může spotřebovat maximálně pár wattů. Jediný důvod, proč není zapnutý, je ten, o kterém už jsem hovořil – nepřináší žádný výkon navíc, takže je prostě zbytečný.

Rage3D: Jaká data lze vlastně posílat prostřednictvím onoho propojení? Jedná se o cestu s rychlejším přenosem nebo nižší latencí pro přenos neobrazových dat (jako např. render targets), která je třeba kopírovat ze snímku n na snímek n+1 a tak dále – což se u klasického Crossfire děje pomocí peer-to-peer zápisu? Je to jedno z možných využití?

Pozn.: Peer-to-peer komunikace je funkce, kterou umožňují prakticky všechny dnešní PCI Express řadiče a severní můstky. Je to přenos dat mezi jednotlivými zařízeními na PCIe sběrnici, který nemusí řídit systémový procesor.

Eric: Propojení nabízí stejné funkce jako sběrnice PCIe a navíc umožňuje GPU zapisovat zároveň do vlastní paměti i do paměti druhého GPU. Přenášet a vyměňovat lze jakákoliv data vyžádaná ovladačem, prodleva není oproti PCIe propojení umístěnému přímo na X2 kartě výrazně odlišná, je ale rozhodně lepší než ta, které lze dosáhnout přenosem přes severní můstek (northbridge) čipsetu. Každopádně statické prodlevy, o nichž je tu řeč, nehrají tak velkou roli. Podstatná je datová propustnost.

Rage3D: Mohla by funkce broadcast write sloužit k zamezení posílání stálého render targetu přes PLX můstek? Takže namísto toho, aby GPU2 čekalo na GPU1, až na něm dokončí práci a zapíše do paměti druhého čipu přes peer write, GPU1 bude render target aktualizovat v pamětech obou čipů, aby GPU2 mohlo začít pracovat ihned?

Eric: Ano (dramatická pauza). To byl jeden z důvodů, proč tam tu funkci máme. Ale musíte mít na vědomí, že tohle nutně neznamená, že tenhle přístup by byl lepší než to, co normálně děláme u AFR.

Rage3D: Zvažujete použití rozsáhlejšího či granulárnějšího režimu SuperAA – například 2× anti-aliasing realizovaný pomocí dvou GPU, která vykreslují snímek bez AA a následného prolnutí obou snímků, 4× AA by pak mohlo být řešeno formou dvou GPU vykreslujících scénu s 2× AA apod. (tedy postup připomínající techniku akumulačního bufferu)?

Eric: Nebudu spekulovat o budoucích algoritmech které možná použijeme u multi-GPU systémů. Řekněme ale, že jsme přesvědčeni o tom, že v současné době nabízíme nejlepší kvalitu a výkon a máme do budoucna k dispozici mnoho dalších možností. U multi-GPU konfigurací již podporujeme SuperAA režim, nabízející vyšší kvalitu a větší počet vzorků.

Rage3D: Nabídnete alternativní způsoby škálování zátěže na více GPU, tedy kromě AFR (střídavého vykreslování snímků)?

Eric: Neustále vyhodnocujeme všechny naše algoritmy, včetně těch pro více GPU. V současné době k tomu ale nemohu říct nic bližšího, než že věříme, že multi-GPU je neodmyslitelnou součástí arsenálu AMD a že plánujeme jej nadále podporovat a zlepšovat.

Rage3D: Takže pořád považujete AFR za schůdnou cestu škálování na více než dvě GPU? To přináší vyšší inputlag a také předpokládá, že lze mít čtyři po sobě jdoucí snímky s nepříliš velkou vzájemnou závislostí, aby mohlo být dosaženo dobrého škálování.

Eric: To hodně záleží na okolnostech. Čím více je hra omezena výkonem GPU, třeba ve vysokých rozlišeních s AA a AF, tím více pocítíte přínos těchto řešení. Pokud chcete hrát ve 1280 × 1024 nebo 1600 × 1200, pak čtyři GPU nejsou úplně to, co potřebujete. Ale ve 2560 × 1600 opravdu pocítíte rozdíl. Takže ano, za těchto okolností AFR je schůdná cesta.

Rage3D: Jakou odezvu jste od vývojářů obdrželi ohledně optimalizace pro multi-GPU systémy v AFR režimu?

Eric: Odezva, kterou dostáváme, je docela pozitivní. Vývojáři začínají brát AFR v potaz, když začínají hru programovat, takže bych řekl, že v budoucnu se situace pro multi-GPU systémy bude zlepšovat.

Rage3D: Takže Crysis je spíše výjimkou? To je zrovna hra, která s AFR nefunguje moc dobře.

Eric: Nedokážu říct, co přesně Crysis dělá, na to bych se leda musel podívat na engine té hry. Ale CrossFire v ní škáluje docela dobře.

Rage3D: Se dvěma GPU. Dál už je to docela špatné.

Eric: Ano, se dvěma GPU. Jak jsem řekl, nemůžu to moc komentovat, když přesně nevím, co Crysis dělá. Ale zrovna u Crysis musíte brát v potaz, že to je velmi náročná aplikace pro celý systém, ne jenom GPU. Často je limitována procesorem, také využívá hodně operační paměti. Množství práce, díky které Crysis vypadá tak dobře a je náročný, je vcelku enormní. Je otázkou, zdali by Crysis mohl škálovat lépe, kdyby naši vývojáři ovladačů a tým developer relations spolupracoval s Crytekem. Podle mě je to možné, ale nejsem si jistý, jestli se Crytek ještě chce zabývat původním Crysis, myslím že už pracují výhradně na druhém dílu.

Rage3D: Co byste mohl říct k problému micro-stutteringu?

Pozn.: Micro-stuttering je zasekávání či cukání hry i při vysokém framerate, je způsoben velkým rozdílem mezi vykreslováním jednotlivých snímků a je obecně považován za problém multi-GPU systémů, v menší míře se ale může vyskytnout i u jednočipových řešení. Něco více o tomto jevu, jak se ho zbavit a o dalších jevech, se kterými je micro-stuttering někdy zaměňován, si můžete přečíst na našem fóru.

Eric: Micro-stuttering může mít různé příčiny. Například u našeho předchozího produktu, ATI Radeon HD 3870, bylo jednou z příčin časté snižování a zvyšování pracovní frekvence GPU při běhu hry. 3870 byl jedním z prvních modelů AMD, který nabídl programovatelný obvod umožňující ovládání spotřeby čipu pomocí frekvence a napětí. Grafický čip byl schopen detekovat, kdy jej aplikace nevyužívá naplno, a snížit svou frekvenci i spotřebu. Ukázalo se ale, že pokud byl při výpočtu určitého snímku příliš přetížen procesor počítače, zůstalo GPU nevytížené a snížilo svou frekvenci ve snaze ušetřit energii, přestože graficky náročná hra nadále běžela. Když došlo na výpočet další části snímku, byla frekvence grafického čipu již snížena a vykreslování se tak výrazně zpomalilo než ji řídící obvod opětně zvedl.

Toto přepínání frekvence sice ušetřilo energii, ale snížilo celkový výkon a způsobovalo micro-stuttering. V únoru/februári jsme vydali nové ovladače, které tento problém odstranily tím, že zabránily snižování frekvence dokud 3D aplikace neskončila. U Radeonu HD 4870 jsme změnili samotný řídící obvod tak, aby dokázal monitorovat čip z několika pohledů (tedy jak změny v zátěži při výpočtu jednoho snímku, tak dlouhodobé změny zátěže během několika snímků) a reguloval spotřebu v závislosti na nich. To nám umožnilo nabídnout u ATI Radeon HD 4870 plnohodnotné řízení spotřeby bez nežádoucího zadrhávání obrazu při změně frekvence.

Existují ale i jiné možné zdroje micro-stutteringu – například načítání dat z pamětí, během kterých může CPU nebo GPU čekat na dokončení přenosu, či velký rozdíl ve výkonu grafické karty a CPU (velmi rychlá grafika a pomalé CPU), kdy se může stát, že CPU po nějakou dobu nevypočítá žádné snímky a posléze dokončí dva rychle za sebou. V takovém případě dostaneme pro první snímek průměrný čas, který zahrnuje dobu prodlevy plus vykreslení, zatímco pro snímek 2 je to pouze vykreslení. Výsledkem je například snímek zobrazený 16 ms následovaný snímkem zobrazeným 1 ms, což může vypadat jako zadrhávání. V případě více GPU může být problém ještě zesílen, protože grafický akcelerátor potřebuje krmit daty ještě rychleji. Hledáme cesty, jak tyto problémy vyřešit, ale je těžké je všechny odstranit a zároveň zajistit maximální výkon.

Za poskytnutí překladu rozhovoru děkujeme společnosti AMD.