AMD Trinity a Handbrake: dvakrát rychlejší s OpenCL

16. 5. 2012

Sdílet

 Autor: Redakce

O připravované GPU akceleraci video enkodéru x264 jsme vás již informovali. Byť zatím nedošlo k oficiálnímu uvedení funkce, kód je již k dispozici pro testování (fórum Doom10.org). Redakce serveru AnandTech měla každopádně možnost otestovat předprodukční sestavení programu Handbrake na několika mobilních procesorech. Mezi nimi bylo i nově vydané APU Trinity, konkrétně model A10-4600M. V testu se ovšem objevil i čip A8-3500M, založený na starší architektuře Llano.

Logo programu x264

Jak procesory Sandy Bridge a Ivy
Bridge, tak nová APU Trinity v sobě nesou obvody vyhrazené
pro kódování videa. Ty jsou však konstruované na nízkou
spotřebu a navíc omezené nepružností hardwarového řešení.
Kvalita obrazu, které dosahují, je tak poněkud špatná. Zejména
to platí, pokud se nepoužije zrovna vysoký datový tok. Pokud je
tedy cílem kvalitní obraz, nezbývá než sáhnout po softwarových
enkodérech, mezi nimiž je x264 nekorunovaným králem. Naštěstí
pro Trinity, jehož procesorová část je relativně slabá, se i
tento program dočkal akcelerace přes OpenCL.

 Test kódování v Handbrake (x264) s OpenCL akcelerací (zdroj: AnandTech)

Jak vidíte z „výsledkové listiny“,
aktivování akcelerace skrze OpenCL v testu čipům AMD až
překvapivě výrazně pomohlo. Musíme sice mít na paměti, že
testovány byly různé verze enkodéru, nicméně více než
dvojnásobné zrychlení je vpravdě impozantní. Llano si z necelých
6 snímků za sekundu polepšilo na 12, Trinity pak ze 7 na celých
15. Oba čipy tak značně zkrátily náskok dražších mobilních
čtyřjader Ivy Bridge. Těm sice OpenCL také pomáhá, relativní
zrychlení je však mnohem menší. Důvodem je vedle slabší
grafiky nejspíše i to, že lookahead enkodéru a dekódování
vstupu jsou pro čip Intel menším soustem, takže jejich přenesení
na bedra grafiky neuvolní tolik cyklů CPU.

bitcoin_skoleni

Značné zrychlení jinak spíše
slabších procesorů je pozoruhodné. Podpora OpenCL, kterou AMD
sponzorovalo, tak dle všeho bude k většímu užitku, než jsem
osobně předpokládal. Stále ovšem platí, že při nejpomalejších
nastaveních enkodéru bude vliv akcelerace klesat, neboť spotřeba
cyklů CPU bude mnohem větší. Je také třeba vyzdvihnout
otevřenost technologie OpenCL, neboť kód napsaný s podporou AMD
je funkční i na grafikách konkurence, karty GeForce nevyjímaje. S použitím proprietární alternativy, jakou je Nvidia CUDA, by toto nebylo možné.

Zdroj: AnandTech