AMD uvádí APU Carrizo, slibuje skok ve výkonu a efektivitě [Computex]

3. 6. 2015

Sdílet

 Autor: Redakce

O APU Carrizo jsme během uplynulých měsíců už mnohokrát zavadili. AMD jej předběžně oznámilo v listopadu, pak se provalilo, že se vyhne desktopu a zamíří jen do notebooků. AMD už také odhalilo některé úsporné triky, které při jeho výrobě a návrhu použilo, aby kompenzovalo fakt, že je stále vyráběné 28nm procesem. Nyní se toto APU s novou architekturou Excavator a také s plně integrovanou čipovou sadou konečně dočkalo definitivního uvedení na trh.

Vzorek APU Carrizo
Vzorek APU Carrizo

V hrubých rysech se Carrizo příliš neliší od APU Kaveri, jehož notebookové modely uvedlo AMD před rokem: má čtyři procesorová jádra a GPU s 512 stream procesory, které je živené dvoukanálovým řadičem pamětí DDR3 s taktem do 2133 MHz. Nicméně pod povrchem je změn mnoho. Jak už bylo řečeno, má přímo na čipu plně integrovány funkce čipové sady a je tedy čistým SoC, což bude mít velké dopady na výdrž na baterii. CPU má vylepšenou architekturu Excavator a též grafika povýšila na třetí generaci GCN. S ní Carrizo dostalo i pokročilou delta kompresi, takže ačkoliv rychlost pamětí je stejná, stoupla efektivní propustnost, která grafiku Kaveri držela při zemi. Po stránce multimédií je zase nová podpora dekódování 4K a HEVC.

 

Bagr je účinnější stroj než válec

Nyní se podrobněji podíváme na to, co je v Carrizu vylepšené, a začneme u procesorové části, jader Excavator. Už z prezentace na ISSSC 2015 víme, že díky použití technik HDL se podařilo modulům značně snížit plochu (Carrizo má o 29 % více tranzistorů než Kaveri, ale prakticky stejné rozměry čipu) a také spotřebu, byť za cenu snížených maximálních taktů. Excavator je podle AMD optimalizován pro ULV procesory s celkovým TDP 15 W, v nichž díky různým vylepšením efektivity zaznamenává největší pokroky proti architektuře Steamroller. Na 15 W s ním Carrizo údajně může mít až o 39 % vyšší takt než Kaveri, což spolu se zlepšeným IPC vede k podstatně vyššímu výkonu v jednovláknové, ale i ve vícevláknové zátěži.

Na slajdech AMD uvádí, že v testu Cinebench se vícevláknový výkon při spotřebě 15 W zvýšil o 55 % a jednovláknový o 40 %. Při 35W TDP už nebudou pokroky proti Kaveri tak vysoké, při této spotřebě už Excavator naráží na limity svých taktů, kvůli nimž nemůže mít tak vysoké jednovláknové turbo jako Steamroller. Přesto by 35W Carrizo mělo mít o zhruba 12 % lepší jednovláknový a 16 % lepší vícevláknový výkon v tomtéž benchmarku (Excavator v něm údajně má o 9–13 % lepší IPC).

Dle údajů AMD by Excavator coby poslední generace CPU vyházející z Bulldozeru měl mít zhruba o 4–15 % lepší IPC ve srovnání se Steamrollerem. Stojí za tím dílčí změny v jádrech, mezi nimiž nejdůležitější se udály v cache. L1 pro data má větší kapacitu (32 místo 16 KB na jádro) a zejména osmicestnou asociativitu místo dřívější čtyřcestné. Údajně se to podařilo bez zhoršení latence a CPU má také vylepšený prefetch. Tato část tedy byla významně posílena a „hit rate“ L1 cache by měl být podstatně vyšší. Umožněno je to údajně použitím HDL, které dovolilo těmto strukturám dát více tranzistorů a zároveň je udržet blízko bloků, které s nimi musí úzce komunikovat.

Silnější by Excavator měl být také ve veledůležité predikci větvení, Branch Target Buffer má místo 512 kapacitu 768 záznamů. Další změnou má být například rychlejší „flush“ dat ze sdílené jednotky FPU/SIMD. Na druhou stranu se šetřilo na L2 cache, která byla zmenšena na 1 MB pro každý modul (čtyřjádro má tedy celkem 2 MB).

 

Excavator také přináší zlepšení klidové spotřeby pomocí různých úsporných režimů, podobně jako tomu bylo u Haswellu. Carrizo by mělo dostat režim snížené spotřeby S0i3, při němž je čip stále v pohotovosti, ale má spotřebu srovnatelnou se stavem spánku (S3). Údajně i nižší než 50 mW.

AMD také uvádí, že se výrazně zlepšila klidová spotřeba platformy při běžné práci s PC (k čemuž přispělo i odbourání externího jižního můstku). Zatímco referenční platforma pro Kaveri s LCD, pamětí a zbytkem komponent odebírala 4,5 W, u Carriza se podíl APU a čipsetu zmenšil o víc jak 50 %, takže spolu se zbytkem desky, RAM a displejem se spotřeba snížila na 2,7 W. Carrizo by též mělo podporovat režim InstantGo ve Windows. 

S Haswellem bude mít Excavator jinak ještě jednu společnou věc: jedná se o první CPU od AMD, které bude podporovat instrukce AVX2, tedy 256bitové celočíselné SIMD. Tato podpora ale asi bude realizována stávající 128bitovou FPU. Nečekal bych od ní proto nějaká velká vylepšení výkonu (bude ale zajímavé vidět, jak se projeví například v aktuálních sestaveních x265). Cenu to však bude mít kvůli kompatibilitě s budoucími aplikacemi, které třeba již nebudou mít optimalizace pro SSE–SSE4, ale jen AVX/AVX2. Z dalších nových instrukcí má Excavator dostat také už méně významné BMI2, SMEP, MOVBE (pro konverzi endianity) a RDRAND (hardwarové generování náhodných čísel).


Snímek čipu Carrizo. Vlevo GPU, vpravo moduly CPU, řadič pamětí a čipset

Bagr je účinnější stroj než válec

Grafika: GCN třetí generace nadopovaná HDL a delta kompresí

Rovněž při vývoji grafického jádra čipů Carrizo se AMD zaměřilo hlavně na spotřebu (z níž ale v mobilním segmentu obratem vyplývá výkon). Také zde bylo prý vše zoptimalizováno s ohledem na 15W TDP celého APU. Zatímco celkový počet stream procesorů (512, 8 CU) se nezměnil, u Kaveri měly ULV modely jen 384 aktivních jednotek. Vylepšení v Carrizu umožnila použít plných 512 shaderů i v některých 15W modelech, takže jejich grafický výkon bude moci adekvátně narůst.

Architektura GPU je v Carrizu na stejné úrovni, jako u GPU Tonga (Radeon R9 285), jde tedy o třetí generaci GCN. APU bude jako všechny Radeony na bázi GCN podporovat DirectX 12. Má ale též splňovat všechny požadavky specifikace HSA 1.0 pro GPGPU výpočty – píšeme „má“, jelikož vývoj HSA stále pokračuje. AMD ale očekává, že až bude ratifikována finální verze, nemělo by Carrizo mít žádné problémy získat proti ní certifikaci. Pro APU to znamená například, že jak cache v CPU, tak cache v CPU jsou plně koherentní.

Z Tongy přešly do Carriza vylepšení jako zvýšený výkon v teselaci, novější instrukce a vyšší efektivita; naopak počet Render Backends zůstal na dvou. Snad nejdůležitější novinkou by ale mohla být bezeztrátová delta komprese barev. Ta šetří provoz po paměťové sběrnici, neboť GPU čte a ukládá data komprimovaná. U APU odkázaných na 128bitovou paměť DDR3 o efektivním taktu jen 2133 MHz je přitom propustnost RAM asi nejzávažnějším úzkým hrdlem výkonu. S delta kompresí se efektivní přenosová kapacita při stejné teoretické propustnosti navýší, a APU tak bude moci dosáhnout vyššího herního výkonu (údajně o nějakých 5–7 %).

Dle AND má integrovaná grafika mít teoretický aritmetický výkon až 819 GFLOPS, což platí pro takt 800 MHz a 512 stream procesorů. To je velmi vysoká hodnota, když uvážíme, že APU Kaveri pro desktop bylo loni uvedeno s taktem GPU 720 MHz. Toto zlepšení jde na margo HDL a nižší spotřebě, údajně ale také APU přiděluje grafice větší díl dostupného TDP a je asi třeba upozornit, že onen takt je maximální. Při zatížení se tedy podobně jako v případě PowerTune u samostatných Radeonů budete pohybovat i na nižších hodnotách.

AMD uvádí, že v 15W kategorii má Carrizo mít až o 65 % lepší skóre v 3DMarku11, z čehož 20 % dělá oněch 512 shaderů místo 384, 18 % vyšší frekvence umožněná HDL a 10 % pak přidá vyšší efektivita architektury. Při 35W provozu už to tak slavné nebude, druhé dva faktory se ale stále projevují zhruba o 17 % lepším výkonem oproti Kaveri.

Jako u starších APU, také Carrizo bude podporovat spárování se samostatným Radeonem do hybridního CrossFire. V rámci optimalizací nicméně AMD zeštíhlilo řadič PCI Express 3.0 v procesoru, místo 16 linek jich má jen osm. To by ale při uvažovaných výkonech nemělo dedikovaná GPU brzdit.

APU Carrizo: Podporované kombinace grafik pro CrossFire
APU Carrizo: Podporované kombinace grafik pro CrossFire

Podle webu AnandTech velká část demonstračních notebooků, které výrobci novinářům neveřejně předvedli, samostatnou grafiku neobsahovala, což je dle mého názoru pro notebook s APU lepší volba. Ušetřené prostředky mohou jít například do rychlejší RAM, která zajistí, aby měl dost výkonu integrovaný Radeon. Nicméně například Acer E5-552G-F3VZ, který se s APU Carrizo už objevil v obchodech, dedikovanou grafiku má (Radeon R7 M360).


Benchmarky poskytnuté AMD. Poslední graf ukazuje výkon při TDP 35 a 15 W

Multimédia a další přívěsky

Velký důraz klade AMD na nově přidaný hardwarový dekodér formátu HEVC – uvádí ho dokonce jako jednu z nejstěžejnějších výhod Carriza. Ten je implementován plně v speciálním bloku UVD. AMD se chlubí tím, že má v notebookovém procesoru hardwarový dekodér jako první a má pravdu – čipy Broadwell a Haswell od Intelu totiž k akceleraci používají GPU přes OpenCL. To sice odlehčí CPU a umožní tak přehrát náročnější videa než jen čistě softwarovým dekodérem, efektivní z hlediska spotřeby, hluku a tepla to ale není. Zde by tedy AMD mělo mít výhodu: větrák by při přehrávání nějakého náročného filmu v HEVC měl méně funět a baterie vydrží déle.

Co se dalších formátů týče, přehrává blok UVD hardwarově H.264, MJPEG (obojí v 4K), VC-1/WMV9, MPEG-2, MPEG-4 (DivX/XviD) a také H.264 MVC. Co chybí, je formát VP9, používaný na Youtube. Na rozdíl od standardizovaného HEVC jde ale do jisté míry o „trucpodnik“ Googlu, takže svým způsobem lze tento krok chápat. Ovšem konkurence s akcelerací VP9 počítá (i když současné Intely ji také mají řešenou přes OpenCL).

Kapacita dekodéru byla posílena až na čtyřnásobek, UVD v Carrizu má zvládat H.264 video v rozlišení 4K při 60 snímcích za vteřinu. Pro HEVC ale rozlišení uvedeno není a také zatím nemáme informaci, zda je podporován profil Main 10, nebo jen Main. Podpora HEVC by ale měla být například ve Windows Media Playeru. Vyšší kapacita také pomůže spotřebě, pokud se přehrává nižší rozlišení jako 720p nebo 1080p. Dekodér pak totiž práci provádí v krátkých dávkách, mezi nimiž se UVD může na delší čas uspat a šetřit energii.

Proti Kaveri mají notebooky s Carrizem na akumulátor přehrávat video podstatně déle: 1080p HEVC (10 Mb/s) díky hardwarovému dekodéru vydrží přehrávat 300 minut proti 112 minutám s použitím CPU u Kaveri. I hardwarové přehrávání H.264 se zlepšilo – testovací klip Big Buck Bunny dokázal systém s Carrizem přehrávat 8,3 hodiny, zatímco Kaveri jen 3,3 hodiny. Obě platformy při těchto testech měly 50Wh baterii.

 

Carrizo má pro delší výdrž optimalizováno i zobrazení dekódovaného videa. Tento zlepšovák spočívá v implementaci škálovače obrazu přímo ve výstupním modulu, takže dekodér posílá svůj výstup přímo do něj (AMD to nazývá „underlay“), kde dojde k potřebnému zmenšení nebo zvětšení. Po staru musely být snímky přesouvány z UVD do paměti RAM, aby je škálovalo GPU, výsledek zapisovalo zpět do RAM a poté šly teprve do výstupního modulu, což vše spotřebovávalo energii navíc. Nový postup šetří elektřinu tím, že neprobouzí GPU a do paměti jdou data jen jednou.

Kromě dekodérů UVD a enkodérů VCE 3.1 (dvou; brzy by je mimochodem měla začít podporovat aplikace Handbrake a možná i FFmpeg) má Carrizo nadále také zvukový koprocesor AMD TrueAudio. Na čipu je také bezpečnostní korpocesor PSP (Platform Security Processor, jinak též AMD Secure Processor). Jde o implementaci technologie ARM TrustZone, používající integrovaný Cortex-A5 s vyhrazenou ROM a SRAM. Může sloužit například k zajištění DRM, Trusted Computingu nebo jiného bezpečnostního prostředí, ale také pro hlídání Secure Bootu nebo obecnou kryptografii. Má totiž integrovány akcelerátory RSA, SHA, ECC, AES a také dekompresi Zip. PSP také obsahuje hardwarový generátor náhodných čísel, z něhož čerpá entropii instrukce RDRAND.

Modely: jedno FX, jedno A10, jedno A8. TDP si doplňte

Všechny verze APU Carrizo budou vyráběny v pouzdře BGA (označeném FP4), které se pájí přímo na desku. V minulosti jsme byli zvyklí, že existovaly víceméně dvě kategorie spotřeby: ULV čipy s TDP circa 15–19 W a pak silnější a méně úsporné procesory s TDP 35 W. U Carriza udělalo AMD velkou změnu: uvádí v podstatě jen nativně 15W modely (jak už víme, jde o SoC, tedy čipset je „v ceně“). 35W verze nebudou, AMD však u procesorů má nastavitelné TDP, jímž se z nich tyto výkonnější modely dají vyrobit. Výrobce notebooku jim prostě nastaví TDP na 35 W, čímž se otevře prostor pro agresivnější a častější použití turba na CPU a vyšší takty na GPU.

Správa spotřeby by se pak už sama měla postarat o to, by výkon adekvátně stoupl. TDP by zdá se mělo být možné i snížit na 12 W, čímž se použitelné takty a výkon naopak omezí. Problém je, že kvůli tomu nebude jasné, jaký výkon můžete očekávat od notebooku s daným APU, dokud někde nezjistíte nastavení jeho spotřeby. Doufejme, že tato informace nebude příliš tajena; na druhou stranu, v dnešní době se i v táboře Intelu používají hlavně 15W čipy (byť existují i 28W modely řady U). Je tedy dost pravděpodobné, že většinou se setkáte s Carrizem běžícím v 15W režimu.

Čímž se dostáváme ke konkrétním modelům, které budou pro tuto chvíli toliko tři. Vršek nabídky bude tvořit FX-8800P. Toto nejvýkonnější Carrizo ponese grafiku Radeon R7 s 512 stream procesory na taktu až 800 MHz. Jeho CPU má čtyři jádra Excavator na základním taktu 2,1 GHz, s turbem ale může jít až na 3,4 GHz. Jak ale již bylo řečeno, takty pod zátěží se budou dramaticky měnit podle toho, kam bude TDP nastaveno. Pro srovnání: v generaci Kaveri mělo 19W FX-7500 základní takt také 2,1 GHz, 35W FX-7600P ovšem mělo vyšší maximální takt 3,6 GHz (ale s nižším IPC). K tomu je ale ještě třeba přičíst spotřebu čipové sady. Grafika čipů Kaveri měla v 35W modelu FX 512 shaderů na 600–686 MHz, u 19W modelu se ale zmohla jen na 496–553 MHz a 384 shaderů.

 

Také zbylé dva modely budou čtyřjádrové, ovšem již jen s grafikou Radeon R6 o 384 stream procesorech. Model A10-8700P bude mít frekvenci GPU stále 800 MHz; takt CPU je 1,8 GHz v základu a 3,2 GHz při maximálním turbu. Pod ním pak bude A8-8600P: to má Radeon R6 na 720 MHz, a CPU s takty nižšími o 200 MHz (1,6 – 3,0 GHz). Všechna tato APU mají TDP nastavitelné od 12 do 35 W a podporují paměti DDR3 s taktem až 2133 MHz. Ten je ale dostupný jen při nastavení TDP na 35 W, při 15W režimu je údajně používána jen frekvence 1600 MHz, patrně kvůli spotřebě.

Podle informací na webu AMD budou kromě parametrů mezi FX, A10 a A8 také určité rozdíly ve výbavě. Stejně jako u Kaveri, pouze čipy A10 a FX budou mít aktivní TrueAudio a Eyefinity. AMD také uvádí podporu pro CrossFire režim DirectX 12 Explicit Multiadapter pouze pro model FX-8800P. To je ale samozřejmě relavantní jen v kombinaci s diskrétní grafikou.

 

Notebooky určené pro APU Carrizo byste jinak mohli potkat také ve variantě s procesory Carrizo-L, které AMD oznámilo minulý měsíc. To jsou APU se stejným pouzdrem FP4 a mohou tedy být osazena do stejné desky, jedná se ale o úplně jiný čip, podle dostupných informací jde v podstatě o refresh APU Mullins/Beema.

 

ICTS24

Tímto se tedy teoretické povídání o Carrizu uzavírá. Není asi třeba dodávat, že úspěch čipu bude záviset na tom, zda jej výrobci notebooků (případně minipočítačů, all-in-onů a podobných věcí) použijí ve svých produktech a dají si také tu práci je nabízet zákazníkům. Těžko zatím říci, zda se na trh dostane slušný výběr notebooků s Carrizem (u Kaveri se to spíš nestalo), podle AMD ale chystají své příspěvky největší výrobci jako HP, Toshiba, Dell, Acer, Asus a Lenovo.

Zdroje: AMD, AnandTech