Co přinese architektura AMD Jaguar – následovník úsporných APU Bobcat

30. 8. 2012

Sdílet

 Autor: Redakce

Na konferenci Hot Chips 2012 prezentovala společnost AMD vedle „dospělé“ architektury Steamroller i nadcházející architekturu Jaguar. Ta je určena do úsporných APU pro levné notebooky a desktopy, tablety či jiná mobilní zařízení. V těch nahradí stávající čipy Brazos (případně Brazos 2.0), založené na architektuře Bobcat.

Jak už jsme tušili z roadmap, které AMD ukázalo v červnu, nová APU budou obsahovat čtyři procesorová jádra. Potvrzují se také informace, že Jaguar bude podporovat prakticky všechna moderní rozšíření instrukční sady. To znamená podporu veškerých variant SSE až po SSE4.2 a AVX; dále instrukce CLMUL, AES-NI, BMI1 a FC16 (převody čísel v plovoucí řádové čárce s poloviční přesností), XSAVE a XSAVEOPT (instrukce urychlující přepínání procesů) a MOVBE. Poslední instrukci zatím obsahovaly jen procesory Atom, AMD ji však možná začlenilo, aby byl procesor se svým konkurentem maximálně kompatibilní.

Architektura AMD Jaguar, Hot Chips 2012

Jaguar bude schopen adresovat větší množství paměti (40bitové adresy místo 36bitových v Bobcatu), teoreticky až 1 TB. AMD neuvedlo, zda paměťový řadič zůstane jednokanálový, Charlie Demerjian ze serveru SemiAccurate ale tvrdí, že je tomu bohužel tak (což bude vadit hlavně integrované grafice).

Nově bude procesor mít sdílenou 16-cestně asociativní L2 cache – čtyři jádra se podělí o 2 MB. Tato mezipaměť bude inklusivní; to znamená, že bude obsahovat kopii dat v mezipamětích první úrovně všech jader. Procesory si tak nebudou muset „lézt“ do L1 cache (která zřejmě zůstává na 32 KB pro data a 32KB pro instrukce), což čip zjednoduší a zřejmě i sníží spotřebu. Pro nižší spotřebu se také L2 cache dokáže zpomalovat na poloviční frekvenci. Každé jádro má do L2 cache vlastní vyhrazené rozhraní, na každé jádro také připadá jedna přednačítací jednotka.

Architektura AMD Jaguar, Hot Chips 2012

Architektura AMD Jaguar, Hot Chips 2012

Samotné jádro je evolucí Bobcatu. Stále zpracovává dvě instrukce za takt (obsahuje dvě ALU a dvě AGU). Instrukční buffer byl ale zvětšen a posílen byl i plánovač, který pracuje s větším množstvím instrukcí naráz, takže dokáže efektivněji využít kapacitu výpočetních jednotek. Pipeline procesoru byla prohloubena o jeden stupeň, což by mělo procesoru o něco zvýšit (poměrně nevysoký) frekvenční strop. Jaguar bude údajně obsahovat děličku převzatou z jádra Husky (APU Llano), která je dvakrát rychlejší, než ta v Bobcatu. O něco rychlejší mají být i další komplexní matematické operace.

Vedle instrukční cache budou mít jádra k dispozici také malý (32 B) instrukční buffer (Instruction Cache loop buffer), který pomůže při provádění smyček v programu. Pokud opakující se kód není příliš rozsáhlý, může ho procesor číst přímo z tohoto zásobníku a ušetřit tak energii.

Architektura AMD Jaguar, Hot Chips 2012

Architektura AMD Jaguar, Hot Chips 2012

Zásadní změnou v Jaguaru je přepracovaná jednotka FPU. Zatímco Bobcat měl jednotku o šířce 64 bitů, Jaguar bude mít se 128 bity dvojnásobnou kapacitu. Zatímco starší čip musel všechny instrukce SIMD rozkládat na dva 64bitové vektory a zpracovávat obě půle zvlášť, Jaguar vše provede najednou. Multimediální kód (či jiné úlohy používající SIMD) by tedy měl být značně rychlejší. V praxi by se mělo jednat o podobné zrychlení, jaké nastalo mezi architekturami K8 a K10 (druhá zmíněná také zdvojnásobila šířku jednotky FPU). Pochopitelně budou posíleny také datové cesty, které nyní potřebují dvojnásobnou kapacitu.

Instrukce ze série rozšíření SSE nyní tedy jedou na plný výkon. Novinka AVX ale kvůli své dvojnásobné šířce (vektor má 256 bitů) bude muset používat stejný postup jako dříve Bobcat, tedy rozpůlení do dvou operací o šířce 128 bitů. Tuto metodu nicméně používá i Bulldozer. Zejména za stavu, kdy toto instrukční rozšíření není příliš široce používáno, jde přes nižší výkon o metodu ekonomičtější.

Architektura AMD Jaguar, Hot Chips 2012

Jaguar také přinese vylepšený power gating. Až 98,8 % čipu lze údajně odpojit od napájení (u Bobcatu uvádí AMD jen 91,8% podíl). Jednotlivá jádra lze přitom odpojovat nezávisle na sobě. Na jednu stranu jsou tato vylepšení nutná kvůli vyššímu počtu jader, teoreticky by ale také měla přinést snížení klidové spotřeby (a tedy delší výdrž na akumulátor). Co se týče výkonu nových jader, je třeba samozřejmě počkat na regulérní testy, nicméně odhad AMD hovoří o 15% nárůstu IPC (tedy výkonu na takt). Zároveň by Jaguar měl dosahovat mírně vyšších frekvencí, a to asi o 10 %. Vzhledem k tomu, že nejrychlejší Bobcat (čip E2-2000) běží na 1,75 GHz, lze čekat maximální frekvence těsně pod 2 GHz.

 

bitcoin_skoleni

Z nízkých frkevencí je asi jasné, že architektura Jaguar nemůže nahradit „velké“ čipy jako je Bulldozer (o čemž občas někteří lidé spekulují). V segmentu nejlevnějších (zejména mobilních) procesorů by si však mohl vést docela dobře. Zejména přihlédneme-li k tomu, že Bobcat je mezi výrobci notebooků docela populární (možná až příliš, mnoha modelům by slušelo spíše Llano nebo Trinity). Dle určitých zmínek ze začátku roku by přitom výroba 28nm APU s tímto jádrem mohla odstartovat již v závěru roku. Na trhu by se tak Jaguar možná mohl objevit už někdy na jaře.

Zdroje: SemiAccurate (1, 2), Planet 3Dnow!