AMD už prodává APU Kabini výrobcům počítačů, manuál k výkonu Jaguaru je venku

22. 4. 2013

Sdílet

 Autor: Redakce

Jak jste mohli zaregistrovat ve finančních výsledcích AMD za první čtvrtletí, firma se stále nachází v neveselé situaci a nutně potřebuje nalézt nová odbytiště pro své výrobky. Jednou z nadějí, kterou v tomto směru má, je 28nm APU Kabini, určené pro úsporná a levná zařízení, zejména notebooky a netbooky. Zdá se, že tento čip je na dobré cestě, firma ho totiž dle svých představitelů již začala prodávat klientům z řad výrobců počítačů.

Dodávky těchto APU s grafickou architekturou GCN a procesorovými jádry Jaguar započaly již v prvním kvartále. Žádná konkrétní čísla o jejich objemu nepadla, šéf AMD Rory Read se omezil na mlhavý výrok o „silném portfoliu“ levných přístrojů, které na těchto procesorech budou založeny. Údajně mají perspektivu k velkému objemu prodajů, nicméně v tomto ohledu bude mít poslední slovo až vrtkavá přízeň trhu. Kdy přesně se například notebooky s APU Kabini objeví na pultech obchodů, je však nejasné. Mnohým výrobcům to možná bude od na oficiálního uvedení čipů samotných někdy v tomto čtvrtletí ještě dlouho trvat. AMD by údajně Kabini rádo vidělo jako konkurenci pro řady Pentium a Core i3 od Intelu.

Z prohlášení lze naopak vyčíst, že v prvním kvartále AMD nestihlo začít dodávat úspornější 28nm APU Temash (na obrázku) pro tablety a podobná, v současné době módní a lukrativní zařízení. Výrobu tohoto čipu, jehož snížené TDP by mělo umožnit i provoz bez aktivního chlazení, však prý AMD v současnosti již také rozjíždí.

Vzorek APU Temash

Kabini (a jádro Jaguar) se pomalu mění v hmatatelnou realitu. Na světě jsou benchmarky vzorku čtyřjádrové verze (zřejmě na frekvenci 2 GHz), jde však o čísla z Unix Benchmarku, která zřejmě příliš nenapoví o aplikačním výkonu (nemluvě už o platformě Windows). AMD samo však výkon architektury odhalilo nepřímo, a to zveřejněním manuálu s informacemi pro optimalizování softwaru právě na architekturu Jaguar.

Součástí manuálu je i tabulka uvádějící, kolikrát lze danou instrukci vykonávat paralelně a jakou latenci má (tedy kolik cyklů si počkáte na výsledek). Čísla vypadají poměrně nadějně, například většina SIMD instrukcí pro práci s celými čísly (které jsou důležité pro multimediální úlohy) je hotová za jeden takt a mnohé lze provést po dvou najednou (Jaguar je stavěn na zpracování dvou instrukcí za takt, má dvě ALU a dvě FPU). Instrukce AVX s 256bitovou šířkou musí Jaguar dekódovat do dvou a více operací, nicméně vzhledem k přítomnosti dvou FPU lze mnohé stále zpracovávat rychlostí jedna za takt.

 

bitcoin_skoleni

Latence a propustnost instrukcí pochopitelně o výkonu nepodávají kompletní obrázek. Nicméně manuál naznačuje, že by Jaguar mohl mít docela slušný výkon měřeno na instrukce zpracované za takt (IPC). Pokud jste programátoři a ručně optimalizujete kód (či jste prostě zvědaví), naleznete manuál zde.

Zdroje: X-bit labs, Real World Technologies (fórum)