Power6: 4,7 GHz pro nejrychlejší CPU světa

16. 9. 2007

Sdílet

 Autor: Redakce

Ač nám, běžným uživatelům, může připadat závod Intelu s AMD jakkoli fascinující a výkony těchto procesorů ve srovnání s předchozími lety úžasné, nejsou tyto firmy na procesorovém trhu zdaleka osamoceny a dokonce nemusí být autory těch nejrychlejších řešení.

Běžné počítače a notebooky používají (a asi dlouho budou používat) architekturu x86. Ta zaručuje zpětnou kompatibilitu až k legendárním CPU z IBM PC XT: Intel 8086 a 8088. To samé samozřejmě (a hlavně) platí pro programové vybavení. Za univerzálnost a zpětnou kompatibilitu platíte samozřejmě nějaké daně: nižší výkon pro mnoho typu výpočtů je daní na straně uživatele, omezené možnosti při návrhu na straně výrobce.

Jádro procesoru IBM Power6. Zdroj: IBM. Klepněte pro zvětšení

Wafer s procesory Power6. Zdroj: IBM. Klepněte pro zvětšení

Pro IBM nejsou procesory do osobních počítačů hlavním chlebem a současně firma platí za jednoho z největších (ne-li vůbec největšího) inovátorů v oblasti mikroprocesorů. Koncem května tak, držíc se přitom železné pravidelnosti při uvádění nových generací procesorů, představila IBM Power6.

Technologie „na triku“ IBM
Měď (září 1997) – většina odborníků považovala nahrazení hliníkových vodičů v čipech za nemožné, a to z mnoha technických důvodů. Tým IBM tyto technické problémy překonal a rychle dostal měděné vodiče do výroby, čímž se okamžitě zvýšila výkonnost čipů. Průkopnické techniky IBM jsou nyní průmyslovým standardem.
Křemík na izolantu (srpen 1998) - technologie křemíku na izolantu snižuje spotřebu energie a zvyšuje výkonnost tím, že pomáhá izolovat milióny tranzistorů v moderních čipech. Firmy v počítačovém průmyslu vyvíjely tuto technologii 15 let, než se to podařilo IBM.
Napnutý křemík (červen 2001) - tato technologie napíná materiál uvnitř čipů. Tím snižuje odpor a urychluje proudění elektronů skrz tranzistory, což přispívá k vyššímu výkonu a nižší spotřebě energie.
Dvoujádrové mikroprocesory (říjen 2001) - Power4, první dvoujádrový mikroprocesor na světě, byl oznámen jako součást serverů řady System p Regatta a ve své době byl nejvýkonnějším procesorem světa. Než se konkurentům podařilo dostat na trh jejich dvoujádrový čip, uplynuly více než dva roky – celá věčnost v technologickém byznysu.
Imerzní litografie (prosinec 2004) - IBM jako první společnost na světě začala používat tuto novou výrobní technologii, jejímž výsledkem jsou čipy s ještě menšími prvky, při produkci komerčních mikroprocesorů.
Zmražený čip SiGe (červen 2006) - v devadesátých letech minulého století začala IBM jako první používat kombinaci křemíku a germania náhradou za nákladnější a exotičtější materiály. Díky tomu se jí podařilo vyrábět menší, rychlejší a levnější čipy a začala je prodávat výrobcům bezdrátových zařízení, například mobilních telefonů nebo směrovačů. Loni IBM opět posunula meze technologie SiGe, když ve spolupráci s institutem Georgia Tech a s podporou NASA demonstrovala první křemíkový čip, který je schopen pracovat na frekvencích vyšších než 500 GHz. Dosáhla toho zmražením čipu téměř na absolutní nulu.
High-k (leden 2007) - IBM oznámila řešení jednoho z nejpalčivějších problémů počítačového průmyslu – tranzistorů, z nichž se rozptyluje proud. Pomocí nových materiálů vytváří IBM čipy s tzv. kovovou bránou s vysokou dielektrickou konstantou (high-k metal gate), jež budou jak výkonnější, tak menší a energeticky úspornější.
eDRAM (únor 2007) - nahrazením paměti SRAM inovativním novým typem rychlé paměti DRAM přímo na čipu mikroprocesoru se IBM podaří více než ztrojnásobit velikost zabudované paměti, což přispěje k výraznému zvýšení výkonu.
3D stohování čipů (duben 2007) - IBM oznámila vytvoření trojrozměrných čipů, které používají tzv. průchody skrz křemík (through-silicon vias). Díky tomu je možné stohovat polovodiče vertikálně nad sebou, místo aby byly kladeny horizontálně těsně vedle sebe. Délka kritických cest v obvodech se tak až tisíckrát zkrátí.
Vzduchové díry (květen 2007) - nanotechnologií samočinného sestavení vytvořila IBM vakuové izolanty (i přes absenci vzduchu nazývané vzduchové díry) mezi kilometry vodiče uvnitř mikroprocesoru založeného na architektuře Power. Tím se snížila nežádoucí kapacitní impedance a zlepšil jak výkon, tak energetická účinnost.
Zdroj: magazín The Blue Rose, IBM

Procesor Power6 je navržen tak, aby pracoval s frekvencí 4–5 GHz. Jeho interní architektura je vyrobena technologií 65 nm SOI (technologie „Silicon on Insulator“, tj. křemík na izolantu) celkem v deseti kovových vrstvách. Při porovnání s 90nm architekturou získá 30procentní navýšení výkonu s nižší spotřebou. Výroba polovodiče používá dual stress technologii, tj. vylepšenou formu polovodiče IBM Strained Silicon s litografií 65 nm.

Každý čip je dvoujádrový, integruje tedy dvě SMT jádra (jádra schopná zpracovávat souběžně více vláken jedním procesorovým jádrem) s vlastní vyrovnávací pamětí L2. U předchozích procesorů obě jádra L2 cache sdílela.

Blokové schéma procesoru IBM Power6. Zdroj: Power6 fórum (13. 9. 2007, Praha)

Parametry Power6 v kostce

  • dvoujádrový superskalární (7 cest) procesor
  • 9 prováděcích jednotek (2× LS, 2× FP, 2× FX, 1× BR, 1× VMX, 1× DFU)
  • 790 milionů tranzistorů
  • 65 nm, CMOS, SOI
  • podporuje SMP systémy až s 64 procesory
  • SMP spojení rychlejší než 45 GB/s
  • 2× 4 MB L2 cache v čipu
  • 32 MB L3 cache pro data (eDRAM) na ½ frekvence čipu
  • dva paměťové řadiče
  • p2p „Elastic“ rozhraní na čtyřnásobku frekvence DRAM
  • spotřeba v zátěži méně než 100 W
  • přepínání do/z úsporného režimu za běhu

Prvním strojem používající procesory Power6 se stal System p5 p570. IBM uvádí, že p570 je novou výkonnostní jedničkou v unixových benchmarcích SPECint2006, SPECfp2006, SPECjbb2006 a TPC-C. Aktuální výkonnostní výsledky p570 i konkurentů najdete vždy tady. Servery p570 by měly být dostupné v říjnu tohoto roku.

p570: čtyři 19palcové 4U racky. Zdroj: IBM. Klepněte pro zvětšení

V max. konfiguraci může p570 obsahovat až 16 procesorů Power6 a 768 GB paměti. Zdroj: IBM. Klepněte pro zvětšení

Servery p570 lze téměř libovolně konfigurovat. Každý stavební blok může obsahovat dva nebo čtyři procesory IBM Power6, 16–192 GB operační paměti a šest SAS disků. Maximální konfigurace nabízí výkon 16 procesorů Power6, 768 GB operační paměti a až 24 SAS disků (celková kapacita úložiště i s využitím I/O modulů může dosáhnout až 79,2 TB). Podrobnosti najdete zde.

Jediné jádro procesoru Power6 na 4,7 Ghz (15,53 GFLOPS) má vyšší výkon než 1,4tunový superpočítač Deep Blue (11,38 GFLOPS, ten obsahoval 30 uzlů systému RS/6000 obohaceného o 480 VLSI šachových čipů). Zdroj: Power6 fórum (13. 9. 2007, Praha)

Otestuje si výkon svého „superpočítače“ Pro měření superpočítačů se používá program Linpack, jehož zdrojové kódy na internetu snadno najdete. Můžete si však ještě jednodušeji zkusit změžit výkon vlastního počítače (procesoru) v javové verzi Linpacku. Zkuste stránku www.netlib.org/benchmark/linpackjava a získáte představu o výkonu Power6 (přes 31 GFLOPS)

Pro lepší představu o výkonu Power6 uvádíme aktuální tabulku TOP 20 superpočítačů světa (zdroj: Top500.org). Rmax a Rpeak znamenají maximální a špičkový výkon v Linpacku. Jednotkou jsou GFLOPS. V jiném sloupci je počet procesorů těchto superpočítačů – schválně si zkuste spočítat, kolik GFLOPS připadá na jeden procesor:

Pořadí Umístění Počítač Procesorů Rok Rmax Rpeak
1 DOE/NNSA/LLNL
United States
BlueGene/L - eServer Blue Gene Solution
IBM
131072 2005 280600 367000
2 Oak Ridge National Laboratory
USA
Jaguar - Cray XT4/XT3
Cray Inc.
23016 2006 101700 119350
3 NNSA/Sandia National Laboratories
USA
Red Storm - Sandia/ Cray Red Storm, Opteron 2.4 GHz dual core
Cray Inc.
26544 2006 101400 127411
4 IBM Thomas J. Watson Research Center
USA
BGW - eServer Blue Gene Solution
IBM
40960 2005 91290 114688
5 Stony Brook/BNL, New York Center for Computional Sciences
USA
New York Blue - eServer Blue Gene Solution
IBM
36864 2007 82161 103219
6 DOE/NNSA/LLNL
USA
ASC Purple - eServer pSeries p5 575 1.9 GHz
IBM
12208 2006 75760 92781
7 Rensselaer Polytechnic Institute, Computional Center for Nanotechnology Innovations
USA
eServer Blue Gene Solution
IBM
32768 2007 73032 91750
8 NCSA
USA
Abe - PowerEdge 1955, 2.33 GHz, Infiniband
Dell
9600 2007 62680 89587.2
9 Barcelona Supercomputing Center
Španělsko
MareNostrum - BladeCenter JS21 Cluster, PPC 970, 2.3 GHz, Myrinet
IBM
10240 2006 62630 94208
10 Leibniz Rechenzentrum
Německo
HLRB-II - Altix 4700 1.6 GHz
SGI
9728 2007 56520 62259.2
11 NNSA/Sandia National Laboratories
USA
Thunderbird - PowerEdge 1850, 3.6 GHz, Infiniband
Dell
9024 2006 53000 64972.8
12 Commissariat a l'Energie Atomique (CEA)
Francie
Tera-10 - NovaScale 5160, Itanium2 1.6 GHz, Quadrics
Bull SA
9968 2006 52840 63795.2
13 NASA/Ames Research Center/NAS
USA
Columbia - SGI Altix 1.5 GHz, Voltaire Infiniband
SGI
10160 2004 51870 60960
14 GSIC Center, Tokyo Institute of Technology
Japonsko
TSUBAME Grid Cluster - Sun Fire x4600 Cluster, Opteron 2.4/2.6 GHz and ClearSpeed Accelerator, Infiniband
NEC/Sun
11088 2006 48880 78796.8
15 Texas Advanced Computing Center/Univ. of Texas
USA
Lonestar - PowerEdge 1955, 2.66 GHz, Infiniband
Dell
5848 2007 46730 62220
16 Maui High-Performance Computing Center (MHPCC)
USA
Jaws - PowerEdge 1955, 3.0 GHz, Infiniband
Dell
5200 2006 42390 62400
17 US Army Research Laboratory (ARL)
USA
Michael J. Muuss Cluster (MJM) - Evolocity II (LS Supersystem) Xeon 51xx 3.0 GHz IB
Linux Networx
4416 2007 40610 52992
18 Forschungszentrum Juelich (FZJ)
Německo
JUBL - eServer Blue Gene Solution
IBM
16384 2006 37330 45875
19 Lawrence Livermore National Laboratory
USA
Appro Xtreme Server - Quad Opteron Dual Core 2.4GHz Infiniband
Appro International
9216 2007 36580 44240
20 The Earth Simulator Center
Japonsko
Earth-Simulator
NEC
5120 2002 35860 40960

Jan Klockow se na Power6 fóru v Praze chystá detailně popsat architekturu procesoru Power6

Videa o procesoru Power6 najdete přímo na české stránce IBM.

bitcoin_skoleni

* ... laskavý čtenář snad odpustí, že jsem si v perexu vypůjčil atraktivní větu uváděnou přímo výrobcem