Nová generace čínských MIPS procesorů Loongson: 40nm čipy 3A-2000 a 3B-2000

5. 9. 2015

Sdílet

 Autor: Redakce

Jestli se zajímáte o alternativní procesorové architektury, pak patrně víte, že v Číně už dlouhé roky běží program vlastnoručně vyvinutých procesorů s architekturou MIPS, mající za cíl nezávislost komunistické země na západních technologiích. Procesory Loongson (dříve též Godson) ovšem nikdy neudělaly díru do světa. Po delší době o sobě ale jejich výrobce opět nechal vědět a odhalil novou generaci svých čipů, procesory Loongson-3A2000 a Loongson-3B2000. Tyto procesory by měly navazovat na předchozí generace procesorů Loongson 3A a 3B, které byly vyráběné 65nm procesem. Generace „2000“ přechází na 40nm výrobu a zároveň by měla mít přepracovanou či vylepšenou architekturu označenou GS464E (na stránkách výrobce je o ní k dispozici studie, je ale bohužel až na tabulky a další detaily jen v čínštině). Loongson-3A2000 je čtyřjádrová verze, která by mohla nalézt užití i v zařízeních pro spotřebitelský trh (PC, notebooky), Loongson-3B2000 je zdá se osmijádro, míněné spíše do serverů nebo síťové infrastruktury a pro víceprocesorové systémy.

Procesorové jádro GS464E (Loongson 3A-2000/3B-2000)
Procesorové jádro GS464E (Loongson 3A-2000/3B-2000)

Architektura GS464E v těchto procesorech je kompatibilní s 64bitovou instrukční sadou MIPS64 Release 3, má však mít vlastní rozšíření pro virtualizaci (LoongVM), vektorové výpočty (LoongSIMD s šířkou 128 a 256 bitů, tedy jako SSE a AVX) a instrukce LoongBT, které mají pomáhat při binárním překladu kódu. To pak s asistencí softwaru umožňuje (nenativní) běh programů napsaných pro architekturu x86 nebo ARM.

Schéma jádra GS464E (Loongson 3A-2000/3B-2000)
Schéma jádra GS464E (Loongson 3A-2000/3B-2000)

Architekturu GS464E je superskalární, ale vykonává instrukce stylem in-order, má devítistupňovou pipeline a stavěná je na zpracování čtyř instrukcí za takt („4-issue“). Za čtyřcestnými dekodéry by jádro mělo mít dvě ALU, dvě FPU a dvě jednotky pro load/store (AGU). Jádro by mělo mít 64+64 kB L1 cache pro data a instrukce a 256 KB L2 cache. Procesor má i sdílenou L3 cache, její kapacitu ale nikde uvedenou nevidím (u 65nm čipů to bylo 8 MB). Procesor by měl proti předchozím generacím mít podstatně rychlejší práci s pamětí, která měla velké rezervy (zrychlení některých operací má být podle studie i dvacetinásobné).

Loongsony nicméně v minulosti držely u země nízké dosahované frekvence, a zdá se, že ani architektura GS464E to příliš nezmění. Na 65 nm byl Loongson-3B schopen běžet na 1,0–1,50 GHz a zdá se, že 40nm proces strop o moc nezvedl – čekat tak lze snad nějakých 1,6-1,8 GHz. Konkrétní hodnoty jsem nenašel, ovšem výrobce prý hodlá příští rok uvést další generaci na 28nm procesu (Loongson-3A3000 a Loongson-3B3000), která má údajně takty posunout „blíž k hodnotě 2,0 GHz“. Z toho lze tedy asi hádat, že 40nm čipy budou posazené níž.

65nm Loongson 3A-1000 ve vývojářské desce
65nm Loongson 3A-1000 ve vývojářské desce (Zdroj: Michael Niedermayer)

Tyto procesory by se snad opět měly objevit v různých zařízeních prodávaných v Číně, asi ale nedospějí na západní trhy, kde pravděpodobně konkurenceschopné nebudou. Výjimky se sice občas stanou, i vzhledem k softwarové bariéře ale pochybuji, že bychom se třeba u nás někdy s těmito procesory setkali. V oblasti ne-x86 procesorů je totiž takový přetlak různých i velmi levných čipů ARM, že Loongsony asi mohou na západě nabídnout hlavně „exotiku“ a dobrodružství s provozem softwaru na okrajové platformě.

bitcoin školení listopad 24

65nm Loongson 3A-1000 ve vývojářské desce
65nm Loongson 3A-1000 ve vývojářské desce (Zdroj: Michael Niedermayer)

Zdroj: CNX Software, Michael Niedermayer (ilustrační foto)