Po dlouhé době, kdy lokálně vyvinuté čínské procesory Loongson nebývaly nic moc, má teď tamní režim šanci na reálně konkurenceschopné řešení. Loongson nasadil novou architekturu s lepším výkonem, který v přepočtu na 1 MHz dohání Intel a AMD. V PC to asi stačit nebude, ale teď se s ní chystají serverové procesory s až 64 jádry, které by mohly být překvapivě blízko Xeonům a Epycům, pokud to Loongsonu vyjde.
V prosinci jsme psali o 14nm procesoru Loongson 3A6000 (či LS3A6000), který poprvé přinesl jádra LA664. Ta, zdá se, o dost vylepšila pozici této platformy založené na od MIPS evolučně odvozené vlastní instrukční sadě LoongArch. Podle testů může dosahovat podobného výkonu na 1 MHz frekvence (IPC) jako jádra Golden Cove a Zen 4 v aktuálních procesorech Intel a AMD. Jeho maximální frekvence jsou však sotva poloviční, nějakých 2,0–2,5 GHz, takže v notebooku nebo desktopovém PC by byl výkon pořád hodně (úměrně rozdílu v taktech) pozadu.
Toto ale vůbec nemusí být problém v serverech. V těch totiž CPU obvykle mají mnoho jader a snaží se běžet na energeticky efektivní frekvenci, aby se vešla do daného TDP. Jak ukazují takty třeba Epyců s jádry Zen 4c, jedná se spíš o pásmo 2,0–3,0 GHz než 5,0–6,0 GHz, ve kterém se pohybují desktopové procesory. A to znamená, že v tomto sektoru by nevýhoda Loongsonu mohla být z velké části eliminována. Navíc serverový software o něco snáze zvládá změny instrukční sady.
Loongson přesně do serverového a HPC sektoru teď míří. Firma teď oznámila tape-out čipu Loongson LS3C6000, což je právě ta serverová verze odvozená od stejné architektury LA664. Jde o čip s 16 jádry, ovšem LA664 už umí technologii SMT (zpracování dvou vláken na každém jádře), takže procesor má 32 vláken pro vyšší celkový výkon.
Šestnáct jader by stačilo jen na základní úroveň méně výkonných serverů, ale tento čip bude zároveň sestavován do vícečipových „MCM“ pouzder, čímž Loongson vyrobí jeho varianty s 32 a 64 jádry (64 a 128 vlákny). Jednotlivé čipy budou komunikovat novou propojovací logikou označenou DragonChain (oficiální označení ale asi bude čínsky, takže tento překlad nemusí být přesný). 32jádrové a 64jádrové procesory by asi mohly být řešené podobně jako starší procesory AMD Epyc 7001, takže zdvojnásobení a zečtyřnásobení počtu jader by asi také přinášelo více linek PCI Express a více paměťových kanálů.
Díky vysokému IPC podobného Zenu 4 by Loongson asi mohl těmito procesory konkurovat procesorům Epyc, i když asi hlavně předchozí generaci Epyc 7003 „Milan“ s architekturou Zen 3, což jsou také maximálně 64jádra/128vlákna. Vysoké IPC totiž asi pořád může být drženo zpět o trochu nižší frekvencí (a méně optimalizovaným softwarem). Loongson má vlastní 256bitové SIMD rozšíření LSX konkurující AVX/AVX2, nicméně procesory Intel a nejnovější od AMD budou mít výhodu v 512bitových SIMD instrukcích AVX-512.
Do akce 64jádra Loongson zasáhnou až příští rok
Je také třeba připomenout, že tape-out neznamená, že je produkt hotový a vydaný. Jde o moment, kdy je hotový návrh a čip je poprvé odeslán k výrobě do továrny (možná v čínské foundry SMIC). Od tohoto momentu typicky trvá zhruba 9–15 měsíců, než je produkt komerčně vydán, typicky je to okolo jednoho roku. Tudíž tyto serverové Loongsony LS3C6000 vyjdou asi až v roce 2025, a mohou tedy reálně konkurovat až Zenu 5 a Epycům 9005 „Turin“.
Zdroje: Tom’s Hardware, MyDrivers