Názory k článku Zhaoxin vydává nové čínské x86 procesory: „APU“ s výkonnou grafikou a až 32jádra pro servery

  • 7. 11. 2022 12:30

    tralalák (neregistrovaný)

    Samozrejme sa jedná o adoptovanú microarchitektúru Centaur, ktorú si už implementoval a upravoval pre svoje potreby pevninský Zhaoxin vývojový team pod označením Yongfeng.

    Z čínskych zdrojov rumours tvrdia, že návrh Centauru pre CNS a Yongfeng sa líši v absencii kruhovej zbernice a zmeny nastali aj v cache (L1I, L3) a dozaista aj dalšie zefektívnenie čipu od uvedenia CNS. Zároveň čipy (čiplety) medzi sebou komunikujú cez ZPI 3.0.

    Odbočka. Čo sa týka tvojej domnienky, že AVX-512 pri Centaur CNS toľko nepomáhala tak test - recenzia golem.de ukázala presný opak.
    zdroj: https://www.golem.de/news/centaur-cha-im-test-der-letzte-x86-prozessor-seiner-art-2209-167757-3.html

    Zhaoxin s najväčšou pravdepodobnosťou AVX-512 pridá neskôr hlavne ak dosiahne modenejší výrobný proces (litografiu) pri ďalšej evolúcii Yongfeng-u v podstate v dobe ked AVX-512 bude ako tak reálnejšie omnohoviac použiteľné ako tomu je v súčasnosti. Ako bolo vyššie uvedené všetku dokumentáciu a implemantáciu toho má od Centauru.


    2 Processors, 32 Cores
    ZHAOXIN KaiSheng KH-40000/16
    source: https://browser.geekbench.com/v5/cpu/15706425

    CentaurHauls Family 6 Model 71 Stepping 2 vs CentaurHauls Family 7 Model 11 Stepping 3
    Centaur CNS (Centaur CHA) vs Zhaoxin Youngfeng (Zhaoxin KH-40000)

    L1 Instruction Cache má 64 KB na jadro a to sa líši od Centaur CNS s 32kB L1I.

    Cache L3 je 8 MB ktoré zdielajú 4 jadrá a to sa líši od Centaur CNS so 16 MB vyrovnávacej pamäte L3 na osem jadier.

    zdroj: https://browser.geekbench.com/v5/cpu/compare/12878360?baseline=15706425
    zdroj: https://tiebapic.baidu.com/forum/pic/item/765bdc39b6003af313544fbe702ac65c1238b68e.jpg?tbpicau=2022-11-09-05_5595a0c28ef63c8085ebef5c9118653c
    zdroj: https://tieba.baidu.com/photo/p?kw=%E4%B8%AD%E5%9B%BD%E8%8A%AF&ie=utf-8&flux=1&tid=8015473269&pic_id=11b52f9759ee3d6d5428141506166d224d4ade8e&pn=1&fp=2&see_lz=1
    zdroj: https://tiebapic.baidu.com/forum/pic/item/6efb82d4b31c870153581338627f9e2f0508ff8f.jpg?tbpicau=2022-11-09-05_5746cd6c6c8f155a56134e5919444bf6http://tiebapic.baidu.com/forum/w%3D580/sign=2c9100fd262762d0803ea4b790ed0849/e6530054b319ebc43238c947c726cffc1f17160b.jpg?tbpicau=2022-11-09-05_f6ca880c997c208ab03c2142de843f1b

    Inými slovami KH-40000/16 je natívne 16C/16T:

    • L1I cache 16x 64kB (1MB)
    • L1D cache 16x 32kB (512kB)
    • L2 cache 16x 256kB (4MB)
    • L3 cache 4x 8MB (32MB)

    KH-40000/32 je sú dva "čiplety" KH-40000/16
    • L1I cache 2x 16x 64kB (2MB)
    • L1D cache 2x 16x 32kB (1MB)
    • L2 cache 2x 16x 256kB (8MB)
    • L3 cache 2x 4x 8MB (64MB)

    A potom tu máme ešte dvojsocketové pracovné stanice prepojené cez ZPI 3.0 up to 64C/64T čínske Yongfeng "CoreRippery" so 128MB L3 cache (2x64MB) a s 8-kanálovými až 4 TB DDR4 ECC RAMkami.

  • 7. 11. 2022 16:25

    Jan Olšan

    Díky za ten odkaz na Geekbench (i teda ty další), takže CPUID je pořád CentaurHauls...
    Ale když se tam dívám na to srovnání, tak Centaur CHA by měl být značený jako Family 6 Model 71 Stepping 2.
    Ten KH40000 má CPUID CentaurHauls Family 7 Model 11 Stepping 3 což je mnohem blíž Zhaoxinům KX-6000 založeným na Lujiazui (nebo to má být Lu Jia Zui?), které se hlásí jako CentaurHauls Family 7 Model 11 Stepping 1.
    Asi to nemusí znamenat definitivně, že je to derivát Lujiazui nebo jeho evoluce, ale zase bych to neignoroval.

    U toho komentáře u AVX-512 na CHA jsem vycházel z hodnocení https://chipsandcheese.com/2022/03/23/via-part-4-a-deep-dive-into-centaurs-last-cpu-core-cns/

    Centaur rozděluje AVX-512 hned v dekódovaní na 2 uOPy a má jen 256bitové registry, kdežto Zen 4 je dekóduje na jeden uOP, takže jejich použití zlepšuje efektivní kapacitu ROB a dalších front v jádru Zen 4 a počet operací, které se za cyklus dají protlačit různými fázemi zpracování. Na dva průchody se instrukce AVX-512 rozdělí až při přidělení konkrétní exekuční jednotce. Taky registry jsou skutečně 512bitové. (Tady tohle je odlišné proti tomu, jak implementoval AVX+AVX2 Zen 1 nebo jak měl K8 řešené SSE/SSE2.) Výjimka jsou store instrukce, ty jsou rozdělené už v dekódování jako u Centauru. Každopádně by to kvůli tomuhle mělo pomáhat na Zenu 4 o něco víc než na Centauru.

  • 7. 11. 2022 19:11

    tralalák (neregistrovaný)

    Uvedom si jednu zásadnú vec. Celý vývoj veľkého jadra bol finančne v réžii Zhaoxinu.
    Od nich prišla požiadavka posunúť sa ďalej resp. vyššie a Centaur ponúkol niekoľko modulárnych možností microarchitektúr, ktoré sú použiteľné pre základ 16nm CMOS s ktorými sa bude dať evolučne do budúcnosti samozrejme pracovať aj na nižších litografiách.

    Centaur CNS bol k danému časovému horizontu povedzme k roku 2019 strop toho čo tak malý team dokáže za relatívne málo finnačných prostriedkov Zhaoxinu schopný dodať na trh.

    Odbočka: NCORE deap learning AI koprocessor bol prosuktom Glenna Henry, ktorý ho samostatne ako síce v tom čase CEO Centaur a zároveň CTO financoval a nemal nič spoločné so Zhaoxinom. Bol to v podstate prílepok na ring bus zo strany G. Henryho v rámci Centauru.

    Celá snaha Centauru a v podstate odchádzajúceho Glena Henryho bola v posledných rokoch vedenie mladším a "predať sa" rozum. zabezpečiť "rodine" x86 výskumníkov a vývojárov R&D Centauru možnosť pokračovať niekde inde. A vieme kde skončili.

    Zhaoxin v pevnickej Číne dlhodobu budoval paralélny R&D team pričom ten Centauru nazyvali síce marketingovo len ako team na "predvývoj" (to bola samozrejme story pre ich domcáce publikum). Od počiatku vytvorili campus s univerzitami a každoročne rekrutovali a rekrutujú potenciononálne talenty pričom mnohí stážovali či už v Centaure či VIA. Ale učili sa rýchlo veď spoločný podnik vznikol v 2013 pričom postupne absorvovali microarchitektúry Centaur a aj ich upgradovali čo budú robiť aj naďalej a časom prídu s niečom vlastným. A aby nedošlo k omylu. Oni aj všetko financovali, robili a robia patenty a snažili sa všeko si právne podchytiť. Zhaoxin nemal na Centaur team a jeho zloženie žiaden dosah, okrem toho, že spoločný podnik s VIA financovali presne zadané požiadavky na produkt do svojho segmentu. Zároveň aj zo zloženia toho teamu im bolo jasné, že tudy cesta nevedie a preto ako som úvodom spomenul odpočiatku budovali paralelélne štruktúry.

    A aj to aspoň takto rozlišovali byt CPUID nieje k Zhaoxinu stále milosrdné CentaurHauls (samozrejme súviselo to aj s licenciou, patentami a práva atď.)
    Family 6 je v tomto ponímaní Centaur línia
    Family 7 je Zhaoxin línia

    Napr. moj Lujiazui KX-U6580 je CentaurHauls Family 7 Model 59 (3B) Stepping 0
    Younfeng by mal byť Family 7 Model 91 (11) Stepping 3
    CNS je CentaurHauls Family 6 Model 71 Stepping 2

    16nm Zhaoxin/Centaur Yongfeng je derivát veľkého jadra Centauru CNS kedy Zhaoxin pri 16nm a okolo Lujiazui čo je derivát Centaur CNR alias VIA Isaiah II sa naozaj moc neobtrel.
    To, že pri 16nm vsadili namiesto AVX-512 na až 32 jadier v dvojsokete 64 jadier je daň toho čo museli a musia oželieť pokiaľ nepredu na lepšiu tj. modernejšiu litografiu.