Je to několik let, co USA začaly uvalovat sankce na čínské technologické firmy, nejznámější je případ Huawei. Poslední dobou ale jakoby se čínskému koncernu dařilo naplňovat rčení „co tě nezabije, to tě posílí“, firma se vrátila s vlastními mobilními čipy, a dokonce teď má i vlastní architektury jader CPU a GPU, zatímco dříve je licencovala. Ovšem neznamená to, že by čínské technologie byly na nějakém triumfálním vítězném tažení, realita je poněkud složitější.
Zatímco mobilní procesory se, zdá se, daří firmě Huawei vyrábět pomocí technologií lokální čínské společnosti SMIC, otázka visí nad tím, jakou mají tyto procesy výtěžnost. Zdá se, že reálně tyto technologie trpí značnou mírou defektů, takže kdyby nebylo státních podpor a specifické situace, kdy Huawei ani nemá přístup k lepším alternativám, patrně by vlastní čipy vyráběné v SMIC nebyly konkurenceschopné.
Podle informací korejského na byznys zaměřeného deníku Chosun.biz se Huawei ve skutečnosti při používání oněch lokálních křemíkových technologií potýká se značnými problémy. Společnost právě u SMIC zkouší vyrábět výkonné akcelerátory umělé inteligence řady Ascend. Podle Chosun.biz se Huawei snaží rozjet výrobu akcelerátorů Ascend 910B ve větším měřítku (s cílem nahradit v Číně akcelerátory Nvidia, nebo jim vzít aspoň část nyní údajně 90% tržního podílu), ale výroba SMIC tomu zdařile brání. Výtěžnost těchto čipů, které jsou výrazně větší, a tím náročnější než malé mobilní SoC, je na procesu SMIC velmi špatná.
Podle Chosun.biz je jen 20 % vyrobených čipů (respektive čipletů) pro Ascend 910B funkčních, zbytek je postižen výrobními defekty. Vysoká míra defektů je problém zejména pro velké čipy, protože je jich na waferu méně. Pro ilustraci: pokud si představíte situaci, kdy je na vyrobeném waferu rozeseto například okolo 80 lokálních defektů, pak v případě, že se z desky vyrobí 400 malých mobilních čipů, zůstane vám stále 80 % použitelných kusů křemíku, do nichž se defekt „netrefil“. Pokud jsou ale čipy tak velké, že je jich na waferu jen třeba 80, pak můžete ztratit i prakticky všechny, pakliže nemáte kliku a více kazů se „neschová“ do jednoho čipu.
Velkost čipu nebo čipletu, o kterém je zde řeč, by snad měla být 456 mm², což znamená, že na wafer by se mělo vejít cca 125 kusů (bude se to ovšem lišit podle poměru vertikálního a horizontálního rozměru). Při 20% výtěžnosti by ale jen 25 bylo použitelných.
Hodně velké problémy, nejen pro AI procesory, ale i pro mobily
Chosun.biz neuvádí úplně přesně, zda ona 20% výtěžnost znamená, že zbylé čtyři pětiny jsou zcela nepoužitelné. Velké čipy jako GPU či výkonná CPU typicky s defekty počítají a lze je provozovat s několika jednotkami či jádry vypnutými. Tím pádem se řada čipů s defektem zachrání za cenu třeba jen pár procent výkonu. Takové „harvested“ čipy jsou pak prodávané jako o kousek méně výkonný model, nebo dokonce firma ani žádné plně aktivní čipy neprodává a některé jednotky jsou vždy rezervovány jako redundantní.
Pokud ona výtěžnost mluví jen o plně funkčních čipech bez defektu, pak Huawei asi ještě může poměrně dost kusů křemíku ze zbytku zachránit a využít, pokud u onoho akcelerátoru Ascend 910B o něco zhorší specifikace vypnutím části jednotek. Pokud ovšem je řeč o 20% výtěžnosti i po použití této techniky, výrobní technologie by byla pro daný produkt téměř nepoužitelná.
Nejde jen o to, že firma za wafery utratí při 20 % výtěžnosti pětinásobek, ale i o to, že na linkách SMIC třeba ani nemusí být dost volné kapacity, aby se dalo pětkrát víc waferů objednat – to může být problém, pokud Huawei chce rychle urvat co nejvíce z trhu AI akcelerátorů.
Už začátkem roku se přitom objevily zprávy, že Huawei nemá u SMIC zdaleka dost kapacit pro výrobu těchto produktů. Už tehdy zdroje obeznámené se situací tvrdily, že společnost musela omezit výrobu mobilních čipů Kirin, o nichž jsme psali – právě aby měla kapacitu na výrobu akcelerátorů AI ve větším množství, které by chtěla na čínský trh hladový po AI hardwaru vrhnout.
Už tehdy tyto zdroje také hovořily o špatné výtěžnosti. Nyní možná došlo k tomu, že firma bude mít nedostatek mobilních čipů, a stejně se jí nepodaří vyrobit ani dost těch žádaných akcelerátorů AI, protože významná číst vyrobených waferů přijde vniveč.
Rozdíl mezi vyvinutím procesu a schopností ho ekonomicky provozovat
I v případě oné příznivější interpretace je ale výskyt defektů na 80 % čipů (byť asi velkých) docela prekérní a toto hodně mluví o kvalitě a pokročilosti procesu SMIC. Tato továrna překvapila tím, že dokázala zprovoznit vlastní 7nm, a dokonce nominálně 5nm proces (který ale reálně bude o dost pozadu za 5nm výrobou TSMC a možná by mohl být chápaný spíš jako evoluce 7 nm), a to bez pomoci EUV.
Je jedna věc vyvinout aparaturu, která vyrobí na křemíku struktury s považovaně malými rozměry. To však není celý problém. Poté je třeba dokázat to ekonomicky konkurenceschopně a umět to provádět sériově, kdy už nestačí, že se vám to povede při jednom z deseti pokusů, ale potřebujete, aby technologie předvídatelně a stabilně pracovala vždy. Podle těchto informací SMIC dost možná má stále vyřešenou jen první část, která sice umožňuje oficiálně ohlásit úspěch s vyvinutím vlastní čínské pokročilé technologie, ale ta potom má značné problémy ve druhých dvou aspektech.
Ascend 910B mimochodem zřejmě nemá používat úplně nejnovější proces, kterému SMIC říká 5nm, ale o generaci starší 7nm proces. To, že ani na něm není dobrá situace s výtěžností, problém umocňuje. Pravděpodobně to znamená, že u 5nm procesu by při pokusu o výrobu velkého výkonného čipy byly výsledky ještě horší. Huawei má v plánu začít používat 5nm proces příští rok pro další generaci akcelerátorů AI, ale tato situace může vést k odkladu nebo zrušení těchto plánů.
Zdroje: Tom’s Hardware, TechPowerUp