L1 instrukční cache ..... Zen 4 = 32 kB ..... M2 = 192 kB ........ 6x víc!!!
L2 cache...................... Zen 4 = 1 MB....... M2 = 16 MB ......... 16x víc!!!!
Dekodér instr. ............. Zen 4 = 4 ins/takt.... M2 = 8 instr/takt .. 2x víc
Výpočetní INT jednotky Zen 4 = 4+1 ALU .. M2 = 6+2 ALU ..... o 60% víc
FP jednotky skalár ........ Zen 4 = 2x .......... M2 = 4x .............. o 100% víc
FMA/SIMD jednotky ...... Zen 4 = 2x256-bit M2 = 4x 128-bit ... cca rovina
ROB .............................. Zen 4 = 320 ......... M2 = 630 ........... 2x víc!!!
IPC .... M2 má o 56% vyšší IPC jak AMD Zen 4 ..... což dožene až Zen 7 v 2029
Tohle brutální jádro má Apple už od roku 2017 kdy vyšla A11 Monsoon jakožto první 6+2 ALU monstrum a navíc první čistě 64-bit bez kompatibility s 32-bir ARMv7 (schválně kolik lidí co se zajímá o CPU o tom vědělo v té době? Ani dnes o tom rádoby-odborníci neví). V té době se AMD šmrdlalo na hranici bankrotu se směšným 2xALU Bulldozerem a bylo rádo že právě vydali Kellerem navrhnutý 4xALU Zen 1 (přičemž Jim Keller přišel zachránit AMD právě z Applu kde vedl vývoj jader A6 až A9 Twister ktery architekturou a IPC předběhl Intel Skylake).
Letošní Apple M3 bude nová gigantická architektura. Očekávám něco mezi 8+3 ALU (což už má letošní Cortex X4) až po 10+4 ALU. AMD Zen 4 se 4+1 proti tomu bude jak hračka z vietnamské tržnice nebo FX Bulldozer se 2xALU proti 4xALU Skylake :D
BTW pokud M3 zvedne IPC o 15% tak IPC náskok na Zen 4 vzroste z 56% na 79%..... aneb opět se Apple přiblíží k dvojnásobnému IPC oproti x86.
Ještě jsem zapomněl dodat, že Apple má L3 cache, která je sdílená nejen mezi CPU, ale pro GPU a NPU. O tom si u AMD a Intelu můžou uživatelé nechat zdát. Licenční Cortexy mají dokonce L4 cache sdílenou mezi CPU, GPU a NPU. Když pominu fakt, že NPU jednotku pro AI akceleraci svět x86 ještě nemá vůbec :D
Třeba takovej Orange Pi 5, ten má NPU jednotku už dnes :)
K tomu výkonější iGPU než má Zen 4, 8K výstup, 8-jádro s IPC Zen 2, spotřeba 1-2 W, až 32 GB RAM, cena 2,5 litru.
9. 8. 2023, 10:35 editováno autorem komentáře
A proč nepoužíváš OPi5? Za 400EUR na hodinu, co účtuje tvůj zaměstnavatel zákazníkovi za tvoji práci by ti zaměstnavatel mohl OPi5 pořídit několik. A teď pozor, co kdybys pracoval až 8h! To už by mohl být cluster revolučních vektorů, za který by se ani Amazon nestyděl. A kolik moc práce bys v tom clusteru udělal! A ještě nezapomínejme na NPU, to už by se tvoje práce mohla dělat sama a ty bys už jen bral peníze a mohl na cnews školit neznalé x86 uživatele o revolučních vektorech.
Tachium Prodigy .................................... nová ISA na RISCu.
Tensilica Xtensa LX6, LX7 (ESP32) ......... nová ISA na RISCu.
Čínskej Longsoon ................................... nová ISA na RISCu resp. odnož MIPS
RISC-V ................................................... nová ISA na RISCu.
ARMv8 z 2010 ......................................... zbrusu nová ISA na RISCu.
Tachium Prodigy byl na začátku VLIW aby to potom předělali na více-méně-RISC. O CISCu se ohledně Tachium nemluvilo pokud vím nikdy. Kdybys rozuměl tomu jak funguje CISC, tak bys věděl že CISC a VLIW se vzájemně vylučují (teoreticky by VLIW a CISC asi zkombinovat šel, ale proboha kdo by chtěl kombinovat dvě nejhorší architektury dohromady?).
Taky by mne zajímalo čeho je evoluce 64-bit ARMv8, když je to úplně nová ISA která vznikla s čistým listem papíru a nemá s 32-bit ARMv7 nic společného (kromě těch třech písmenek v názvu). Možná 64-bit Alpha byla použita jako částečný a vzdálený vzor.
Sranda je, že i všechny ty starší RISC ISA jsou o několik světelných let modernější než jakýkoliv CISC, zvláště pak x86 CISC z roku 1978. Zatím všechny x86 CISC procáky používají vnitřně RISC jádra. Nějak jsem si nevšimnul, že by nějaký RISC CPU používal vnitřně CISC jádro. Proč by to dělal? Aby trhnul rekord v nejhorší spotřebě při co nejnižším výkonu? :D
Mě moc zastaralá nepřipadá https://diit.cz/clanek/vzorek-threadripper-pro-7995wx-vytvoril-svetovy-rekord-v-geekbench-5
A na jaře přijde Zen 5 který podle pesimistických odhadů má IPC +15% a podle optimistických +25% proti Zen 4
Pozor, to budou asi čistě spekulace, já bych na tyhle hodnoty vůbec nehleděl. Je to tak nepřesné číslo, že to nemá vůbec smysl řešit, nepřesnost tak velká, že to nemá informační hodnotu. IMHO je užitečnější kalkulovat s tím, že to IPC vůbec není známé.
L2 cache...................... Zen 4 = 1 MB....... M2 = 16 MB ......... 16x víc!!!! Takže M2 má 128MB L2 a M2 ultra 384MB? Nebo se tu míchají jablka s hruškama a násobí hovnama...? Předpokládám iq minimálně 4096... To už by mohlo stačit na pochopení situace... Ono Ferrari je fajn ale na českých okreskách (SW) je to celkem k prdu a bez změny infrastruktury (SW) to bude super kára na německé dálnici, ale na té okresce to pojede pomaleji než nějaká Dacia... A stavět nové dálnice mezi vesnicemi nikdo jen tak nebude, protože to nikdo nezaplatí a mnozí nemají na nové Ferrari a jelikož potřebují občas jezdit i po lese tak jim ten Duster bude stačit... Jedině že by se našel dobrovolník s IQ aspoň 4096 co by ve svém volném čase všechny silnice předělal... I v tom lese
Hlavně se nedokáže srovnat s tím, že ty rozdíly, kdyby opravdu měly v reálu hrát takovou roli, tak by ty jeho ARM procesory musely být násobně výkonné, jenže jaksi nejsou. Nechápe, že 3/4 ALU jednotek nejsou srovnatelné s tou 1/4 protože jsou jednodušší a umí jen část mikroinstukcí. Na to aby to zjistil, stačí jediný pohled na schéma jádra...
Nejen Putin s Mosadem, ale prej po nich jde i sám Intel a AMD. Hážou jim klacky pod nohy a zároveň je odmítají koupit aby jim došli prachy, parchanti jedni.
Instrukční sada od Tachium je tak relovuční a výkonná, že musí zůstat navždy tajná aby ji nikdo nemohl zkopírovat. Nedejbože by se mohla rozšířit a to jako tvůrce nové ISA fakt nechceš.
Navíc nejnovější spekulace ukazují, že Danilák celou ISA postavil na výzkumu jistého Českého geniálního vědce, který se zabýval výzkumem kvantových počítačů s využitím tachionů jakožto nosičem dat. Tedy výsledky takový počítač dokáže dodat ještě než je zahájen samotný výpočet. Protože tyto výzkumy prováděl u Tachova, tak tyto částice pojmenoval Tachiony. Vše nasvědčuje tomu že se Danilák nějakým způsobem dostal k nově objeveným zápiskům o výzkumu slepých uliček tohoto geniálního vědce.