Ano slepením dvou samostatných celků logicky naroste latence, to je jasné. To víme z praxe několik let které AMD lepí chiplety.
Problém s rychlostí ale u M1 ultra není. Paměti mají u M1 Max propustnost max 400GB/s, spojení mezi dvěmi M1 Max dosahuje propustnosti 2,5TBit/s, 1.25TB/s jedním směrem, tzn teoreticky dokáže posílat data 3x rychleji než je paměť schopná ty data dodat.
Ta propustnost je pro spojení dvou M1 Max naprostý overkill, ale... dá se z toho vytušit že je Apple skutečně připravený na propojení čtyř Max čipů do jednoho, pokud budu mít potřebná data uložená v paměti jednoho ze čtyř Maxů a budu s nimi chtít začít pracovat na zbylých třech, tak ten první Max může přes 1,25TB/s rozhraní plnou rychlostí nakrmit pamět tří Maxů najednou.
Limit rozhraní hypoteticky vyšumí pokud by jeden max plni daty další tři a ty tři ještě chtěly nějak komunikovat mezi sebou, ale v takovém případě by stejně nestačila rychlost pamětí, která je už plně saturována tím přenosem dat z jednoho Maxu.
Pokud jSW zná architekturu a zná její limity a pracuje na úlohách které jdou dobře paralelizovat a nepotřebují vzájemně sdílet nějaký zásadnější objem dat, pak ani ty latence nejsou problém. A vývojáři profesionálních SW pro MacOS nenechávají nic náhodě, mají jen omezené množství konfigurací, takže mohou poměrně efektivně psát na tělo HW a ždímat z něj maximum.