Myslím, že "full interconnect" znamená len toľko, že všetkých 6 NVlink portov je použitých na komunikáciu každého_GPU s každým_GPU. Teda 150GB/s v každom smere. (Avšak, vrámci svojej "osmičky" sú to 2 hopy, pri komunikácii s GPU z opačnej "osmičky" sú to 3 hopy.)
Tváriť sa "ako_monolitické_GPU" sa to môže bez ohľadu na typ prepojenia, otázka je len, ako veľmi to bude (ne)efektívne. Či na to už táto priepustnosť a latencie stačia, toť otázka... Tým mám na mysli režim ne_AFR. Lepšie synchronizovať AFR sa síce dá, ale pridaná latencia je nevyhnutná (v porovnaní so single GPU).