CNN, hadam ze nevis, ze ma V100 na IBM platforme pres NVLink pristup primo k CPU a naopak ..
To samozrejme znamena mensi latence, ucinnejsi scheduling, atd. nez kdyz jdes pres PCIe. Rozdil neni velky, ale je tam. Daleko vetsi rozdil by asi byl ve skalovani vice GPU, ale k tomu jsem data nikde nenasel. Tusim ze snad na AnandTechu o tom byl v dobe vydani V100 pekny clanek.