A kdo rozhodne o tom, na kolika z dostupných jádrech se má MT úloha vlastně spustit. Pokud půjde o algoritmus, kde se v rámci jednotlivých iterací vychází z hotových výsledků všech vláken ("synchronizovaně"), spuštění na větším počtu vláken znamená přizpůsobení se rychlosti toho nejslabšího zúčastněného core (dříve hotová silná jádra budou čekat na výsledky od slabších). V případě, že jsou všechna jádra prakticky stejně silná tento problém není tak výrazný.
Cinebench je přesně opačnou úlohou, v rámci jednotlivých vláken se řeší přidělené tile ke zpracování (výsledky z jednotlivých threadů na sebe nečekají). Jádra k celkovému dlu přispějí podle svých sil (různým počtem dokončených tile). Do extrému vzato i kdyby nejslabší vlákno počítalo jeden tile o začátku až doby než se přidělí ke zpracování posledních N-tile ostatním vláknům, bude stále výkonostním přínosem.