Řekl bych, že si to vykládáte dost svérázně. Žlutý čtverec bude žlutým čtvercem vždycky a nikdy se z něj nestane ani batoh, ani bagr, ani slunce.
Ta neuronová síť nezvyšuje rozlišení tak výrazně, aby tam vznikly takovéhle detaily, navíc to ani nejde udělat. Ta neuronová síť funguje tak, že jsou jí předkládány dva obrázky, jeden v nízkém rozlišení a druhý ve vysokém rozlišení. A jejím cílem je natrénovat se tak, aby z toho nízkého udělala co nejvěrnější podobu toho vysokého (při učení se počítá nějaká celková suma odchylek a asi se dbá i na to, aby každá z odchylek nepřekročila nějakou mez).
Objekty vůbec nemusí řešit. Ty objekty hrají roli jen v tom trénování, kdy se trénuje na tu konkrétní hru, takže se trénuje jen a pouze obraz, který je složen z objektů ve hře se vyskytujících. Tedy funguje to stejně, jako lidský mozek, který také "vidí" to, co vidět chce (o čem předpokládá, že tam je). A když člověk nikdy neviděl avokádo, tak ho na obrázku neuvidí a bude si myslet, že vidí třeba divnou hrušku. Stejně tak, ta neuronová síť uvidí jen "objekty", které se vyskytovaly v obraze při trénování.