Ta formulace v článku to myslela trochu jinak. Steam má přímo v designu, že se to vybírá náhodně. Že vybírají náhodně, jim nezazlívám, to je holt jejich volba – asi není možný oslovovat s žádostí úplně všechny uživatele pořád, byť by to zrovna tady technicky šlo (protože ani obecně není pravda, že náhodný výběr je nejlepší metoda, nejlepší metoda je mít data od úplně kompletní populace místo jen vzorku). Lidi by to otravovalo a sbírat data bez požádání o souhlas je zase nepěkný. Ta věta mluvila o tom, že z pohledu uživatele to někdy vypadá ne jako náhoda, kde to prostě padá nestraně podle nějaké křivky pravděpodobnosti, ale jako by to byla taková ta „schválnostní náhoda“ a zdá se mu, že je to rozbité, že furt čeká a nikdy se nedočká. Pokud to dělají dobře, tak by to měl být jenom čistě subjektivní pocit. Akorát tím, jak je to blackbox, tak není úplně jistota, jestli to fakt dělají správně.
Dám tam místo toho slova náhodně, že to vypadá nevyzpytatelně,a by to bylo jasný.
Náhodou jsem sociologii na škole měl a vytvoření vzorku tak, aby byl co nejrelevantnější je docela věda, takže to, že by měl prostě jen být náhodný je dost velký zjednodušení. Někdy nemusí být náhodný vzorek optimálně relevantní, například když je u různých skupin z celé té populace různá pravděpodobnost, že se do toho vzorku dostanou. Zrovna u toho předvolebního průzkumu tohle platí docela dost, proto taky člověk nikdy dopředu neví, jak moc se trefí a chce to hodně zkušeností a knowhow, ale zase se se ty faktory pořád mění. Například u telefonního průzkumu se nedostaneš k lidem, na které není v nějakém telefonním seznamu číslo, nebo který nemají telefon. Když se ptáš na ulici, tak tam nebudou lidi, který všude jezdí všude autem nebo málo chodí ven. Voliči komunistů například aspoň dřív byli míň ochotní se k tomu přiznat (a průšvih je, jak nějak zohlednit různou ochotu různých lidí nakonec k těm volbám fakt jít a nezůstat doma).
Tady u Steamu bych si tipnul, že by mohly být anomálie třeba takové, že u lidí s nejdražšíma kartama je větší šance, že odsouhlasí požadavek sdílet data. Podobně by to možná mohlo být u Linuxáků, kteří můžou mít větší entuziasmus a touhu „zviditelnit“ podíl svého OS. Samozřejmě, jak velké ty vlivy jsou, to netuším. Tipuju, že jestli něco, tak tam budou spíš jiné problémy, které by člověk tak snadno nepředvídal.