Hlavní navigace

Google prohledává 30 bilionů stránek, index zabírá 100 petabajtů

Sdílet

 Autor: Redakce

Loni nám dal Google nahlédnout, jak funguje odesílání e-mailů. Podobně hravou formou teď internetová jednička ukazuje, co se děje uvnitř vyhledávače. Na stránce How search works se můžete podívat na animovanou infografiku, co se stane s dotazem, který do Googlu zadáte. Postup je pouze anglicky, nově zprovozněná textová stránka už je však i v našem jazyce.

" width="560" height="315" frameborder="0">

V průvodci se dozvíte, jak vlastně vyhledávač pracuje. Pro laiky může být novinkou, že Google neprohledává přímo koncové stránky, ale kontroluje vlastní index. Ten sestavuje armáda indexovacích robotů, kteří procházejí celosvětový web a zapisují si o stránkách informace – tedy index. Google indexuje 30 bilionů dokumentů, celkový index už zabírá přibližně 100 PB prostoru a tato čísla stále rostou.

Pokud se Googlu zeptáte, kdo je například prezidentem Slovenska, vyhledávací engine nahlédne do celého indexu, ze kterého vyloví více než šest milionů odkazů. Všechny by měly odpovídat popisu. Ale jak Google pozná, které jsou důležité a jak je pak řadí ve výsledcích? K určování pořadí slouží asi 200 různých faktorů. Ty zkoumají kvanti- i kvalitativní vlastnosti stránky: kolikrát je dané klíčové slovo na stránce, jaký má stránka PageRank, jak často na tento výsledek klikali ostatní lidé apod. To vše Google zvládne pod jednu sekundu času. Přitom každou sekundu zpracuje 40 000 dotazů.

WT100

 

Zdroj: Google