Příběh Googlu: jak dva studenti dobyli svět informací

3. 12. 2010

Sdílet

 Autor: Redakce

Larry Page a Sergej Brin, skromní géniové

Hlavní poslání společnosti Google není vůbec skromné: „uspořádat informace z celého světa tak, aby byly všeobecně přístupné a užitečné“. Nebýt Googlu, možná by nám toto předsevzetí přišlo naprosto nereálné. S odstupem času se ale této odvážné myšlence původně dvou studentů Sergeje Brina a Larryho Page nikdo nesměje. Naopak jejich přítomnost na světových konferencích nebo například na půdě Evropského parlamentu či univerzit těch nejzvučnějších jmen vzbuzuje respekt. Po uhlobaronech, ocelářských a ropných magnátech nyní přichází éra informačních magnátů. Koneckonců nejcennějším zbožím na prahu 21. století je bezpochyby informace. A těch má Google k dispozici více než dostatek.

Čtěte také:

Larry Page

Plným jménem Lawrence Page se narodil 26. března 1973 do židovské rodiny jako syn profesorů počítačových věd Michiganské univerzity. Sám Page několikrát poznamenal, že v jejich domě se neustále povalovaly všemožné počítače a odborné časopisy. Známá je také historka, když v šesti letech odevzdal písemnou práci na základní škole jako první žák zpracovanou na počítači. Kromě rodičů a učitelů mu rozšiřoval obzory i jeho bratr, který neustále rozebíral různá zařízení, aby se přesvědčil, jak jsou zkonstruována.

Po ukončení střední školy East Lansing High School pokračoval ve studiích na University of Michigan, kde přednášeli jeho rodiče. Získal zde bakalářský titul a také se mu podařilo sestrojit funkční tiskárnu z kostek lega. Pokračoval studiem počítačových věd na prestižní Stanfordově univerzitě, kde se po zdárném dokončení magisterského vzdělání zapsal do doktorského programu. Jako hlavní téma výzkumu a své dizertační práce zvolil matematické vlastnosti sítě world wide web a zobrazení vzájemných odkazů jednotlivých stránek jako obrovský graf.

Již tehdy pochopil, že vzájemné zpětné odkazy směřující na danou stránku mohou být cennou informací o samotné stránce. Zpětný odkaz (anglicky backlink) totiž chápal jako citaci. Počet citací ve vědeckých kruzích i před existencí internetu napovídal o hodnotě  a kvalitě informací uváděných v citovaném dokumentu. Jeho výzkum se proto ubíral směrem k propočítání sítě zpětných odkazů a následném určení hodnoty, nebo chcete-li kvality, dané stránky. Brzy našel v tomto výzkumu silného spojence.

Sergej Brin a Larry PageSergej Brin a Larry Page

Sergej Brin

Celým jménem Sergej Michajlovič Brin (budete-li hledat další informace, v anglicky mluvících zemích se setkáte s přepisem Sergey Mikhaylovich Brin) se narodil 21. srpna 1973 v Moskvě v bývalém Sovětském Svazu do židovské rodiny. Stejně jako Larry Page vyrůstal Brin v rodině špičkových vědců. Oba rodiče absolvovali na legendární Lomonosově Univerzitě (Moskevská státní univerzita M. V. Lomonosova). Otec je profesorem matematiky na University of Maryland, matka pracuje jako vědecký pracovník pro americkou agenturu NASA. Celá rodina v roce 1979 totiž emigrovala ze Sovětského svazu do USA. Hlavním důvodem byla skutečnost, že jako židé neměli možnost svobodně studovat libovolný obor, kupříkladu katedra fyziky přímo zakazovala přijímat studenty židovského vyznání.

Po emigraci začal Brin docházet do základní školy ve státě Maryland. Již od útlého věku však získával vynikající vzdělání od svého otce, který podporoval jeho zájem o matematiku. Rodina mu také pomohla osvojit si svůj původně mateřský jazyk – ruštinu. Po absolvování střední školy Eleanor Roosevelt High School pokračoval na University of Maryland, kde získal bakalářský diplom. Jako vynikající student pokračoval postgraduálním studiem počítačových věd na prestižní Stanfordově univerzitě, kde dokonce získal stipendium od National Science Foundation, které obdrží každý rok v USA pouze asi 1000 uchazečů!

Společná cesta

Jak už určitě tušíte, oba tehdejší doktorandi se potkali právě na půdě Stanfordovy univerzity. Přestože se svými názory téměř vždy diametrálně rozcházeli, nebo možná právě proto, brzy se stali velmi dobrými přáteli. Zanedlouho začali spolupracovat na vývoji zcela nového typu vyhledávače. Brin se soustředil na problematiku sběru dat, zatímco Page na to, jak rozšifrovat jejich vzájemné propojení. V začátcích byl internet z dnešního pohledu malý a místo vyhledávačů sloužili jako rozcestníky katalogy stránek, které sestavovali editoři ručně.

Takto fungoval třeba i náš český Seznam.cz. V praxi to znamenalo, že tvůrce stránek poslal žádost o zařazení do katalogu do konkrétní kategorie (například Technika – Automobily – Osobní). Editoři pak stránky zkontrolovali a ručně zařadili do katalogu, případně odmítli. Při vložení do katalogu editoři ručně přiřadili klíčová slova i příslušnou kategorii a zařadili jej do vyhledávání. Tato metoda však brzy přestala fungovat.

Googleplex: obrovské centrum Googlu v Mountain View. Každý by zde chtěl pracovat

S rostoucím počtem webových stránek už nemohli editoři efektivně spravovat seznam stránek pomocí kategorií. Stejně tak vyhledávací skripty, které se snažily vyhledávat fulltextově (tedy najít jakýkoli výraz nalezený na stránkách zařazených do katalogu) nezvládaly procházet stále větší množství textů. Brin a Page si předsevzali vytvořit vyhledávač, který bude nezávislý na ručně vytvářených katalozích a vytvoří si seznam s obsahy stránek sám a to dokonale. Největší výzvou však bylo, aby vyhledávač dokázal posoudit kvalitu nalezených stránek a na prvních místech nabízet stránky nejvíce odpovídající zadanému dotazu a navíc s nejhodnotnějšími informacemi. Jak již bylo řečeno, jako hlavní faktor pro posouzení kvality konkrétní stránky bylo zhodnotit, kolik a jak kvalitních stránek na danou stránku odkazuje.

Jak zadarmo vydělat peníze

PageRank – zlato Googlu

Dnešní nejznámější a podle mnoha hodnocení doposud nejlepší vyhledávač začal vznikat v roce 1996 ještě na studentských kolejích, roku 1998 založil Larry Page a Sergej Brin společnost Google, Inc. Vyhledávače té doby hodnotily určitou webovou stránku podle toho, kolikrát se na ní vyskytoval hledaný výraz. V praxi to znamenalo, že kdybyste do libovolného textu umístili například dvacetkrát určité slovo, při vyhledávání tohoto slova by byla stránka na přední pozici, ačkoli její obsah by nebyl užitečný. Page a Brin navrhli novou technologii vyhledávání, kterou nazvali PageRank. Každá webová stránka získá hodnocení na základě poměrně složitého patentovaného algoritmu, který spočítá její relevanci na základě množství a kvalitě zpětných odkazů.

Aby tento výpočet proběhl správně, bere se v úvahu i pagerank stránek, které na ni odkazují. Zpětný odkaz ze stránky s vysokým pagerankem má větší váhu než sto odkazů ze stránek s nízkým hodnocením. Přestože je zde tato problematika popsána velmi jednoduše, dokážete si představit, že není vůbec jednoduché propočítat všechny vzájemné odkazy všech stránek na celém internetu. Ty jsou totiž všechny určitým způsobem propojeny a tvoří rozsáhlou síť. Pokud by nebyly propočítány odkazy všech stránek, nebyl by výsledek kompletní a vyhledávání by nebylo tak přesné. Dalším problémem je aktuálnost. Každý den vzniká neuvěřitelné množství nových stránek, které je potřeba do indexu zahrnout a vztahy odkazů neustále znovu přepočítávat. K tomu Google využívá nejrozsáhlejší síť serverů na světě.

Google BetaGoogle v roce 1998, tehdy ještě s vykřičníkem jako Yahoo, zdroj: Archive.org

Pro získávání seznamu odkazů se používá tzv. crawler (označován také spider, bot nebo web scutter). Crawler prochází seznam známých stránek a vytváří seznam všech odkazů, které na stránkách nalezne. Až práci dokončí, opakuje akci s nově vytvořeným seznamem odkazů, které nalezl – prochází tedy všechny nové stránky a opět vytváří nový rozsáhlejší seznam se všemi novými odkazy. Tento sběr dat ovšem není vůbec jednoduchý, crawler totiž musí projít co nejrychleji neuvěřitelné množství zdrojového kódu webových stránek a na nich správně rozpoznat různé typy odkazů s různým obsahem. Jakmile jsou data sesbírána, musí být na základě vzájemných odkazů vypočítána jejich relevance. Díky tomu pak Google při vyhledávání předloží stránky, které opravdu hledáte.

Jak vydělávat peníze

Mezi vyhledávači měl Google zpočátku velmi těžkou pozici. Mezi největšími rivaly byla i společnost Yahoo. V době založení Googlu, coby studentského projektu, byl již Yahoo velmi mocným rozšířeným vyhledávačem. Page a Brin potřebovali pro vývoj svého vyhledávače data, přesněji obrovské množství dat. Yahoo využívalo pro vyhledávání externí dodavatele a hledalo firmu, která by nabídla co nejlevnější vyhledávání na stránce Yahoo.com. Google využil situace a nabídl společnosti Yahoo podmínky, které byly pro Yahoo obchodně velmi výhodné. Nějakou dobu proto skutečně vyhledávání ze stránky Yahoo zajišťoval ve skutečnosti Google, který byl tehdy zcela neznámý.

Google však tímto způsobem získal něco, co pro něj mělo v té době mnohem větší cenu – data. Na obrovském množství dat mohl Google vylepšovat svůj vlastní algoritmus. Nikoho z Yahoo ani jiných velkých společností tehdy ani ve snu nenapadlo, že by Google mohl být pro samotnou společnost Yahoo nějakou konkurencí, natož že by jim v budoucnu vypálil rybník.

Vyhledávání fungovalo Googlu skvěle a prázdná stránka s jedním vyhledávacím políčkem si získala postupně neuvěřitelné množství uživatelů. Díky tomu, že Google investoval obrovské prostředky do vlastního hardwaru a dokázal tak za stejné výdaje pořídit podstatně větší počet serverů než konkurence, získal obrovskou výhodu. Vyhledávání bylo díky geniálnímu algoritmu velmi přesné a díky obrovské výpočetní síle i rychlé a aktualizované. Nyní ale bylo potřeba nějak začít vydělávat peníze. Geniální myšlenka pomohla Googlu poměrně rychle značně zbohatnout. Přitom nikdo v té době nevěřil tomu, že by zrovna tento model mohl představovat obrovské zisky.

Google začal prodávat textovou inzerci, která byla založena na podobnosti se samotným vyhledávaným výrazem. Pokud někdo zadal pro vyhledávání kupříkladu výraz Ford Escort, objevila se reklama na doplňky Ford a další související služby. Tento jednoduchý, ale geniální systém začal vydělávat obrovské peníze. Aniž by totiž musel Google vytvářet databáze zákazníků a snažit se odhadnout, do jaké cílové skupiny ten či onen uživatel patří, nabídl ke kliknutí reklamu vztahující se k něčemu, na co zrovna potenciální zákazník myslel.

Úspěšnost reklamy proto byla ještě mnohem vyšší než veškeré jiné typy internetové inzerce. Vezmeme-li navíc v úvahu, že v roce 2004 Google držel v ruce téměř 85% trhu s vyhledáváním (přesněji řečeno 84,7% vyhledávání se dělo ze stránek Googlu), neměl o výdělcích z reklamního systému nouzi. V témže roce také Yahoo ukončilo partnerství s Googlem a přešlo na vlastní vyhledávací systém. Už nikdy se ale nepodařilo kvality a oblíbenost Googlu dohnat, natož překonat. Stejně na tom byly i mnohé další společnosti, které se snažili ukousnout kus koláče trhu s vyhledáváním.

Internetová velmoc

Googlu se celou dobu velmi dařilo a díky nezvyklé neformální firemní kultuře se podařilo najmout spoustu geniálních odborníků z mnoha oborů informačních technologií a udržet si je. Velkou motivací zaměstnanců bylo a dodnes je neformální perfektně vybavené prostředí kanceláří Googlu, kde se mohou zaměstnanci odreagovat na každém kroku a pracovní prostředí přizpůsobit svým přáním.

Nejen v hlavním sídle, zvaném Googleplex, to vypadá spíše jako na hřišti nebo zábavném parku – jsou zde hřiště na hraní, kavárny, kulečníkové stoly, prostor pro jízdu na kolečkových bruslích až po bláznivé kouty geniálních programátorů, kteří jsou obklopeni například stovkami barevných míčků, hudebními nástroji, hračkami, lehátky, netradičním moderním nábytkem a spoustou osobních dekoračních předmětů. Prostředí, které vypadá jako školka pro dospělé nemusí každému vyhovovat, drtivá většina zaměstnanců ale mluví o Googlu jako o ráji na zemi.

Pobočka Googlu v KorejiPobočka Googlu v Koreji

Motivovaní zaměstnanci a manažerští vizionáři dokázali udržet společnost vždy krok napřed. Postupně tak Google kromě vyhledávání nabídl spoustu zajímavých služeb. Některé sám vyvinul, jiné nakoupil a ještě vylepšil. Důkazem může být například videoportál YouTube, který založili v roce 2005 zaměstnanci společnosti PayPal. Google zakoupil YouTube v roce 2006 za 1,65 miliardy dolarů, dodnes jej neustále vylepšuje a drží na úrovni nejúspěšnějšího videoportálu všech dob.

V současnosti Google nabízí několik desítek služeb, většinu z nich zdarma. Patří mezi ně například Google Dokumenty, Google Earth, Picasa, Gmail, Google Apps, Google Analytics a spoustu dalšího. Najdete mezi nimi i AdSense (majitelé webových stránek mohou přes tento systém umístit na své stránky reklamu a tím vydělávat peníze) a Adwords (způsob pro nákup cílené reklamy placené za prokliky bez ohledu na velikost rozpočtu).

ICTS24

Sergej Brin a Larry Page ale neusínají na vavřínech. Kdo jiný by si mohl vzít za úkol právě probíhající projekt, který se snaží naskenovat a nabídnout v digitální podobě všechny knihy světa? Ano, slyšíte dobře. Google již nějakou dobu vyvíjí a používá automatizovaná zařízení, která převádějí do digitální podoby celé knihy vypůjčené ze všech největších knihoven světa. Posouvá se tím blíže svému proklamovanému cíli zorganizovat všechny informace světa. Pochopitelně se tato aktivita setkala s bouřlivým odporem vydavatelů a nakladatelů, stejně jako například obavy nad nezaujatostí Googlu a bezpečím informací, které díky správě e-mailů a dalších služeb Google o svých uživatelích soustavně sbírá.

Google sám se navenek drží svého nejslavnějšího oficiálně neoficiálního proklamovaného hesla „Don't be evil“ (Nebuď zlý), které používal ve svých reklamních kampaních. O tom ale zase někdy příště. Nic to totiž nemění na tom, že dva studenti ze Stanfordu již dnes dobyli svět informací.