Kauza Bingle aneb jak Bing (ne)kradl výsledky Googlu

Sdílet

 Autor: Redakce

Zločin a veřejná pomluva

Událostí týdne je přestřelka mezi Googlem a Microsoftem. Včera proletěla médii zpráva, že Bing krade výsledky z vyhledávače Google. Tvrdí tak sám internetový hegemon na základě vlastních testů. Microsoft vše popřel. Takže kde vlastně leží pravda? Někde uprostřed, tak jako vždy.

Obsáhlou zprávu nejdříve přinesl magazín SearchEngineLand. Zanedlouho ale reagoval samotný Google a na svém blogu oficiálně nařkl Microsoft z podvodu. Přitom za vším stojí náhoda. Prý někdy v létě testovali lidé z Googlu vlastní opravný slovník při psaní špatných výrazů. Komplikované slovo „tarsorrhaphy“ (jistý druh operace očních víček) rozpoznal slovník Googlu i pod špatně zadaným výrazem „torsorophy“. Bing na zkomoleninu nereagoval žádným odkazem. Až později byl výrazy vyhledán také Bingem, bez opravy slovníkem a ještě k tomu našel stejné odkazy jako Google.

torsoraphy tarsorrhaphy[torsoraphy] tarsorrhaphy podle Googlu

torsoraphy tarsorrhaphy[torsoraphy] tarsorrhaphy podle Bingu

Google nastražil falešné výrazy

V říjnu 2010 pozoroval Google více podobných případů, prý to nemohla být náhoda, že se výsledky nesmyslných výrazů neliší. Proto vytvořil stovku falešných výrazů (honeypot, viz obrázek), aby mohl kopírování Bingu zdokumentovat. Takže nasypali zrní do klávesnice a nechali slepici, ať se činí. (Vtip.) Každému smyšlenému výrazu byly přiřazeny URL reálných stránek, na kterých se takové slovo nikde nevyskytovalo, a ostatní vyhledávače jej proto nemohly indexovat.

Google honeypotPak dvacet zaměstnanců dostalo notebook s čerstvou instalací Windows, na kterém běžel Internet Explorer 8 a lišta Bingu (Bing Toolbar). Důležité je, že IE8 měl povolenou funkci Navrhované weby (suggested sites).

No a po čase se některé z výrazů dostaly z ničeho nic také do Bingu. Google neuvádí přesný počet, všechny to prý nebyly, ukázal to jen na pár výrazech. Např.

  • hiybbprqag
  • delhipublicschool40 chdjob
  • juegosdeben1ogrande
  • mbzrxpgjys
  • indoswiftjobinproduction

Dnes už je nemá cenu vyhledávat, experiment skončil a vyhledávače už je stihly indexovat a přiřadit k webům, které o kauze taktéž informují.

Google je uražen, veřejně pomluvil Bing, protože se podle něj přiživuje na výsledcích jiného. Google na vyhledávacím enginu dělá několik let a ještě nerecykloval výsledky konkurence. Jen mu není jasné, jestli za to může Bing Toolbar (odesílá data v rámci programu „Zlepšování softwaru a služeb na základě zkušeností uživatelů“) nebo Navrhované weby, které analyzují historii prohlížení a podle toho uživatelům nabízejí podobné stránky.

Reakce Microsoftu

Microsoft kopírování rezolutně popírá. Šéf Bingu – Stefan Wietz – prostřednictvím nejnadšenější blogerky Mary-Jo Foley tvrdí: „We use multiple signals and approaches in ranking search results.  The overarching goal is to do a better job determining the intent of the search so we can provide the most relevant answer to a given query. Opt-in programs like the toolbar help us with clickstream data, one of many input signals we and other search engines use to help rank sites.“ Ve zkratce: používají několik zdrojů a vzorců (asi 1000), podle kterých vyhodnocují výsledky a pořadí na stránce. K tomu jim pomáhají volitelné (opt-in) programy, jako je třeba lišta Bingu. Takže Google na to kápnul, ale jedná se o vykrádání?

hiybbprqaghiybbprqag podle Googlu

hiybbprqag
hiybbprqag podle Bingu

Dnes podal oficiální vysvětlení také Yusuf Mehdi, senior vice president online divize Microsoftu. V podstatě se shoduje s výše zmíněným. „Nekopírujeme výsledky žádného z našich konkurentů. Tečka.“

Naopak se opřel do Googlu s tvrzením, že manipuluje s výsledky tzv. fraud click (podvodné kliknutí). Toho využívají spammeři a manipulátoři s reklamou. A Google tím vlastně nic nedokázal, protože použil uměle vytvořených postupů. A ještě dodává, že poslední dva roky tvrdě pracovali, přinesli několik funkcí, z nichž několik okopíroval naopak Google. Ale nevedli proti němu žádnou válku, protože prý mají radost z toho, že udávají tempo a směr vývoje.

Frank Shaw, hlavní PR Microsoftu, na Twitteru uvádí, že Google touto akcí pouze odvádí pozornost od vyšetřování úřady USA a EU, podle kterých prý manipuluje s výsledky. Web WorldTech24 zaznamenal tweetovou přestřelku mezi zástupci Googlu a Microsoftu.

Komentář

Jak je uvedeno v perexu, pravdu mají oba. Tak trochu. Google je nařčením z vykrádání dost tvrdý. Bing totiž nekrade přímo jeho výsledky (kdyby každý dotaz směřoval zároveň na Google, už by na to přišli dávno), ale pouze využívá jeden z tisíců zdrojů (kterým byl Google, ale může jím být i Altavista, vyhledávač IMDb, zkrátka cokoliv, co používají uživatelé IE). V případě Googlu je to buď lišta Bingu nebo Navrhované weby, oba však pouze anonymně sledují chování uživatelů, aby Bing mohl podávat relevantnější výsledky. Google to samé činí třeba s nástrojem Analytics, také má přehled, které weby navštěvujete. V případě Bingu můžete tyto volby vypnout, kód Analytics musíte zrušit složitěji.

Google tím navíc prokazuje Bingu velkou službu. Nepřímo přiznává, že i na chybné výrazy si časem najde vzorec a zobrazí třeba relevantní stránky. To je také jediné, co koncového uživatele musí zajímat. Nebo používáte oblíbený vyhledávač z jiného důvodu, než že hledá lépe než ostatní? Tím neříkám, že Bing je lepší (sám jej používám jen pro hledání obrázků a fotek). Ale ukazuje se, že anonymní sledování aktivity přináší výsledky. Takže Bing dostal pěknou reklamu.

bitcoin_skoleni

Navíc s oním kopírováním si nemá ani jedna strana co vyčítat. Jen za poslední rok dva bylo těch nápadných inspirací několik:

Zdroj: Google (včetně obrázků), Bing, SearchEngineLand