Seznam bude přesnější, už testuje nový indexovací robot

28. 4. 2011

Sdílet

 Autor: Redakce

Seznamáci vypustili indexovat nový fulltextový robot – zatím se tváří jako SeznamBot/3.0-beta. Na testovacím webu searchtest.seznam.cz teď prochází necelých 400 milionů stránek. Robot ještě není dokonalý, ale veřejný test má pomoci odladit chyby.

Seznam se soustřeďuje na:

  • Zcela chybějící domény. Pokud při hledání s operátorem site: (např. site:seznam.cz) není nalezena žádná stránka z domény.
  • Málo proindexované domény/počet zaindexovaných stránek pro jednotlivé weby. Odhad počtu vyhledaných stránek při hledání s operátorem site: by neměl být výrazně nižší než v současném hledání.
  • Chybějící navigační stránka, typicky hlavní strana webu. Na navigační dotaz chybí ve výsledcích ta jediná správná stránka (př.: dotaz konopiště -> chybějící HP konopiště)
  • Četnost návštěv robota na jednotlivých url. V přístupových lozích vašich webů lze porovnat periody návštěv současného a nového robota. Stránky, které se často mění, by měly být navštěvovány ve výrazně kratším intervalu než stránky neměnné.
  • Jakékoli další nesrovnalosti a nestandardní chování robota (ignorování návštěvních period, definic v robots.txt, meta tag noindex aj.).

Seznam.cz

bitcoin_skoleni

Reakce v diskuzi zatím nový index chválí i Seznam kategoricky odmítají. Faktem je, že robot se opravdu změnil. Na testovacím enginu najde na doméně .cnews.cz 46 539 stránek, zatímco standardní vyhledávač 56 322 stránek. Jen pro zajímavost, Google najde 87 200 výsledků a Bing 10 600. Jestli bude Seznam opravdu přesnější, si netroufám odhadnout. Subjektivně mám pocit, že odstranil více duplicitních výsledků, což je dobré pro koncového uživatele, ale už ne tak pro provozovatele :-).

Zdroj: Seznam