Počátky internetu sahají 50 let do historie, web je zhruba o 20 let mladší. V minulosti se tyto termíny striktně oddělovaly, dnes jde tak trochu o synonyma. World Wide Web totiž vznikl jako jedna ze služeb internetu vedle e-mailu, souborových úložišť (FTP), diskuzních skupin (Usenet) nebo vzdáleného přihlašování (Telnet). Každá z těchto služeb dříve potřebovala vlastní program, v současnosti však většina internetových služeb má i webové rozhraní a bude vám k němu stačit prohlížeč.
Obšírný úvod je důležitý pro hlavní témata tohoto článku. Jsou jimi různé druhy webu, potažmo jiných internetových služeb, které ale skrz web můžete navštívit. World Wide Web připomíná ledovec. To, co je nad hladinou, tvoří jen menší část celé masy. Odborníci onu špičku nazývají povrchovým (surface) webem. Pod vodou je několikanásobně větší část označovaná jako hluboký nebo neviditelný (deep či invisible) web. A ještě někde pod tím v oblasti Mariánského příkopu, nebo možná pekle, najdeme temný (dark) web.
Surface web
Jak se definuje to, co je na povrchu? Jde o všechen obsah, ke kterému mají přístup běžné vyhledávače. Jejich web crawlery (internetoví boti) navštěvují stránky, na nich vyčtou všechny odkazy, ty znovu navštíví, prohledají odkazy atd. Do databáze (tzv. indexu) pak zapíšou adresu stránky a to, co se na nich nachází.
Když pak přes Google, Bing, DuckDuckGo nebo Seznam vyhledáte datum narození T. G. Masaryka, ve výsledcích pak uvidíte všechny relevantní veřejně dostupné stránky, které se týkají daného tématu. Jen Google indexuje stovky miliard stránek. Takto vysoké číslo dle odborníků tvoří jen asi 4 % celého webu. Zbylých 96 % patří do skupiny hlubokého nebo temného webu.
Deep web / invisible web
Pojmy surface a deep web v roce 2001 vymyslel Michael Bergman ve studii The Deep Web: Surfacing Hidden Value. V ní upozornil na to, že Google nebo Altavista vidí jen onu špičku ledovce a většina informací uložených online se v jejich indexech nenachází.
Má to několik důvodů. Web může mít příliš složitou strukturu, než aby ji robot dokázal pochopit. Server také může běžet na špatném nebo jen dočasném připojení, takže robot indexování vzdá, nebo se při procházení netrefí do doby, kdy je stránka online.
Provozovatel webu ale může roboty rovnou vyhodit dveřmi. Existuje tzv. robots exclusion standard, jde o textový soubor robots.txt uložený v kořenovém adresáři serveru, ve kterém jsou zapsány instrukce, podle nichž správce robotům řekne, které části webu (ne)mohou indexovat. Slušné vyhledávače se těchto pravidel drží. Archive.org ale před rokem začal tento soubor ignorovat, protože archivování stránek škodí.
Pod deep web patří i informace dostupné jen pro někoho. Typicky půjde o vše, co je uloženo ve vašich účtech chráněných pomocí hesel. Všechny e-maily, soukromé soubory v Dropboxu, chaty v Messengeru, bankovní účty, úřední dokumenty atd.
TIP: Symantec ochrání i pračku a dětskou chůvičku. Uvádí svůj první Wi-Fi router
Aktuálně se deep web plní obsahem i bez vědomí uživatelů. A kvůli rostoucímu internetu věcí bude hůř. Na vině jsou špatně zabezpečené mobily a počítače, případně děravé firmwary síťových tiskáren, routerů, IP kamer nebo NASů. U těchto zařízení typicky chcete mít všechno utajené v soukromí, jenže zákeřní hackeři dokázali zneužít softwarové chyby a k vašim datům přistoupit na dálku.
Dark web / darknet
Termín dark web se začal používat od roku 2009 v souvislosti s rozmachem nových P2P sítí jako Tor, I2P nebo Freenet. Jde o šifrované a anonymní sítě (tzv. darknet) fungující uvnitř internetu, na kterých běží vlastní služby a obsah nepodléhající cenzuře, ale ani zákonům.
S Torem se to má podobně jako s BitTorrentem. Jde o progresivní neškodnou technologii zneužívanou pro nelegální účely. Přes torrenty se sdílí autorsky chráněný obsah, přes Tor se lze dostat i k horším věcem. Dark web má v Toru i vlastní doménu nejvyššího řádu .onion, kterou běžné DNS servery vůbec neznají.
Na dark webu si uživatelé vyměňují hacknuté databáze, dětskou pornografii, prodávají se falešné identity, údaje z platebních karet, ilegální léky, drogy, zbraně nebo rovnou domlouvají vraždy. A platí se anonymními kryptoměnami.
Asi nejznámější stránkou dark webu je, nebo spíš byla, Silk Road (hedvábná stezka). E-shop s nelegálním zbožím fungoval dva a půl roku, než jej FBI na podzim 2013 nechala odstavit a jeho zakladatele Rosse Ulbrichta zatknout kvůli kyberzločinům a praní špinavých peněz. V dobách největší slávy bylo na černém trhu k prodeji 10 000 různých produktů, dvě třetiny z toho tvořily drogy.
V roce 2014 nechaly FBI s Europolem odstavit druhou verzi Silk Road. Její správce Brian Farrell dostal osmiletý trest. Provinil se tím, že sám prodával kokain, heroin a metamfetamin.
Jak se dostat na deep web?
Jak jsme psali výše, slušné vyhledávače se řídí pokyny v souboru robots.txt a neprohledávají stránky, u nichž si to webmaster nepřeje, přestože jsou veřejně dostupné i bez hesla nebo nějakého zvláštního programu. Jisté, ještě drzejší, vyhledávače ale rovnou skenují IP adresy, ověřují otevřené porty a zkoušejí, co se dá ze vzdálených počítačů dostat.
- pipl.com: Vyhledávač lidí, eviduje jich přes 3 miliardy, sleduje jména, přezdívky, telefonní čísla a e-mailové adresy. Přes telefonní číslo jsem se dostal až ke svému profilu (skrytém mezi jmenovci).
- insecam.org: Vyhledávač děravých IP kamer, v databázi je několik tisíc živých přenosů, jen v ČR skoro 400 kamer. Řada z nich umístěná na soukromých pozemcích nebo v domech. Jsou tam ale i „veřejné“ kamery v parcích, na koupalištích apod.
- shodan.io: Asi nejpokročilejší vyhledávač. Můžete v něm zjistit otevřenost konkrétních portů, vyhledat konkrétní typy kamer, počítačů apod. Přes parametr has_screenshot:true uvidíte všechna zranitelná místa, která vysílají nějaký obraz. Jde o kamery, ale také vzdálené plochy přes protokol RDP.
- deep-web.org: Velký přehled různých specializovaných vyhledávačů a zdrojů o deep webu.
Jak se dostat na dark web / darknet?
Ne, v tomhle vám opravdu radit nebudeme. ;-)