Webové encyklopedie: znalosti lidstva na síti

27. 5. 2011

Sdílet

 Autor: Redakce

Wikipedia je tu 10 let, kdo převezme štafetu?

Každý počítačový uživatel se s ní už setkal. Wikipedia v nouzi ráda poradí – při vyhledávání mnoha termínů vyskakuje mezi prvními odkazy. V Googlu stačí za hledaný termín přidat magické slůvko „wiki“ a hned dostanete všechny relevantní encyklopedické odkazy. Jaký by dnes byl svět bez elektronické studnice lidského vědění je těžké si představit.

Všechno nejlepší

Projekt Wikipedia vnikl v roce 2001, v lednu tak oslavil své desáté narozeniny. Vyvinul se z encyklopedie Nupedia, která byla tvořena jen pro odborníky. Wikipedia byla odlišná právě tím, že ji mohl upravovat každý – to je základní rys všech wiki projektů. Ten pochází dokonce už z roku 1995 z projektu WikiWikiWeb (který dodnes existuje). Odborníci, kteří editovali obsah na Nupedii, však od takového projektu dali ruce pryč. Proto se od Nupedie oddělil samostatný web – Wikipedia. Více v článku o jejím zakladateli Jimmym Walesovi.

Wikipedia
Wikipedia loni výrazně změnila design

Obavy o nízkou kvalitu článků se nakonec ukázaly liché, kolem Wikipedie se začala tvořit komunita dobrovolných autorů – díky promyšlenému systému kontroly se dodnes daří udržovat laťku velmi vysoko. Přesto se čas od času objeví ohnivá diskuze ohledně zpřísnění podmínek přispívání – většinou poté, co některý uživatel přidá na Wikipedii nepravdivý či urážlivý obsah. (Ten je pak samozřejmě velmi rychle zeditován.) Úplný zákaz vkládání obsahu pro nové uživatele by vedl k ochromení a zásadnímu zpomalení celého systému, proto k němu zřejmě nikdy nedojde.

Čas od času se tak budou objevovat známky vandalismu, problémy jsou také s nepřesnostmi, jejichž autor to nemyslel zle. Drtivá většina článků na Wikipedii je však velmi kvalitních – nedávný test magazínu Nature srovnal 42 článků z Wikipedie a z placené encyklopedie Britanicca za pomoci odborníků z příslušných oborů. Výsledek? Kvalita je zhruba srovnatelná.

Kvalita Wikipedia a placené encyklopedie Britannica je podle testu magazínu Nature srovnatelná

Wikipedii tak dnes jako zdroj používají mnohá média i odborníci, požívá respektu velké autority v mnoha oborech. Zásadní je, že sdružuje na jednom dobře dostupném místě přesná data o mnoha oborech – ačkoli informační kanály odborníků bývají často přesnější. Všechny články jsou navíc publikovány pod svobodnými licencemi, pokud tedy dodržíte pravidla a výsledek patřičně odzdrojujete, můžete volně kopírovat a upravovat všechny texty a většinu obrázků. To je samozřejmě velmi lákavé – není divu, že je Wikipedie osmou nejnavštěvovanější stránkou na internetu.

Chceme video!

Wikipedia nabízí ohromné množství informací v co nejpřehlednější formě, v 21. století to však nemusí být dost. Hlavním informačním kanálem mladých lidí je YouTube, světu vládne audiovizuální komunikace – důležitý je zejména obraz a zvuk. Tvůrci Wikipedie se tak snaží v poslední době přidávat více obrázků a videí a zvukových stop. Tam se ale jednak setkávají s problémy v oblasti autorských práv, navíc se stále jedná jen o obsah „přilepený“ k textu.

" width="425" height="349" frameborder="0">

Proto se očekává nástup nové generace multimediálních encyklopedií – první ukázkou tohoto trendu je projekt Qwiki. Ten z běžně dostupných encyklopedických materiálů dokáže generovat zdání multimediálního obsahu – pomocí strojově předčítaného textu a dynamické prezentace fotografií. Takové řešení se ideálně hodi pro nejrůznější informační kiosky, je zřejmě jen otázkou času, než takovéto projekty začnou nativně podporovat např. televizory.

Dalším trendem jsou projekty, které pro vás informace nějakým způsobem upravují. Za zmínku stojí určitě encyklopedie Wikidi kombinující slova wiki a dictionary (slovník). Místo rozsáhlých článků na daná témata dostanete na svoji otázku odpověď v podobě stručných slovníkových hesel, která vás případně rovnou navedou dál.

Všechny knihy na jednom místě

Alexandrijská knihovna

Wikipedie v podstatě dokonale reprezentuje západní kulturu. Používá nejnovější technologie k tomu, aby shromáždila a zachovala veškeré lidské vědění – sen který se snažili uskutečnit mnozí velikáni lidské historie. Nikdy se však nejednalo o hnutí „zespodu“ tedy z lidu – proto je tento počin tak výjimečný a také dlouhodobě udržitelný. Wikipedie vlastně vychází z demokratických principů – každý má právo přidat příspěvek, většina pak odsouhlasí jeho finální podobu.

Alexandrijská knihovna
Shromáždit veškeré vědomosti lidstva se rozhodl už Ptelomaios I. Google to teď zkouší elektronicky

Jde tady hlavně o objektivitu, pravdu a dostupnost všech informací celému lidstvu – také proto je trnem v oku některým nesvobodným režimům; např. v Číně byla sice cenzura částečně zrušena, některé hesla (jako Tibet nebo náměstí Nebeského klidu) jsou však stále blokována. Pro Wikipedii je ale životně důležitá komunita kvalitních dobrovolníků, kteří ji udržují aktuální a přesnou.

Ve svém snažení o shromáždění a zachování informací všehomíra ale není Wikipedie sama. Povinně musíme zmínit kontroverzní projekt Google Books. Internetový gigant se rozhodl naskenovat a zdigitalizovat všechny knihy světa. Knihy je vyhladávačem Google možné prohledávat, seznam knih najdete na webu books.google.com.

To se samozřejmě nelíbí vydavatelům, kteří to vidí jako nelegální sdílení autorsky chráněného obsahu v obřím měřítku – Google se hájí tím, že se pouze snaží zaindexovat každou dostupnou informaci. Knihy chráněné copyrightem na Google Books samozřejmě nejsou dostupné v plném znění (k dispozici jsou pouze ukázky), některé z nich jsou k dispozici k zakoupení na Amazon.com. Vydavatelé se pravidelně pokoušejí s Googlem soudit, zatím naštěstí neúspěšně. Jedná se totiž o velmi užitečnou službu, která se snaží lidstvu primárně sloužit.

Google Books
Google Books

Při snaze zpřístupňovat vědomostí veřejnosti se obecně často naráží na problémy. Ať už je to problematika legálnosti (WikiLeaks) nebo trable s autorskými právy. Na druhou komplikaci narážejí nejčastěji univerzity – studenti potřebují přístup k velkému množství odborných publikací. Všechny si nemohou dovolit ani oni, ani jejich školy. Přitom mnoho odborníků by své práce rádo publikovalo zdarma, minimálně pro akademické účely. Ve většině vyspělých zemí to však není možné legislativně – vydavatelská lobby za pát set let existence udělala své. Tato situace pak zbytečně zpomaluje vývoj a komplikuje další výzkum.

Nenoste to v hlavě

Snadná dostupnost všech podstatných informaci na webu také rozdmýchává další debatu: memorovat, nebo učit vyhledávat? Veškeré lidské znalosti již dávno není možné obsáhnout, proto přichází na řadu úvaha, zda by nebylo lepší začít děti už odmala učit to, jak efektivně vyhledávat, třídit, jak poznat objektivní informace, jak efektivně informace vytvářet a šířit a jak pracovat se zdroji.

Je samozřejmé, že základní vědomosti jsou nutné k tomu, abychom se ve světě dokázali orientovat. Pokud se poté zabýváme určitým konkrétním oborem, hodí se mít všechny věci v hlavě – zefektivní to naši činnost. Opravdu je ale nutné, aby každý školák věděl, kolik uhlí se ročně vytěží v Mozambiku, když si tuto informaci může v případě potřeby najít do deseti vteřin na chytrém mobilu – navíc bude tato hodnota přesnější, než číslo, které si učitel pamatuje ještě ze studií? (Pro většinu operačních systémů na chytré mobilní telefony dnes existuje speciální aplikace pro snadné prohlížení Wikipedie).

Nemožnost efektivně a legálně sdílet odborné články na univerzitách zbytečně komplikuje výzkum

Je ironické, že sama Wikipedie ve vyhledávání zrovna nevyniká – pokud hledáte nějaký komplikovanější pojem, který na Wikipedii nemá samostatný článek, je daleko lepší využít externí vyhledávač (ideálně do Googlu zadat dotaz ve formátu „heslo wiki“). Rychle dostupné vědomosti všeho druhu posouvají naši společnost kupředu rychleji, než si možná myslíme. Zdarma dodávají know-how, už také není tak snadné lidi oblelhat a ošidit. Vše se dá velmi rychle ověřit a to je pro společnost vždy zdravé. Bude tedy jistě velmi zajímavé sledovat, jakým směrem se bude práce s informacemi v tomto století vyvíjet.

Knihy luští reCaptcha

Captcha je způsob ochrany webových stránek – pokud chcete přidat příspěvek do diskuze či založit nový účet často se setkáte s formulářem, který vás nutí opsat text z podivného obrázku do textového políčka. Pokud jste se někdy podivovali proč tomu tak je, vězte, že se jedná o metodu, jak poznat že jste člověk nikoli robot produkující spam. Počítačové algoritmy totiž zatím nejsou v rozeznávání deformovaných textů natolik dobré.

reCaptcha

ICTS24

Právě toho využívá Google ve svém projektu reCaptcha. Jedná se o volně dostupný, kvalitní Captcha modul, který můžete zdarma používat na svém webu. Místo náhodně generovaných rébusů ale luštíte slova z Google Books, které nemůže OCR program rozeznat. Podílíte se tak na digitalizaci celosvětové knihovny. Dumáte-li nad tím, jak program pozná, že jste slovo rozluštili korektně? I na to mají vývojáři z Google chytrý trik. V první řadě luštíte dvě slova – jedno, které je známé, druhé které je potřeba rozlousknout. Podle toho se pak zařadíte do skupiny luštitelů, kteří známé slovo rozluštili správně či ne. Výsledky neznámého slova  od úspěšných uživatelů se pak porovnají, a pokud panuje dostatečně velká shoda, slovo je považováno za rozluštěné.  


Příští týden se podíváme na nejzajímavější webové encyklopedie, které nejen použí, ale také pobaví.