Jan Wagner: Google, Google, Google, ještě jednou Google: vyhledávač stokrát jinak

pondělí 12. června 2006 ·

První službou Google, kterou se budeme zabývat, je vlastní vyhledávání. Nemusí jít nejen o prohledávání textů nebo titulků na webových stránkách, ale také obrázků podle popisků, diskusních skupin nebo souborů v nejrůznějších formátech. S vyhledávačem jsou spojeny samozřejmě i reklamní služby, které Google živí…

Jak vlastně vyhledávače či Google pracují? Aplikace nazývaná Googlebot cyklicky žádá o aktuální verze všech webových stránek, které má zařazeny ve své databázi. Pokud ale na nějaké stránce nalezne hypertextový odkaz na dosud neznámou stránku, přidá si ji do databáze a tedy i mezi pravidelně sledované. Načtené stránky Googlebot ukládá do svého archívu, ve kterém je pak analyzuje a indexuje, čímž umožňuje jejich rychlé prohledávání při vlastním vyhledávání. To vše zajišťuje stále rostoucí serverová farma se zhruba tisícovkou racků s mnoha desítkami tisíc počítačů s více než stovkou tisíc GB operační paměti a tisíci TB diskového prostoru…

Pro hodnocení stránek, které odpovídají zadanému hledanému výrazu, používá Google originální algoritmus nazývaný PageRank, který byl na počátku jeho úspěchu. Ten spočívá v tom, že se pro každou indexovanou stránku rekurzivním postupem vypočítá specifická hodnota, závislá na tom, kolik a jak významných stránek na tuto stránku odkazuje. Často odkazované stránky jsou považovány za významější, takže jsou ve výsledcích vyhledávání uvedeny na předních místech. Kromě tohoto základního kritéria používá Google řadu dalších, z nichž některé jsou z pochopitelných důvodů tajeny. Bohužel Google umožňuje i cenzuru, o čemž svědčí nedávná dohoda s čínskou komunistickou vládou. Google dokáže indexovat nejenom textové a HTML stránky, ale také dokumenty ve dvanácti dalších formátech, jako jsou PDF, PostScript, MS Word, MS Excel nebo Flash).

Rozhrání vyhledávače je lokalizováno i do češtiny. Všimněte si aktuálního obrázku, kterým Google pravidelně reaguje na významné události či výročí.

Pro způsob zadávání dotazů do vyhledávače Google je potřeba připomenout začátečníkům několik bodů:

  • Google ignoruje velikost písmen, podobně jako MS Windows v názvech souborů.

  • Při zadání více slov do dotazu je automaticky předpokládána logická funkce and, tedy a zároveň, při vyhledávání.

  • Z dotazu jsou automaticky vyřazeny obecná slova jako who nebo how, dále jednopísmenná slova nebo číslice.

  • Pokud potřebuje zadat výraz, který je běžně vyřazován, můžete ho zahrnout operátorem +, například +who. Další variantou je zadání celé přesné fráze v úvozovkách.

  • Podobně můžete využít i operátor -, kterým můžete vyřadit z výběru stránky, které obsahují určené slovo, například takto -who.

  • Tlačítko Zkusím štěstí slouží k přímému přechodu na stránku s největší relevancí. Pokud tedy zadáte do okénka pro dotaz Česká škola, dostanete se na naši home page.

  • Logický operátor OR (nutno psát velkými písmeny!), neboli nebo, umožňuje vyhledávat stránky, kde se vyskytuje jeden ze dvou zadaných výrazů (např. Praha OR Brno).

  • Operátor site: umožňuje hledání jen v zadané doméně, například site:ceskaskola.cz.

Seznam všech operátorů najdete v nápovědě Google.

Na stránce výsledků hledání se mohou vpravo zobrazit takzvané sponzorované odkazy, jeden ze zdrojů příjmů Google (služba AdWords).

Zároveň můžete reklamu zobrazovat na svých stránkách a také můžete využít vyhledávač k nabídce vyhledávání na vlastních stránkách.

I okno pokročilého vyhledávání Google je lokalizované, vysvětlovat jednotlivé volby snad není třeba.

Existuje ale ještě celá řada speciálních vyhledávání:

Vyhledávač Google umožňuje také nastavení několika parmetrů pro hledání a výstup výsledků:



Jan Wagner

0 komentářů:

Články dle data



Učitelské listy

Nabídka práce

Česká škola - portál pro ZŠ a SŠ

Česká škola poskytuje svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce České školy a jsou uveřejňovány jako podnět k dalším diskusím.

Obsah článků nemusí vyjadřovat stanovisko redakce nebo vydavatele Albatros Media, a.s.


Všechna práva vyhrazena.

Tento server dodržuje právní předpisy
o ochraně osobních údajů.

ISSN 1213-6018




Licence Creative Commons

Obsah podléhá licenci Creative Commons Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česká republika, pokud není uvedeno jinak nebo nejde-li o tiskové zprávy.



WebArchiv - archiv českého webu



Tyto webové stránky používají k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Informace o tom, jak tyto webové stránky používáte, jsou sdíleny se společností Google. Používáním těchto webových stránek souhlasíte s použitím souborů cookie.