Přeskočit na hlavní obsah

Robot Google se zkouší ponořit do hlubokého webu, zůstává ale na povrchu

Robot Google se nově pokouší prokutat do částí Internetu, které byly dosud vyhledávačům a tudíž i většině uživatelů skryty (Deep Web). Podívejme se, co může způsobit tento krok. Informace, jak to bude přesně fungovat, se podle zdrojů liší. Podle blogu Google budou cílem robota rozevírací formuláře, které se někde používají například pro zeměpisnou navigaci. Ovšem není jisté, že se uživatelé dostanou k úplně novým informacím.

Doplň, zadej, hledej...
Nepůjde ovšem jen o rozevírací seznamy. Robot Googlu začne zaškrtávat různá políčka a klikat na tlačítka. Do volných políček bude Google zkoušet vkládat slova, která našel na stránce a zkoumat, jaká bude odpověď serveru (takže vlastně bude generovat třeba vyhledávací dotazy).
Google prohlašuje, že stránky, k nimž se takto dostane, nejdřív porovná se svojí databází. Pokud narazí na rozdíl, bude se stránkou dále pracovat. Jak se dál takový obsah nebo stránka bude řadit ve výsledcích vyhledávání, to ale zatím není příliš jasné.
Co se stane v případě výsledků vyhledávání? Tady robot najde stránku, kterou téměř jistě v databázi nemá. Takto by množství stránek v databázi vyskočilo explozivně prakticky k nekonečnu, bez toho, že by se uživatelé dostali k nějakému novému obsahu, Google si to jistě nějak ošetří.
Robot nezahltí vyhledávání a zkusí jen slova přednostně se objevující na stránce. Výsledek bude prostě mix „běžného“ obsahu

Hluboký web: co všechno obsahuje?
Vypadá to tedy, že konkrétně tento krok asi žádný zvláštní význam mít nebude. Deep web výrazně objemem dat přesahuje to, co vyhledají vyhledávače (až tisíckrát).
Wikipedie popisuje i první pokusy vyhledávačů nějak indexovat tu část pavučiny, na kterou nevedou hyperlinky. Uvádí se zde pokus Yahoo Subscription v roce 2005, kdy bylo poprvé umožněno robotovi indexovat i obsah jinak určený jen předplatitelům. Zmíněn je zde také vyhledávač přímo specializovaný na přístup k deep web (ScienceGov) a další projekty tohoto druhu.
Do deep web se dá zařadit celá řada obsahu různého typu. Technické chyby, kdy je namísto hyperlinku použit formulář, nebo nějaký javascriptový či flashový fígl jsou jen jednou a nejspíš zanedbatelnou částí tohoto bezedného prostoru. Najdeme zde placené stránky, nebo obsah ve formátech, který vyhledávače nejsou schopny indexovat. K části deep webu by jistě rády získaly přístup vlády, hlavně když jde o aktivity skryté záměrně pro svůj kriminální obsah.
Kromě toho, že slušný robot by neměl indexovat data, kde si to uživatelé nepřejí, je velká otázka, zda by pak vyhledávač uživatelům mohl poskytnout lepší služby.
(Petr Mynařík)
Zdroj: www.lupa.cz

Komentáře

Populární příspěvky z tohoto blogu

Získejte zdarma reklamní kampaň v Google AdWords

Studenti VŠE v rámci předmětu Marketing na internetu se letos opět zúčastní celosvětové soutěže Google Online Marketing Challenge. Této soutěže se studenti úspěšně účastní již od roku 2008. O čem je celá tato akce? Studentské týmy připraví  pro zvolenou firmu reklamní kampaň v Google AdWords, tuto kampaň pak následně po dobu tří týdnů optimalizují a v závěru zhodnotí její výsledky. Rozpočet, se kterým pracují, je ve výši 250 USD, tedy asi 4 750 Kč. Pokud máte web, který nejméně 6 měsíců přes Google AdWords nebyl propagován, můžete ho nabídnout studentům pro účely této soutěže a získat tak třítýdenní kampaň v hodnotě 250 USD včetně její přípravy a následné správy zdarma. Web samozřejmě musí vyhovovat obecným podmínkám inzerce v Google AdWords. Své návrhy můžete s kontaktem vkládat do komentářů tohoto článku, popř. je zaslat na adresu stritesv [at] vse.cz Studentské týmy si zpravidla několik webů z poskytnutých návrhů vyberou. Firma se účastí v soutěži k ničemu dalšímu nezavazu

Virál Kofoly byl velmi úspěšný

Vánoční přání, které do e-mailů nosili andělé z Kofoly, se letos o Vánocích stalo hitem. Ještě 14 dnů před Vánoci bylo odesláno kolem půl milionu elektronických pohlednic. Bilance po svátcích? Češi si mezi sebou poslali více než 1,5 milionu vánočních přání z dílny agentury Advertures – statisticky vzato každý šestý obyvatel Česka dostal nebo poslal ze stránek kofola.cz přání, které do e-mailů nosil anděl z Kofoly. Zdroj: www.istrategie.cz

Nejlepším webem je letos DonorsChoose

Internetovou stránkou letošního roku vyhlásil americký týdeník Time web DonorsChoose.org, která zprostředkovává tok dobrovolných finančních příspěvků soukromých dárců do amerických škol. Mezi pět nejhorších stránek v USA naopak Time překvapivě zařadil populární společenský server MySpace. Time oceňuje každoročně stránky výjimečné svým stylem a propracovaností, nabízející vylepšený přístup k webu a jinak celkově obohacující život na síti. Z takzvaných společenských sítí, které slouží ke komunikaci a výměně materiálů mezi přáteli, se nejvýše, jako celkově druhá, umístila stránka StumbleUpon.com a hned za ní podobně zaměřená LinkedIn.com. Time rovněž připomněl seznam 25 nejznámějších stránek, bez nichž si již život řada lidí neumí představit. Mezi nimi je internetové knihkupectví Amazon.com, encyklopedie Wikipedia.org, aukční síň eBay.com, zpravodajství bbc.co.uk, sportovní kanál ESPN.com, vyhledávač Google, videoserver YouTube, oficiální portál americké vlády USA.gov nebo server Yahoo.