Přeskočit na hlavní obsah

Leží budoucnost vyhledávání v rozpoznání řeči?

Společnost Google v posledních měsících pracuje na dalších možnostech, jak umožnit vyhledávání ve všech dostupných médiích a přistupovat k těmto službám pomocí nových uživatelských rozhraní. V tomto článku budou představeny dvě zajímavé technologie – hlasové vyhledávání a služba „Google Audio Indexing“.
Hlasové vyhledávání se uskutečňuje přes mobilní telefony, kdy volající vyvolá službu Google a hlasem zadá svůj vyhledávací dotaz. Tato na letošním Web 2.0 Expu v San Francisku představená technologie navazuje na službu, která byla již v roce 2002 pozastavena. Je sice pravda, že hlasové vyhledávání bylo zpočátku málo efektivní, neporadilo si ani s britským akcentem a dodnes nepodporuje jiné jazyky než angličtinu, ale tyto počáteční potíže lze eliminovat. Umělá inteligence hlasového vyhledávání totiž zlepšuje své rozpoznávací algoritmy počtem používání. Plyne to z prohlášení inženýrů Googlu, kteří prohlásili, že spuštění služby na iPhonu, a tedy zvětšení počtu uživatelů, zvýšilo přesnost rozpoznání hlasu v prvních dnech o 15%. Z toho plyne, že rozpoznání řeči je samoučící se systém, který neustále zlepšuje výsledky hlasového vyhledávání. Největší výhodou hlasového vyhledávání je fakt, že je dobrým uživatelským rozhraním pro telefony, kde je v porovnání s osobním počítačem poměrně obtížné zadávání dotazů. Tato služba Googlu ovšem není dostupná na všech mobilních telefonech, zatím ji podporují pouze iPhone, T-Mobile G1, mobilní telefony s operačním systémem Android od Googlu a smartphony Blackberry. Analytici odhadují, že potenciál hlasového vyhledávání je díky rozšíření mobilních telefonů na světě obrovský a může představovat strategickou konkurenční výhodu oproti konkurentům Microsoft a Yahoo.
Další službou, na které Google zatím pracuje, je vyhledávání obsahu ve videích. Služba se jmenuje „Google Audio Indexing“ a její betaverze je dostupná na stránkách http://labs.google.com/gaudi. Služba umožňuje zadat hledaný výraz do klasického vyhledávacího pole a jako výsledek vrátí videa politických proslovů, které se nacházejí na serveru YouTube, a ve kterých je hledané slovo používáno řečníkem. Tato služba je postavena na původně doplňkové aplikaci pro iGoogle, kdy bylo možné porovnávat proslovy kandidátů na amerického prezidenta ohledně zadaných témat. Tento doplněk se stal velmi oblíbeným, a proto došlo k rozšíření na další videa a k vývoji samostatné webové služby. Ta relevantní videa najde podle popisu v metadatech, podle výskytu hledaného slova v samotném mluveném videu a podle počtu odkazů na videa. Služba je zatím dostupná jen jako betaverze, a proto má problémy s rozpoznáváním slov a není schopná řešit otázku homonym. Jedná se ovšem o velmi slibnou technologii, která v budoucnu umožní i hledání pasáží uvnitř videa, které se týkají tématu. Navíc „Google Audio Indexing“ umožní sdílení výsledků hledání a časem rozšíří svá témata i o nepolitická videa až bude mít oindexované všechny videa na webu. Google tím vedle již běžného textového vyhledávání bude v blízké budoucnosti možná i schopen přidat do svého „portfolia“ i obsah videí, čímž by znovu mohl zvýšit odstup od svých konkurentů na poli vyhledávání.
Obě představené technologie, tedy hlasové vyhledávání a obsahové prohledávání videí, je již velmi pokročilé a je pravděpodobné, že Google rozšíří své služby tímto směrem, čímž usnadní způsob vyhledávání a zvětší počet informačních zdrojů.

(Václav Vašíček)
Zdroje:
http://digiweb.ihned.cz/c1-36636190-hlasove-vyhledavani-na-mobilnim-webu-bude-podle-googlu-klicove
http://www.vnunet.com/vnunet/news/2226360/google-tests-sound-search

Share/Save/Bookmark



Komentáře

Populární příspěvky z tohoto blogu

Užívání Chat-GTP v digitálním marketingu

Co je to ChatGPT? „Napiš mi krátký odstavec o tom, co je to ChatGPT a jak funguje!“ ChatGPT je velký jazykový model založený na neuronových sítích, který dokáže generovat lidské-like odpovědi na zadané dotazy a věty. Model je trénován na obrovském množství textových dat a používá se především pro chatování a odpovídání na dotazy zákazníků. ChatGPT funguje tak, že na základě vstupního textu od uživatele (dotazu) generuje odpověď, která se co nejvíce podobá lidskému stylu komunikace.  Tak asi takhle může například probíhat konverzace s poslední verzí ChatGPT. Jestli „jeho“ vysvětlení nebylo dostačující, můžeme na ChatGPT koukat jako na „bota“, který nám odpoví na většinu našich dotazů, a to od dotazu, co koupit za dárek pro babičku, až po komplexní návrhy strategií, klíčových slov a dalších užitečných informací pro internetovou reklamu!

V jaký čas je nejvhodnější přidávat příspěvky na sociální sítě?

Společnost Sprout Social vydala v dubnu výzkum, kde uvádí, jaké dny a časy jsou nejlepší pro přidávání příspěvků na sociální sítě, abyste měli největší dosah. Výzkum byl prováděn na vzorku 30 000 uživatelů. Sprout Social uvádí, že výzkum je vhodný primárně pro podnikatele, kteří tato data mohou využít jako pomůcku pro plánování příspěvků v publikačním kalendáři. Výzkumem by se tedy až tolik neměli řídit běžní uživatelé sociálních sítí, kteří pouze chtějí větší počet sledujících či lajků na svém soukromém profilu.

TikTok spouští nové New Interactive Market Insights pro lepší marketingovou propagaci na platformě

TikTok Insights, nová platforma, ke které máte přístup zde , poskytuje řadu filtrů, abyste získali lepší představu o tom, jak se vaše publikum chová, jaké má zájmy a postoje ke značkám.