Az internet exponenciálisan növekvő tartalma miatt ma már egy újabb keresőmotor szolgáltatás indítása csillagászati összegekbe kerül, és a piacvezetők felhalmozott tudását is szinte lehetetlen behozni. Éppen ezért a legtöbben az eddig kiaknázatlan és elhanyagolt területeken próbálnak beszállni a versenybe. A Google alapelve a PageRank rendszer, ami leegyszerűsítve úgy működik, hogy a honlapokat a rájuk mutató linkek száma alapján rangsorolja, és amikor keresünk valamit, a beérkező találatok között elsőbbséget élveznek a sorrend elején álló honlapok. Sokak szerint azonban a nyelvi adatbázisokat, nyelvészeti szoftvereket, és a szövegkörnyezetet is felhasználó, komplexebb keresőmotoroké a jövő. Vannak ilyen kísérletek, pl. Cuil, de eddig nem sikerült egyiknek sem a piaci áttörés.
Az interneten nem csupán szöveg, hanem rengeteg kép, zene, animáció és videó van. Egyelőre azonban csak a másodlagos adataik, az úgynevezett metadata alapján lehet megtalálni ezeket a tartalmakat. Ilyen a fájlnév, az adott fájlformátumban megadható információk – gondoljunk az MP3 fájlokra, amelyek az előadón, szám címén túl sok egyebet tartalmazhatnak – és a kép, vagy videó körül elhelyezkedő szöveg. A California Egyetem idén rukkolt elő egy új képfelismerő szoftverrel, amelyik képes arra, hogy a színek, a felület jellegzetességei és persze a formák alapján kilistázza milyen tárgyak vagy személyek találhatók a képeken. Eredményei kétségesek.
Igény van arra is, hogy a videóban elhangzó szöveg is kereshető legyen, erre BBN cég adta meg a választ, beszédfelismerő szoftverük 80 százalékos pontossággal működik. A Blinkx a szövegfelismerés segítségével a különböző televíziós sorozatok részeit kutatja fel a neten. A Midomi pedig azoknak segít, akik hallottak egy jó számot a rádióban, de nem tudják a címét. A honlap a mikrofonba énekelt felvétel alapján találja meg a keresett zenét.
Hogy a magyar vonatkozások se maradjanak ki, megemlíthető az Amazon.com Mechanical Turk elnevezésű szolgáltatása, ami gépek segítségével használja fel az emberi képességeket. A Mechanical Turk apró, emberek számára könnyen elvégezhető feladatokat oszt szét viszonylag alacsony fizetségért. Változó sikerrel működik.
Techline.hu
Az interneten nem csupán szöveg, hanem rengeteg kép, zene, animáció és videó van. Egyelőre azonban csak a másodlagos adataik, az úgynevezett metadata alapján lehet megtalálni ezeket a tartalmakat. Ilyen a fájlnév, az adott fájlformátumban megadható információk – gondoljunk az MP3 fájlokra, amelyek az előadón, szám címén túl sok egyebet tartalmazhatnak – és a kép, vagy videó körül elhelyezkedő szöveg. A California Egyetem idén rukkolt elő egy új képfelismerő szoftverrel, amelyik képes arra, hogy a színek, a felület jellegzetességei és persze a formák alapján kilistázza milyen tárgyak vagy személyek találhatók a képeken. Eredményei kétségesek.
Igény van arra is, hogy a videóban elhangzó szöveg is kereshető legyen, erre BBN cég adta meg a választ, beszédfelismerő szoftverük 80 százalékos pontossággal működik. A Blinkx a szövegfelismerés segítségével a különböző televíziós sorozatok részeit kutatja fel a neten. A Midomi pedig azoknak segít, akik hallottak egy jó számot a rádióban, de nem tudják a címét. A honlap a mikrofonba énekelt felvétel alapján találja meg a keresett zenét.
Hogy a magyar vonatkozások se maradjanak ki, megemlíthető az Amazon.com Mechanical Turk elnevezésű szolgáltatása, ami gépek segítségével használja fel az emberi képességeket. A Mechanical Turk apró, emberek számára könnyen elvégezhető feladatokat oszt szét viszonylag alacsony fizetségért. Változó sikerrel működik.
Techline.hu
Nincsenek megjegyzések:
Megjegyzés küldése