Az internetes keresők lekérdezési hatékonyságának vizsgálata
Az internetes keresők lekérdezési hatékonyságának vizsgálata
Dátum
2009-03-06T15:04:57Z
Szerzők
Tóth, Erzsébet
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
A vizsgálat eredményei arra engednek következtetni, hogy az angol nyelv keres k rosszabbul
kezelik és értelmezik a magyar nyelv kereséseket, mint az angol nyelv eket.
Ezekben a keres eszközökben a csonkolás és a szinonimákra történ keresés eredményesen
m ködik az angolban, de meglehet sen problémás a magyar nyelvben.
A Google keres nem veszi figyelembe a határozott és a határozatlan nével ket az angol nyelv
kereséseknél, azonban még nem oldotta meg ezt a kérdést a magyar nyelvben. Az Altavista
keres megtalálja az angol nyelv keres kérdések többes számú alakját, ezért ez az egyedüli
olyan szolgáltatás, ahol a morfológiai elemzés hatékonyan m ködik az angolban. Az angol
nyelv keres k közül egyik sem küzdött meg ezzel a problémával a magyar nyelvben.
Elmondható a Google és az Altavista szolgáltatásokról, hogy azok azonos teljesítményt
nyújtottak a keres kérdések értelmezésében, utánuk pedig az AlltheWeb keres következik a
rangsorban. A kapott eredmények alapján levonható az a következtetés, hogy ezeknek a
keres knek még nagyobb hangsúlyt kellene fektetniük a morfológiai elemzésre, a stopszavak és
az ékezetek kezelésére a jöv beli fejlesztésükben...
-----
The results of this study let me conclude that English search engines handle queries for
Hungarian terms worse than they handle English terms.
In these search tools truncation and searching for synonyms work properly in English but it is
problematic in Hungarian.
Google omits definite and indefinite articles in the English queries, but it has not solved this
issue yet for Hungarian queries. AltaVista is good at finding the plural form of the English
queries, so this is the only service where stemming works properly in English. However, none of
the English services coped with this problem in the Hungarian language. It can be said that
Google and AltaVista are equal in their performance of interpreting queries, followed by
AlltheWeb. On the basis of these findings, I can draw the conclusion that more emphasis should
be placed on stemming, handling of stopwords and diacritics in the future development of these
search engines....
Leírás
Kulcsszavak
internetes keresők, search engines, információ-keresés, information retrieval, lekérdezési hatékonyság, retrieval effectiveness