Az internetes keresők lekérdezési hatékonyságának vizsgálata

Absztrakt

A vizsgálat eredményei arra engednek következtetni, hogy az angol nyelv keres k rosszabbul kezelik és értelmezik a magyar nyelv kereséseket, mint az angol nyelv eket. Ezekben a keres eszközökben a csonkolás és a szinonimákra történ keresés eredményesen m ködik az angolban, de meglehet sen problémás a magyar nyelvben. A Google keres nem veszi figyelembe a határozott és a határozatlan nével ket az angol nyelv kereséseknél, azonban még nem oldotta meg ezt a kérdést a magyar nyelvben. Az Altavista keres megtalálja az angol nyelv keres kérdések többes számú alakját, ezért ez az egyedüli olyan szolgáltatás, ahol a morfológiai elemzés hatékonyan m ködik az angolban. Az angol nyelv keres k közül egyik sem küzdött meg ezzel a problémával a magyar nyelvben. Elmondható a Google és az Altavista szolgáltatásokról, hogy azok azonos teljesítményt nyújtottak a keres kérdések értelmezésében, utánuk pedig az AlltheWeb keres következik a rangsorban. A kapott eredmények alapján levonható az a következtetés, hogy ezeknek a keres knek még nagyobb hangsúlyt kellene fektetniük a morfológiai elemzésre, a stopszavak és az ékezetek kezelésére a jöv beli fejlesztésükben...

The results of this study let me conclude that English search engines handle queries for Hungarian terms worse than they handle English terms. In these search tools truncation and searching for synonyms work properly in English but it is problematic in Hungarian. Google omits definite and indefinite articles in the English queries, but it has not solved this issue yet for Hungarian queries. AltaVista is good at finding the plural form of the English queries, so this is the only service where stemming works properly in English. However, none of the English services coped with this problem in the Hungarian language. It can be said that Google and AltaVista are equal in their performance of interpreting queries, followed by AlltheWeb. On the basis of these findings, I can draw the conclusion that more emphasis should be placed on stemming, handling of stopwords and diacritics in the future development of these search engines....

Leírás
Kulcsszavak
internetes keresők, search engines, információ-keresés, information retrieval, lekérdezési hatékonyság, retrieval effectiveness
Forrás