Webszerverek naplófájljainak statisztikai elemzése

Dátum
2007-03-21T09:04:23Z
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt

Az Internet robbanásszerű elterjedésében nagy szerepet játszott a http protokoll, illetve a HTML oldalak megjelenítésére alkalmas böngészőprogramok megjelenése. Ez a protokoll és alkalmazás volt az, ami az e-mailen kívül, a számítástechnikához nem igazán értő ember számára is könnyen megérthetővé és praktikusan alkalmazhatóvá tette az Internet használatát. A HTML (HyperText Markup Language) fájlok fontos tulajdonsága, hogy ún. hypertext környezetben a szöveges információkon kívül grafikus, multimédiás adatokat is képesek tartalmazni, s ezt a böngészőn keresztül megjeleníteni. A World Wide Web, azaz a HTML-oldalak hyperlinkeken keresztül egymásba kapcsolódó, Internetre alapuló hálózata, születése óta folyamatosan és exponenciálisan növekszik, mind a felhasználók, mind az elérhető weboldalak számát tekintve. A weboldalak számát 2002 márciusában 1,3 milliárdra becsülték.

Az oldalak megjelenítéséhez szükséges egy böngészőprogram, ami a felhasználó számítógépén, kliensszerepben fut, illetve szerveroldalon a webszerver. A webszerver működése közben folyamatosan naplózza tranzakcióit, a beérkező kéréseket, illetve a kiszolgálás eredményességét. Ezeket az adatokat ún. naplófájlokban tárolja. A naplófájl szerkezete – bizonyos keretek között – a webszerver rendszergazdája által szabadon konfigurálható.

A naplófájl statisztikai elemzése hasznos és értékes adatokat kínálhat mind a webszervert futtató host üzemeltetőinek, rendszergazdáinak, mind az adott weboldal tulajdonosainak. Az előbbiek elsősorban a szerver terhelésével kapcsolatos információkat hasznosítják, (ami a rendszer méretezésénél, bővítésénél lehet fontos szempont), míg utóbbiak a nézettségi adatok kinyerésével a weboldal további fejlesztéséhez, gazdaságos üzemeltetéséhez szükséges információkat nyernek.

Az elemzés során keletkezett statisztikai adatok általában viszonylag egyszerű statisztikák, ugyanakkor nagymennyiségű adattömeget kell kezelni, már közepes igénybevételű webszervernél is 10-100 Mbyte-os adattömegre lehet számítani.
Leírás
Kulcsszavak
Perl, CGI, web, statisztika, napló, log, SQL, MySQL
Forrás