Webszerverek naplófájljainak statisztikai elemzése
Dátum
Szerzők
Folyóirat címe
Folyóirat ISSN
Kötet címe (évfolyam száma)
Kiadó
Absztrakt
Az Internet robbanásszerű elterjedésében nagy szerepet játszott a http protokoll, illetve a HTML oldalak megjelenítésére alkalmas böngészőprogramok megjelenése. Ez a protokoll és alkalmazás volt az, ami az e-mailen kívül, a számítástechnikához nem igazán értő ember számára is könnyen megérthetővé és praktikusan alkalmazhatóvá tette az Internet használatát. A HTML (HyperText Markup Language) fájlok fontos tulajdonsága, hogy ún. hypertext környezetben a szöveges információkon kívül grafikus, multimédiás adatokat is képesek tartalmazni, s ezt a böngészőn keresztül megjeleníteni. A World Wide Web, azaz a HTML-oldalak hyperlinkeken keresztül egymásba kapcsolódó, Internetre alapuló hálózata, születése óta folyamatosan és exponenciálisan növekszik, mind a felhasználók, mind az elérhető weboldalak számát tekintve. A weboldalak számát 2002 márciusában 1,3 milliárdra becsülték.
Az oldalak megjelenítéséhez szükséges egy böngészőprogram, ami a felhasználó számítógépén, kliensszerepben fut, illetve szerveroldalon a webszerver. A webszerver működése közben folyamatosan naplózza tranzakcióit, a beérkező kéréseket, illetve a kiszolgálás eredményességét. Ezeket az adatokat ún. naplófájlokban tárolja. A naplófájl szerkezete – bizonyos keretek között – a webszerver rendszergazdája által szabadon konfigurálható.
A naplófájl statisztikai elemzése hasznos és értékes adatokat kínálhat mind a webszervert futtató host üzemeltetőinek, rendszergazdáinak, mind az adott weboldal tulajdonosainak. Az előbbiek elsősorban a szerver terhelésével kapcsolatos információkat hasznosítják, (ami a rendszer méretezésénél, bővítésénél lehet fontos szempont), míg utóbbiak a nézettségi adatok kinyerésével a weboldal további fejlesztéséhez, gazdaságos üzemeltetéséhez szükséges információkat nyernek.
Az elemzés során keletkezett statisztikai adatok általában viszonylag egyszerű statisztikák, ugyanakkor nagymennyiségű adattömeget kell kezelni, már közepes igénybevételű webszervernél is 10-100 Mbyte-os adattömegre lehet számítani.