Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen
- Art: Diplomarbeit
- Autor: Nicole Marschall
- Abgabedatum: Oktober 2001
- Umfang: 170 Seiten
- Dateigröße: 3,7 MB
- Note: 1,3
- Institution / Hochschule: FernUniversität in Hagen Deutschland
- ISBN (eBook): 978-3-8324-4775-5
-
ISBN (Paperback) :
978-3-8324-4775-5 P - ISBN (CD) :978-3-8324-4775-5 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Marschall, Nicole Oktober 2001: Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen, Hamburg: Diplomica Verlag
- Schlagworte: Logfiles, Zielgruppenanalyse, Webserver-Analyse, Client/Server-Kommunikation, Internet-Marketing
In den Warenkorb
58,00 €
Diplomarbeit von Nicole Marschall
Einleitung:
Das Internet ist in jedem Geschäftsbereich zu einem unverzichtbaren Informations- und Kommunikationsmedium geworden. Auch dem Marketing werden durch die zeitlich und global unbegrenzten, multimedialen und interaktiven Möglichkeiten, die insbesondere das World Wide Web bietet, neue Tore geöffnet.
Neben dem imagefördernden Effekt, den eine Website bei ihren Betrachtern und potentiellen Kunden eines Unternehmens hinterlassen kann, spielen gut besuchte Internetsites eine wichtige Rolle als Werbeträger. Trotz der Krise der Neuen Märkte verzeichnet die Online-Werbung in Deutschland steigende Zahlen. Laut Ergebnissen des Marktforschungsinstituts Prognos wurden im Jahr 2000 fast 450 Mio. DM für Internetwerbung ausgegeben. Für 2001 wird eine annähernde Verdopplung prognostiziert. Dabei stellt die Bannerwerbung die häufigste Form der Werbung dar. 1999 wurde durch den Verkauf von Werbefläche für Banner 56 Prozent des Gesamtumsatzes der Internetwerbung erzielt. Die Kosten der Werbefläche hängen unmittelbar von der Attraktivität der Site ab, denn potentielle Werbekunden sind an hohen Besucherzahlen interessiert. Diese wiederum sind linear abhängig vom Grad der zielgruppenadäquaten Ansprache der Besucher. Zur Steigerung und Erhaltung der Besucherfrequenz ist es daher zwingend erforderlich, die Besucher so gut wie möglich kennen zu lernen. Dazu müssen ihre speziellen Bedürfnisse und Nutzungsgewohnheiten beim Besuch der Internetsite analysiert werden.
Gang der Untersuchung:
Möglichkeiten, die das Internet bietet, um Daten (formatierte Informationen) über Besucher zu sammeln und auszuwerten, sollen in dieser Arbeit diskutiert werden. Grundlage hierfür bilden die vom Web Server erzeugten Logfiles. Nach einer groben Einordnung in den absatzpolitischen Rahmen (Kapitel 2) werden in Kapitel 3 die technologischen Grundlagen der Internetnutzung, insbesondere die Client/Server-Kommunikation, vorgestellt. Kapitel 4 befasst sich mit der Datengewinnung durch Logfiles und den daraus zu entnehmenden Informationen. Messkriterien, Probleme der Messung und Auswertungsverfahren sind Themen des Kapitels 5. Daran schließt sich in Kapitel 6 eine Betrachtung der Ergebnisse im Hinblick auf die Optimierung des Online-Marketings an, wobei auch auf Möglichkeiten einer detaillierteren Datengewinnung hingewiesen wird. In Kapitel 7 wird die Datenerhebung unter dem Aspekt des Datenschutzes beleuchtet. Abschließend erfolgt eine zusammenfassende Bewertung der Möglichkeiten durch Logfile-Analysen (Kapitel 8).
Inhaltsverzeichnis:
| Abbildungs- und Tabellenverzeichnis | IV | |
| 1. | Einleitung und Überblick | 1 |
| 2. | Einordnung der Arbeit in die absatzpolitische Thematik | 2 |
| 2.1 | Marketingziele einer Online-Präsenz | 3 |
| 2.2 | Anforderungen der Effizienzanalyse im Online-Marketing | 4 |
| 2.3 | Marktforschung und Online-Mining | 5 |
| 2.4 | Relevanz der Zielgruppenanalyse | 7 |
| 2.5 | Grundlagen der Internetwerbung: Platzierung und Gebühren | 9 |
| 3. | Technologische Grundlagen | 10 |
| 3.1 | Internet und World Wide Web | 11 |
| 3.2 | Definitionen | 12 |
| 3.2.1 | Webseite / Internetseite | 12 |
| 3.2.2 | Website / Internetsite | 12 |
| 3.2.3 | Homepage | 12 |
| 3.2.4 | Ressource | 12 |
| 3.3 | TCP/IP | 13 |
| 3.4 | Adressierung | 15 |
| 3.4.1 | IP-Adresse | 15 |
| 3.4.2 | Domain-Adresse | 15 |
| 3.5 | HTTP | 17 |
| 3.6 | Client/Server-Kommunikation | 18 |
| 3.6.1 | Request | 20 |
| 3.6.2 | Response | 22 |
| 3.6.3 | Keep-Alive | 25 |
| 4. | Datengewinnung: Logfiles | 26 |
| 4.1 | Logfile-Formate | 26 |
| 4.1.1 | Common Log Format (CLF) | 26 |
| 4.1.1.1 | Access Log | 27 |
| 4.1.1.2 | Referer Log | 27 |
| 4.1.1.3 | Agent Log | 28 |
| 4.1.1.4 | Errorr Log | 28 |
| 4.1.2 | Combined Log Format (DLF) | 28 |
| 4.1.3 | Extended Log Format (ELF) | 29 |
| 4.1.4 | Andere Logfile-Formate | 29 |
| 4.2 | Logfile-Informationen | 31 |
| 4.2.1 | Adresse des Clients | 31 |
| 4.2.2 | identd-Information | 32 |
| 4.2.3 | Benutzername | 32 |
| 4.2.4 | Datum und Uhrzeit | 33 |
| 4.2.5 | Request | 33 |
| 4.2.6 | Statuscode | 33 |
| 4.2.7 | Größe der Ressource | 34 |
| 4.2.8 | Referer | 35 |
| 4.2.9 | Browser-Kennung (User-Agent) | 36 |
| 4.3 | Exkurs: Perl-Script zur Zugriffsprotokollierung | 37 |
| 5. | Datenanalyse: Auswertungsverfahren | 38 |
| 5.1 | Messkriterien der Erfolgskontrolle | 38 |
| 5.1.1 | Hit (Zugriff, Treffer) | 38 |
| 5.1.2 | PageImpression, PageView und View (Seitenabrufe) | 38 |
| 5.1.3 | User (Besucher) und Visit (Besuch) | 39 |
| 5.1.4 | Session (Sitzung) | 39 |
| 5.1.5 | AdClick | 40 |
| 5.1.6 | Click Through Rate (CTR) | 40 |
| 5.1.7 | AdImpression | 40 |
| 5.1.8 | Traffic | 41 |
| 5.2 | Weitere relevante Informationen der Erfolgskontrolle | 41 |
| 5.2.1 | Referring Sites und Referring URLs | 41 |
| 5.2.2 | Wochentag und Tageszeit | 42 |
| 5.2.3 | ViewTime | 42 |
| 5.2.4 | AdViewTime | 42 |
| 5.2.5 | Browser | 42 |
| 5.2.6 | File (Dateityp) | 42 |
| 5.3 | Probleme der Messung | 42 |
| 5.3.1 | Genauigkeit am falschen Platz | 43 |
| 5.3.2 | Dynamische IP-Adressen | 43 |
| 5.3.3 | Proxy-Server | 43 |
| 5.3.4 | Cache | 45 |
| 5.3.5 | Öffentliche Rechner | 46 |
| 5.3.6 | Framesets | 46 |
| 5.3.7 | Self-Referer | 47 |
| 5.3.8 | Eigene Zugriffe | 47 |
| 5.3.9 | Suchmaschinen | 47 |
| 5.3.10 | Sessions | 47 |
| 5.4 | Analyse-Software und Services | 48 |
| 5.4.1 | Verbreitete Analyse-Software | 48 |
| 5.4.1.1 | Freeware | 49 |
| 5.4.1.2 | Kommerzielle Produkte | 52 |
| 5.4.2 | Marketing-Services | 54 |
| 5.5 | IVW-Messverfahren | 54 |
| 5.5.1 | Ein-Pixel-Grafik | 55 |
| 5.5.2 | Clickstream | 56 |
| 5.5.2.1 | Datenaufbereitung | 57 |
| 5.5.2.2 | Erstellung vorläufiger Clickstreams | 57 |
| 5.5.2.3 | Ermittlung der Betrachtungszeit | 59 |
| 5.5.2.4 | Festlegung der Timeout-Zeit | 59 |
| 5.5.2.5 | Rekonstruktion nicht protokollierter Seitenaufrufe | 59 |
| 5.6 | Clusteranalyse | 60 |
| 5.7 | Bewertung der Auswertungsverfahren | 61 |
| 6. | Steuerung und Optimierung des Online-Marketings | 62 |
| 6.1 | Relevanz des Nutzungsprofils für das Marketing | 62 |
| 6.1.1 | Informationsgehalt der Gesamtanalyse | 62 |
| 6.1.2 | Informationsgehalt der Zeitanalyse | 62 |
| 6.1.3 | Informationsgehalt der Seitenanalyse | 63 |
| 6.1.4 | Informationsgehalt der Besucheranalyse | 63 |
| 6.1.5 | Informationsgehalt der Pfadanalyse | 63 |
| 6.1.6 | Informationsgehalt der AdClick- und Refereranalyse | 64 |
| 6.1.6.1 | Beispiel: Ertragsoptimierte Allokation des Online-Werbebudgets durch Verwendung von AdClicks | 64 |
| 6.1.6.2 | Beispiel: Optimierung der Werbeeffizienz anhand der CTR | 66 |
| 6.1.7 | Informationsgehalt der Technikanalyse | 66 |
| 6.2 | Erweiterung des Nutzungs- zum Nutzerprofil | 67 |
| 6.2.1 | Zusätzliche Messkriterien der Erfolgskontrolle | 68 |
| 6.2.1.1 | Besucher und Kunden | 68 |
| 6.2.1.2 | Quote Kunde/Besucher | 68 |
| 6.2.1.3 | Besucherpreis | 68 |
| 6.2.1.4 | Kundenpreis | 68 |
| 6.2.2 | Verfahren und Techniken zur Erhebung von personenbezogenen Daten | 69 |
| 6.2.2.1 | Online-Befragung | 69 |
| 6.2.2.2 | Cookies | 69 |
| 6.2.2.3 | Benutzerkennung und Passwort | 71 |
| 6.2.2.4 | Push-Services (Datenfilter-Programme) | 71 |
| 6.2.2.5 | Lucent Personalized Web Assistent (LPWA) | 72 |
| 6.2.3 | Exkurs: Tarnprogramme | 73 |
| 7. | Rechtliche Betrachtung unter dem Aspekt des Datenschutzes | 74 |
| 8. | Zusammenfassende Beurteilung der Logfile-Analysen | 76 |
| 8.1 | Technologische Beurteilung | 76 |
| 8.2 | Marketingtechnische Beurteilung | 76 |
| 8.3 | Rechtliche Beurteilung | 77 |
| 9. | Zusammenfassung | 77 |
| Literaturverzeichnis | 79 | |
| Aus dem Internet entnommene Literatur | 83 | |
| Anhang | 88 | |
| Anhang A | A1 | |
| Anhang B | B1 | |
| Anhang C | C1 | |
| Anhang D | D1 | |
| Anhang E | E1 | |
| Anhang F | F1 | |
| Anhang G | G1 | |
| Anhang H | H1 |
47 Inhalt eines Frames als Content. Damit wird sichergestellt, dass der Erstabruf des Framesets nur als eine PageImpression gezählt wird. Signifikante Verzerrungen nach oben ergeben sich, wenn das komplette Frameset jedes Mal als drei Einzelseiten gezählt wird [IVW 2001]. 5.3.7 Self-Referer Manche Statistiken erfassen Links innerhalb der eigenen Website als neuen Zugriff. Im Logfile ist in diesem Fall der Hostname der angeforderten Datei und der der Zugriffsherkunft identisch. Werden diese Self-Referer von der Statistik nicht separat als Eigenverweise aufgelistet, sollte der Logfile vor einer Analyse bereinigt werden, um eine korrekte, unverzerrte Auswertung zu erhalten. 5.3.8 Eigene Zugriffe Zugriffe von Angestellten des eigenen Unternehmens erhöhen die Abfragezahlen. Darunter befinden sich auch Zugriffe der Programmierer und Designer, die zu Testzwecken erfolgten. Ein gesonderter Ausweis von firmeneigenen Zugriffen ist jedoch nur unter bestimmten technischen Voraussetzungen möglich. Im allgemeinen kann die Verzerrung aber vernachlässigt werden, da sie normalverteilt ist [BÜRLIMANN 1999, S. 222]. 5.3.9 Suchmaschinen Da Abfragestatistiken nicht erkennen können, wer der Besucher ist, werden auch Besuche von Suchmaschinen, Spidern und Link-Checkern mitgezählt. Durch eine normalverteilte Besuchsfrequenz machen sich die Verzerrungen in einer durchschnittlich konstanten Steigerung der Abfragezahlen bemerkbar, die meist unterhalb eines Prozentes liegt [BÜRLIMANN 1999, S. 219]. 5.3.10 Sessions Rückschlüsse auf die Anzahl der Besucher sind anhand der Sessions nur bedingt möglich, da das Ende einer Session nicht eindeutig festgestellt werden kann. Während der Beginn einer Session eindeutig zu erkennen ist, kann nicht so einfach registriert werden, wann der User die Seite wieder verlässt, indem er einen Link verfolgt oder eine neue Adresse eingibt. „Wenn der Kunde explizit eine Transaktion bestätigt hat oder explizit eine Transaktion abgebrochen hat, können wir [...]
5.3.5 Öffentliche Rechner Wird ein Computer von verschiedenen Usern verwendet, wie beispielsweise die Rechner in Universitäten, Internetcafés oder Bibliotheken, weist die Statistik ebenfalls weniger Besucher aus als real auf die Seite zugegriffen haben, da Zugriffe der Einzelpersonen nicht differenziert erfasst werden können. Egal wieviele unterschiedliche Personen eine Seite aufrufen, gezählt wird der Zugriff von einem Host nur einmal. Einigermaßen zuverlässige Daten können nur durch zusätzliche Stichproben und Hochrechnungen erreicht werden [KELLER 1997, S. 192f]. 5.3.6 Framesets Ein Frameset ist eine aus mehreren HTML-Dokumenten bestehende Internetseite. Enthält ein Internetangebot beispielsweise zwei Frames, so werden drei unterschiedliche HTML-Dokumente gleichzeitig auf dem Monitor angezeigt: das Frameset und die beiden darin eingebetteten Inhaltsseiten. Die Zählweisen für Frames sind je nach Statistik unterschiedlich. Nach der IVW (Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern e.V.) zählt nur der [...]
5.3.4 Cache Das oben bereits beschriebene Problem der Zwischenspeicherung bei der korrekten Erfassung des Nutzungsverhaltens wird durch den Cache des Computers bewirkt. Der Cache ist ein Zwischenspeicher, der die Festplatte ergänzt. Er speichert einmal über das Netz angeforderte Seiten inklusive der eingebundenen und bereits übertragenen Ressourcen eine zeitlang auf der Festplatte des Internetnutzers. Klickt der User auf den Zurück- oder Vorwärts-Button des Browsers (bzw. die entsprechende Funktion der rechten Mouse-Taste), um zu einer bereits gesehenen Seite zurückzukehren, greift der Browser auf die im Cache gespeicherten Seiten zu, ohne diese erneut beim Server anzufordern. Möglich wird dadurch auch eine Offline-Nutzung der Website. [...]
In den Warenkorb
58,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832447755
Arbeit zitieren:
Marschall, Nicole Oktober 2001: Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen, Hamburg: Diplomica Verlag
Schlagworte:
Logfiles, Zielgruppenanalyse, Webserver-Analyse, Client/Server-Kommunikation, Internet-Marketing



