Bachelor + Master Publishing
810 Bachelorarbeiten, 531 Masterarbeiten, 10.101 Diplomarbeiten

Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen

Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Nicole Marschall
  • Abgabedatum: Oktober 2001
  • Umfang: 170 Seiten
  • Dateigröße: 3,7 MB
  • Note: 1,3
  • Institution / Hochschule: FernUniversität in Hagen Deutschland
  • ISBN (eBook): 978-3-8324-4775-5
  • ISBN (Paperback) :
    978-3-8324-4775-5 P
  • ISBN (CD) :978-3-8324-4775-5 CD
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Marschall, Nicole Oktober 2001: Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen, Hamburg: Diplomica Verlag
  • Schlagworte: Logfiles, Zielgruppenanalyse, Webserver-Analyse, Client/Server-Kommunikation, Internet-Marketing

Diplomarbeit von Nicole Marschall

Einleitung:

Das Internet ist in jedem Geschäftsbereich zu einem unverzichtbaren Informations- und Kommunikationsmedium geworden. Auch dem Marketing werden durch die zeitlich und global unbegrenzten, multimedialen und interaktiven Möglichkeiten, die insbesondere das World Wide Web bietet, neue Tore geöffnet.

Neben dem imagefördernden Effekt, den eine Website bei ihren Betrachtern und potentiellen Kunden eines Unternehmens hinterlassen kann, spielen gut besuchte Internetsites eine wichtige Rolle als Werbeträger. Trotz der Krise der Neuen Märkte verzeichnet die Online-Werbung in Deutschland steigende Zahlen. Laut Ergebnissen des Marktforschungsinstituts Prognos wurden im Jahr 2000 fast 450 Mio. DM für Internetwerbung ausgegeben. Für 2001 wird eine annähernde Verdopplung prognostiziert. Dabei stellt die Bannerwerbung die häufigste Form der Werbung dar. 1999 wurde durch den Verkauf von Werbefläche für Banner 56 Prozent des Gesamtumsatzes der Internetwerbung erzielt. Die Kosten der Werbefläche hängen unmittelbar von der Attraktivität der Site ab, denn potentielle Werbekunden sind an hohen Besucherzahlen interessiert. Diese wiederum sind linear abhängig vom Grad der zielgruppenadäquaten Ansprache der Besucher. Zur Steigerung und Erhaltung der Besucherfrequenz ist es daher zwingend erforderlich, die Besucher so gut wie möglich kennen zu lernen. Dazu müssen ihre speziellen Bedürfnisse und Nutzungsgewohnheiten beim Besuch der Internetsite analysiert werden.

Gang der Untersuchung:

Möglichkeiten, die das Internet bietet, um Daten (formatierte Informationen) über Besucher zu sammeln und auszuwerten, sollen in dieser Arbeit diskutiert werden. Grundlage hierfür bilden die vom Web Server erzeugten Logfiles. Nach einer groben Einordnung in den absatzpolitischen Rahmen (Kapitel 2) werden in Kapitel 3 die technologischen Grundlagen der Internetnutzung, insbesondere die Client/Server-Kommunikation, vorgestellt. Kapitel 4 befasst sich mit der Datengewinnung durch Logfiles und den daraus zu entnehmenden Informationen. Messkriterien, Probleme der Messung und Auswertungsverfahren sind Themen des Kapitels 5. Daran schließt sich in Kapitel 6 eine Betrachtung der Ergebnisse im Hinblick auf die Optimierung des Online-Marketings an, wobei auch auf Möglichkeiten einer detaillierteren Datengewinnung hingewiesen wird. In Kapitel 7 wird die Datenerhebung unter dem Aspekt des Datenschutzes beleuchtet. Abschließend erfolgt eine zusammenfassende Bewertung der Möglichkeiten durch Logfile-Analysen (Kapitel 8).

Inhaltsverzeichnis:

Abbildungs- und Tabellenverzeichnis IV
1. Einleitung und Überblick 1
2. Einordnung der Arbeit in die absatzpolitische Thematik 2
2.1 Marketingziele einer Online-Präsenz 3
2.2 Anforderungen der Effizienzanalyse im Online-Marketing 4
2.3 Marktforschung und Online-Mining 5
2.4 Relevanz der Zielgruppenanalyse 7
2.5 Grundlagen der Internetwerbung: Platzierung und Gebühren 9
3. Technologische Grundlagen 10
3.1 Internet und World Wide Web 11
3.2 Definitionen 12
3.2.1 Webseite / Internetseite 12
3.2.2 Website / Internetsite 12
3.2.3 Homepage 12
3.2.4 Ressource 12
3.3 TCP/IP 13
3.4 Adressierung 15
3.4.1 IP-Adresse 15
3.4.2 Domain-Adresse 15
3.5 HTTP 17
3.6 Client/Server-Kommunikation 18
3.6.1 Request 20
3.6.2 Response 22
3.6.3 Keep-Alive 25
4. Datengewinnung: Logfiles 26
4.1 Logfile-Formate 26
4.1.1 Common Log Format (CLF) 26
4.1.1.1 Access Log 27
4.1.1.2 Referer Log 27
4.1.1.3 Agent Log 28
4.1.1.4 Errorr Log 28
4.1.2 Combined Log Format (DLF) 28
4.1.3 Extended Log Format (ELF) 29
4.1.4 Andere Logfile-Formate 29
4.2 Logfile-Informationen 31
4.2.1 Adresse des Clients 31
4.2.2 identd-Information 32
4.2.3 Benutzername 32
4.2.4 Datum und Uhrzeit 33
4.2.5 Request 33
4.2.6 Statuscode 33
4.2.7 Größe der Ressource 34
4.2.8 Referer 35
4.2.9 Browser-Kennung (User-Agent) 36
4.3 Exkurs: Perl-Script zur Zugriffsprotokollierung 37
5. Datenanalyse: Auswertungsverfahren 38
5.1 Messkriterien der Erfolgskontrolle 38
5.1.1 Hit (Zugriff, Treffer) 38
5.1.2 PageImpression, PageView und View (Seitenabrufe) 38
5.1.3 User (Besucher) und Visit (Besuch) 39
5.1.4 Session (Sitzung) 39
5.1.5 AdClick 40
5.1.6 Click Through Rate (CTR) 40
5.1.7 AdImpression 40
5.1.8 Traffic 41
5.2 Weitere relevante Informationen der Erfolgskontrolle 41
5.2.1 Referring Sites und Referring URLs 41
5.2.2 Wochentag und Tageszeit 42
5.2.3 ViewTime 42
5.2.4 AdViewTime 42
5.2.5 Browser 42
5.2.6 File (Dateityp) 42
5.3 Probleme der Messung 42
5.3.1 Genauigkeit am falschen Platz 43
5.3.2 Dynamische IP-Adressen 43
5.3.3 Proxy-Server 43
5.3.4 Cache 45
5.3.5 Öffentliche Rechner 46
5.3.6 Framesets 46
5.3.7 Self-Referer 47
5.3.8 Eigene Zugriffe 47
5.3.9 Suchmaschinen 47
5.3.10 Sessions 47
5.4 Analyse-Software und Services 48
5.4.1 Verbreitete Analyse-Software 48
5.4.1.1 Freeware 49
5.4.1.2 Kommerzielle Produkte 52
5.4.2 Marketing-Services 54
5.5 IVW-Messverfahren 54
5.5.1 Ein-Pixel-Grafik 55
5.5.2 Clickstream 56
5.5.2.1 Datenaufbereitung 57
5.5.2.2 Erstellung vorläufiger Clickstreams 57
5.5.2.3 Ermittlung der Betrachtungszeit 59
5.5.2.4 Festlegung der Timeout-Zeit 59
5.5.2.5 Rekonstruktion nicht protokollierter Seitenaufrufe 59
5.6 Clusteranalyse 60
5.7 Bewertung der Auswertungsverfahren 61
6. Steuerung und Optimierung des Online-Marketings 62
6.1 Relevanz des Nutzungsprofils für das Marketing 62
6.1.1 Informationsgehalt der Gesamtanalyse 62
6.1.2 Informationsgehalt der Zeitanalyse 62
6.1.3 Informationsgehalt der Seitenanalyse 63
6.1.4 Informationsgehalt der Besucheranalyse 63
6.1.5 Informationsgehalt der Pfadanalyse 63
6.1.6 Informationsgehalt der AdClick- und Refereranalyse 64
6.1.6.1 Beispiel: Ertragsoptimierte Allokation des Online-Werbebudgets durch Verwendung von AdClicks 64
6.1.6.2 Beispiel: Optimierung der Werbeeffizienz anhand der CTR 66
6.1.7 Informationsgehalt der Technikanalyse 66
6.2 Erweiterung des Nutzungs- zum Nutzerprofil 67
6.2.1 Zusätzliche Messkriterien der Erfolgskontrolle 68
6.2.1.1 Besucher und Kunden 68
6.2.1.2 Quote Kunde/Besucher 68
6.2.1.3 Besucherpreis 68
6.2.1.4 Kundenpreis 68
6.2.2 Verfahren und Techniken zur Erhebung von personenbezogenen Daten 69
6.2.2.1 Online-Befragung 69
6.2.2.2 Cookies 69
6.2.2.3 Benutzerkennung und Passwort 71
6.2.2.4 Push-Services (Datenfilter-Programme) 71
6.2.2.5 Lucent Personalized Web Assistent (LPWA) 72
6.2.3 Exkurs: Tarnprogramme 73
7. Rechtliche Betrachtung unter dem Aspekt des Datenschutzes 74
8. Zusammenfassende Beurteilung der Logfile-Analysen 76
8.1 Technologische Beurteilung 76
8.2 Marketingtechnische Beurteilung 76
8.3 Rechtliche Beurteilung 77
9. Zusammenfassung 77
Literaturverzeichnis 79
Aus dem Internet entnommene Literatur 83
Anhang 88
Anhang A A1
Anhang B B1
Anhang C C1
Anhang D D1
Anhang E E1
Anhang F F1
Anhang G G1
Anhang H H1

Automatisiert erstellter Textauszug:

47 Inhalt eines Frames als Content. Damit wird sichergestellt, dass der Erstabruf des Framesets nur als eine PageImpression gezählt wird. Signifikante Verzerrungen nach oben ergeben sich, wenn das komplette Frameset jedes Mal als drei Einzelseiten gezählt wird [IVW 2001]. 5.3.7 Self-Referer Manche Statistiken erfassen Links innerhalb der eigenen Website als neuen Zugriff. Im Logfile ist in diesem Fall der Hostname der angeforderten Datei und der der Zugriffsherkunft identisch. Werden diese Self-Referer von der Statistik nicht separat als Eigenverweise aufgelistet, sollte der Logfile vor einer Analyse bereinigt werden, um eine korrekte, unverzerrte Auswertung zu erhalten. 5.3.8 Eigene Zugriffe Zugriffe von Angestellten des eigenen Unternehmens erhöhen die Abfragezahlen. Darunter befinden sich auch Zugriffe der Programmierer und Designer, die zu Testzwecken erfolgten. Ein gesonderter Ausweis von firmeneigenen Zugriffen ist jedoch nur unter bestimmten technischen Voraussetzungen möglich. Im allgemeinen kann die Verzerrung aber vernachlässigt werden, da sie normalverteilt ist [BÜRLIMANN 1999, S. 222]. 5.3.9 Suchmaschinen Da Abfragestatistiken nicht erkennen können, wer der Besucher ist, werden auch Besuche von Suchmaschinen, Spidern und Link-Checkern mitgezählt. Durch eine normalverteilte Besuchsfrequenz machen sich die Verzerrungen in einer durchschnittlich konstanten Steigerung der Abfragezahlen bemerkbar, die meist unterhalb eines Prozentes liegt [BÜRLIMANN 1999, S. 219]. 5.3.10 Sessions Rückschlüsse auf die Anzahl der Besucher sind anhand der Sessions nur bedingt möglich, da das Ende einer Session nicht eindeutig festgestellt werden kann. Während der Beginn einer Session eindeutig zu erkennen ist, kann nicht so einfach registriert werden, wann der User die Seite wieder verlässt, indem er einen Link verfolgt oder eine neue Adresse eingibt. „Wenn der Kunde explizit eine Transaktion bestätigt hat oder explizit eine Transaktion abgebrochen hat, können wir [...]

5.3.5 Öffentliche Rechner Wird ein Computer von verschiedenen Usern verwendet, wie beispielsweise die Rechner in Universitäten, Internetcafés oder Bibliotheken, weist die Statistik ebenfalls weniger Besucher aus als real auf die Seite zugegriffen haben, da Zugriffe der Einzelpersonen nicht differenziert erfasst werden können. Egal wieviele unterschiedliche Personen eine Seite aufrufen, gezählt wird der Zugriff von einem Host nur einmal. Einigermaßen zuverlässige Daten können nur durch zusätzliche Stichproben und Hochrechnungen erreicht werden [KELLER 1997, S. 192f]. 5.3.6 Framesets Ein Frameset ist eine aus mehreren HTML-Dokumenten bestehende Internetseite. Enthält ein Internetangebot beispielsweise zwei Frames, so werden drei unterschiedliche HTML-Dokumente gleichzeitig auf dem Monitor angezeigt: das Frameset und die beiden darin eingebetteten Inhaltsseiten. Die Zählweisen für Frames sind je nach Statistik unterschiedlich. Nach der IVW (Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern e.V.) zählt nur der [...]

5.3.4 Cache Das oben bereits beschriebene Problem der Zwischenspeicherung bei der korrekten Erfassung des Nutzungsverhaltens wird durch den Cache des Computers bewirkt. Der Cache ist ein Zwischenspeicher, der die Festplatte ergänzt. Er speichert einmal über das Netz angeforderte Seiten inklusive der eingebundenen und bereits übertragenen Ressourcen eine zeitlang auf der Festplatte des Internetnutzers. Klickt der User auf den Zurück- oder Vorwärts-Button des Browsers (bzw. die entsprechende Funktion der rechten Mouse-Taste), um zu einer bereits gesehenen Seite zurückzukehren, greift der Browser auf die im Cache gespeicherten Seiten zu, ohne diese erneut beim Server anzufordern. Möglich wird dadurch auch eine Offline-Nutzung der Website. [...]

Arbeit zitieren:
Marschall, Nicole Oktober 2001: Analyse von Logfile-Statistiken zur absatzpolitischen Auswertung von Internetpräsenzen, Hamburg: Diplomica Verlag

Schlagworte:
Logfiles, Zielgruppenanalyse, Webserver-Analyse, Client/Server-Kommunikation, Internet-Marketing

Entdecken Sie mehr zum Thema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren