Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Data Mining mit genetischen Algorithmen

Eine theoretische und empirische Untersuchung ausgewählter Aufgabenstellungen

Data Mining mit genetischen Algorithmen
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Carl-Christian Buhr
  • Abgabedatum: April 2001
  • Umfang: 101 Seiten
  • Dateigröße: 4,9 MB
  • Note: 1,3
  • Institution / Hochschule: Rheinisch-Westfälische Technische Hochschule Aachen (RWTH) Deutschland
  • ISBN (eBook): 978-3-8324-4239-2
  • ISBN (Paperback) :
    978-3-8324-4239-2 P
  • ISBN (CD) :978-3-8324-4239-2 CD
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Buhr, Carl-Christian April 2001: Data Mining mit genetischen Algorithmen, Hamburg: Diplomica Verlag
  • Schlagworte: Informationssysteme, Data Warehouse, Genetische Algoritmen, Maschninelles Lernen, Data Minig

Diplomarbeit von Carl-Christian Buhr

Einleitung:

Data Mining (DM) ist ein Oberbegriff für eine Reihe von Verfahren, die zur automatischen Gewinnung von Informationen aus großen Datenmengen dienen. Genetische Algorithmen (GA) sind Such- und Optimierungsverfahren, die in Analogie zur biologischen Evolution arbeiten und für DM-Aufgaben eingesetzt werden können. Dies geschieht bislang nur sporadisch und an untergeordneter Stelle. Die steigende Verfügbarkeit leistungsstarker Hardware und paralleler Systemarchitekturen machen die Benutzung von GA aber auch für die routinemäßig anfallenden Aufgaben der Datenanalyse immer interessanter.

Das Ziel der Arbeit ist die Untersuchung von GA als Lösungsverfahren für typische DM-Aufgaben der Unternehmenspraxis.

Dazu wird zum einen die prinzipielle Vorgehensweise beim Erfüllen von DM-Aufgaben mit GA diskutiert. Eine Analyse von DM-Aufgaben führt darüber hinaus zu einer Systematisierung in mehrere Aufgaben-Klassen, die sich hinsichtlich ihrer Relevanz für unternehmerische Fragestellungen unterscheiden. Für die wichtigsten dieser Klassen werden konkrete GA-Konfigurationen vorgeschlagen und anschließend anhand von Beispieldaten in mehreren Experimenten erprobt, um auf empirischem Wege Hinweise auf ihre Brauchbarkeit zu gewinnen.

Dem potentiellen Benutzer werden die Potentiale von GA zum DM verdeutlicht und darüber hinaus Hilfestellungen gegeben, die eine praktische Anwendung dieser Methode erleichtern.

Inhaltsverzeichnis:

1. Einleitung 1
1.1 Motivation 1
1.2 Problemstellung 2
1.3 Gang der Untersuchung 2
2. Data Mining - Grundlagen und Methoden 3
2.1 Formalisierungen 3
2.2 Begriffsabgrenzung 4
2.3 Einflussfaktoren für die Methodenwahl 6
2.4 Unterschiedliche Daten 6
2.5 Unterschiedliche Ziele 7
2.5.1 Übersicht 7
2.5.2 Ableitungsvorschriften 8
2.5.3 Verknüpfungsregeln 10
2.5.4 Segmentierung 13
2.5.5 Datenbeschreibung 14
2.6 Ausgewählte Verfahren des Data Mining 15
2.6.1 Übersicht 15
2.6.2 Market Basket Analysis 16
2.6.3 Regelinduktion 18
2.6.4 Case-based Reasoning 20
2.6.5 Neuronale Netze 22
2.6.6 Bayes-Netze 24
2.6.7 Rough Set Theory 26
2.6.8 Explorative Datenanalyse 27
2.7 Logische Grenzen der Aussagefähigkeit entdeckter Muster 28
3. Genetische Algorithmen 30
3.1 Überblick 30
3.2 Parallelen zur Evolutionstheorie 32
3.3 Problemrepräsentation 33
3.3.1 Bitkodierung 33
3.3.2 Andere Kodierungsmöglichkeiten 35
3.3.3 Suchraum und Fitnesslandschaft 36
3.4 Populationen 38
3.4.1 Populationsgröße 38
3.4.2 Initialisierungsstrategie 39
3.4.3 Generationsersetzung 39
3.4.4 Populationsstruktur 40
3.5 Fitneßfunktion 41
3.6 Selektion 42
3.7 Genetische Operatoren 43
3.7.1 Crossover 43
3.7.2 Mutation 46
3.7.3 Parametersetzung 48
3.8 Abbruchkriterium 49
3.9 Weitergehende Varianten genetischer Algorithmen 49
3.9.1 Parallele genetische Algorithmen 49
3.9.2 Hybride genetische Algorithmen 50
3.10 Theoretischer Hintergrund 51
4. Genetische Algorithmen zur Lösung typischer Data-Mining-Aufgaben 54
4.1 Gründe für die Benutzung von GA 54
4.2 Prinzipielle Vorgehensweise 55
4.3 Systematisierung von DM-Aufgaben 58
4.4 Konfigurationen für ausgewählte Aufgabenstellungen 59
4.4.1 Relevante Aufgabenstellungen 59
4.4.2 Konfigurationsempfehlungen 61
4.4.2.1 Generelle Überlegungen 61
4.4.2.2 Konfigurationsempfehlungen für Suchproblem I 62
4.4.2.3 Konfigurationsempfehlungen für Suchproblem II 68
4.4.2.4 Konfigurationsempfehlungen für Suchproblem IV 69
4.4.2.5 Konfigurationsempfehlungen für Suchproblem VII 70
4.4.2.6 Konfigurationsempfehlungen für Suchproblem VIII 72
5. Empirische Tests der Konfigurationsvorschläge 73
5.1 Untersuchungsaufbau 73
5.1.1 Leistungsmessung 73
5.1.2 Versuchsdaten 74
5.1.3 Versuchsumgebung 75
5.2 Aggregierte Versuchsergebnisse 76
5.3 Interpretation der Ergebnisse 78
6. Fazit und Ausblick 80

Arbeit zitieren:
Buhr, Carl-Christian April 2001: Data Mining mit genetischen Algorithmen, Hamburg: Diplomica Verlag

Schlagworte:
Informationssysteme, Data Warehouse, Genetische Algoritmen, Maschninelles Lernen, Data Minig

Entdecken Sie mehr zum Thema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren