Data Mining mit genetischen Algorithmen
Eine theoretische und empirische Untersuchung ausgewählter Aufgabenstellungen
- Art: Diplomarbeit
- Autor: Carl-Christian Buhr
- Abgabedatum: April 2001
- Umfang: 101 Seiten
- Dateigröße: 4,9 MB
- Note: 1,3
- Institution / Hochschule: Rheinisch-Westfälische Technische Hochschule Aachen (RWTH) Deutschland
- ISBN (eBook): 978-3-8324-4239-2
-
ISBN (Paperback) :
978-3-8324-4239-2 P - ISBN (CD) :978-3-8324-4239-2 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Buhr, Carl-Christian April 2001: Data Mining mit genetischen Algorithmen, Hamburg: Diplomica Verlag
- Schlagworte: Informationssysteme, Data Warehouse, Genetische Algoritmen, Maschninelles Lernen, Data Minig
In den Warenkorb
58,00 €
Diplomarbeit von Carl-Christian Buhr
Einleitung:
Data Mining (DM) ist ein Oberbegriff für eine Reihe von Verfahren, die zur automatischen Gewinnung von Informationen aus großen Datenmengen dienen. Genetische Algorithmen (GA) sind Such- und Optimierungsverfahren, die in Analogie zur biologischen Evolution arbeiten und für DM-Aufgaben eingesetzt werden können. Dies geschieht bislang nur sporadisch und an untergeordneter Stelle. Die steigende Verfügbarkeit leistungsstarker Hardware und paralleler Systemarchitekturen machen die Benutzung von GA aber auch für die routinemäßig anfallenden Aufgaben der Datenanalyse immer interessanter.
Das Ziel der Arbeit ist die Untersuchung von GA als Lösungsverfahren für typische DM-Aufgaben der Unternehmenspraxis.
Dazu wird zum einen die prinzipielle Vorgehensweise beim Erfüllen von DM-Aufgaben mit GA diskutiert. Eine Analyse von DM-Aufgaben führt darüber hinaus zu einer Systematisierung in mehrere Aufgaben-Klassen, die sich hinsichtlich ihrer Relevanz für unternehmerische Fragestellungen unterscheiden. Für die wichtigsten dieser Klassen werden konkrete GA-Konfigurationen vorgeschlagen und anschließend anhand von Beispieldaten in mehreren Experimenten erprobt, um auf empirischem Wege Hinweise auf ihre Brauchbarkeit zu gewinnen.
Dem potentiellen Benutzer werden die Potentiale von GA zum DM verdeutlicht und darüber hinaus Hilfestellungen gegeben, die eine praktische Anwendung dieser Methode erleichtern.
Inhaltsverzeichnis:
| 1. | Einleitung | 1 |
| 1.1 | Motivation | 1 |
| 1.2 | Problemstellung | 2 |
| 1.3 | Gang der Untersuchung | 2 |
| 2. | Data Mining - Grundlagen und Methoden | 3 |
| 2.1 | Formalisierungen | 3 |
| 2.2 | Begriffsabgrenzung | 4 |
| 2.3 | Einflussfaktoren für die Methodenwahl | 6 |
| 2.4 | Unterschiedliche Daten | 6 |
| 2.5 | Unterschiedliche Ziele | 7 |
| 2.5.1 | Übersicht | 7 |
| 2.5.2 | Ableitungsvorschriften | 8 |
| 2.5.3 | Verknüpfungsregeln | 10 |
| 2.5.4 | Segmentierung | 13 |
| 2.5.5 | Datenbeschreibung | 14 |
| 2.6 | Ausgewählte Verfahren des Data Mining | 15 |
| 2.6.1 | Übersicht | 15 |
| 2.6.2 | Market Basket Analysis | 16 |
| 2.6.3 | Regelinduktion | 18 |
| 2.6.4 | Case-based Reasoning | 20 |
| 2.6.5 | Neuronale Netze | 22 |
| 2.6.6 | Bayes-Netze | 24 |
| 2.6.7 | Rough Set Theory | 26 |
| 2.6.8 | Explorative Datenanalyse | 27 |
| 2.7 | Logische Grenzen der Aussagefähigkeit entdeckter Muster | 28 |
| 3. | Genetische Algorithmen | 30 |
| 3.1 | Überblick | 30 |
| 3.2 | Parallelen zur Evolutionstheorie | 32 |
| 3.3 | Problemrepräsentation | 33 |
| 3.3.1 | Bitkodierung | 33 |
| 3.3.2 | Andere Kodierungsmöglichkeiten | 35 |
| 3.3.3 | Suchraum und Fitnesslandschaft | 36 |
| 3.4 | Populationen | 38 |
| 3.4.1 | Populationsgröße | 38 |
| 3.4.2 | Initialisierungsstrategie | 39 |
| 3.4.3 | Generationsersetzung | 39 |
| 3.4.4 | Populationsstruktur | 40 |
| 3.5 | Fitneßfunktion | 41 |
| 3.6 | Selektion | 42 |
| 3.7 | Genetische Operatoren | 43 |
| 3.7.1 | Crossover | 43 |
| 3.7.2 | Mutation | 46 |
| 3.7.3 | Parametersetzung | 48 |
| 3.8 | Abbruchkriterium | 49 |
| 3.9 | Weitergehende Varianten genetischer Algorithmen | 49 |
| 3.9.1 | Parallele genetische Algorithmen | 49 |
| 3.9.2 | Hybride genetische Algorithmen | 50 |
| 3.10 | Theoretischer Hintergrund | 51 |
| 4. | Genetische Algorithmen zur Lösung typischer Data-Mining-Aufgaben | 54 |
| 4.1 | Gründe für die Benutzung von GA | 54 |
| 4.2 | Prinzipielle Vorgehensweise | 55 |
| 4.3 | Systematisierung von DM-Aufgaben | 58 |
| 4.4 | Konfigurationen für ausgewählte Aufgabenstellungen | 59 |
| 4.4.1 | Relevante Aufgabenstellungen | 59 |
| 4.4.2 | Konfigurationsempfehlungen | 61 |
| 4.4.2.1 | Generelle Überlegungen | 61 |
| 4.4.2.2 | Konfigurationsempfehlungen für Suchproblem I | 62 |
| 4.4.2.3 | Konfigurationsempfehlungen für Suchproblem II | 68 |
| 4.4.2.4 | Konfigurationsempfehlungen für Suchproblem IV | 69 |
| 4.4.2.5 | Konfigurationsempfehlungen für Suchproblem VII | 70 |
| 4.4.2.6 | Konfigurationsempfehlungen für Suchproblem VIII | 72 |
| 5. | Empirische Tests der Konfigurationsvorschläge | 73 |
| 5.1 | Untersuchungsaufbau | 73 |
| 5.1.1 | Leistungsmessung | 73 |
| 5.1.2 | Versuchsdaten | 74 |
| 5.1.3 | Versuchsumgebung | 75 |
| 5.2 | Aggregierte Versuchsergebnisse | 76 |
| 5.3 | Interpretation der Ergebnisse | 78 |
| 6. | Fazit und Ausblick | 80 |
In den Warenkorb
58,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832442392
Arbeit zitieren:
Buhr, Carl-Christian April 2001: Data Mining mit genetischen Algorithmen, Hamburg: Diplomica Verlag
Schlagworte:
Informationssysteme, Data Warehouse, Genetische Algoritmen, Maschninelles Lernen, Data Minig



