Neuer Kausalanalyseansatz auf Basis Neuronaler Netze als Instrument der Marketingforschung
- Art: Dissertation / Doktorarbeit
- Autor: Frank Buckler
- Abgabedatum: Juli 2001
- Umfang: 290 Seiten
- Dateigröße: 1,7 MB
- Note: 1,0
- Institution / Hochschule: Leibniz Universität Hannover Deutschland
- Bibliografie: ca. 177
- ISBN (eBook): 978-3-8366-1525-9
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Buckler, Frank Juli 2001: Neuer Kausalanalyseansatz auf Basis Neuronaler Netze als Instrument der Marketingforschung, Hamburg: Diplomica Verlag
- Schlagworte: Kausalanalyse, Lisrel, Partial Least Squares, Data Mining, Neuronales Netz
58,00 €
PDF-eBook Download: 58,00 €
Dissertation / Doktorarbeit von Frank Buckler
Einleitung:
Das Marketingmanagement steht heute vor größeren Herausforderungen als je zuvor. Um diesen gerecht zu werden, sind nach der Entstehung des Leitbildes der Kundenorientierung umfassendere Marketingkonzepte entwickelt worden, die in dem Ansatz eines gesellschaftsorientierten Marketing gipfeln. Ursächlich für die Notwendigkeit neuer Marketingkonzepte und -instrumente ist die zunehmende Komplexität und Dynamik von Managementproblemstellungen, die durch eine Vielzahl marktlicher, gesellschaftlicher und technologischer Entwicklungen verursacht werden:
Differenzierung der Kundenbedürfnisse: Der Wettbewerb hat in vielen Branchen zu der Entstehung einer enormen Variantenvielfalt geführt, welche auf Basis immer kleinerer Zielgruppensegmente dem Kunden ein möglichst bedürfnisgerechtes Angebot unterbreitet. Der Trend hin zum One-to-One Marketing auf Basis eines Mass Customization der Leistungserstellung belegt dies. Mit dem Begriff der Anspruchsinflation wird der Trend bezeichnet, dass der Kunde zunehmend hohe Leistungsstandards gewohnt ist und diese daraufhin als Mindestleistung einfordert. Eine weitere Facette komplexer werdender Kundenbedürfnisse besteht im sogenannten hybriden Konsumentenverhalten, das beispielsweise darin zu beobachten ist, dass ein und der selbe Kunden sich in bestimmten Produktgruppen generös und in anderen geizig zeigt.
Wertewandel und dessen Pluralisierung: Die Permanenz des Wandels von Werten und Normen stellt nicht nur in Hinblick auf die Ausgestaltung des Marketing, sondern ebenfalls bei der Aufgabe der Mitarbeiterführung eines Managers eine ständige Herausforderung dar. Darüber hinaus ist in den letzten Jahrzehnten eine Pluralisierung von Wertesystemen zu beobachten, die u.a. darin zu besteht, dass innerhalb einer Generation unterschiedliche Wertecluster zu beobachten sind.
Erosion von Hierarchien: Den Höhepunkt der industriellen Enthierarchisierung wurde in den 80er Jahren mit der Popularität des Konzepts eines Business Process Reengeniering und eines Lean Management erreicht. In jüngerer Zeit setzt sich die Erosion durch die zunehmende Verbreitung des Konzepts der Projektorganisation und der Entstehung von Virtuellen Unternehmen fort. In der Konsequenz führen die Entwicklungen zu breiteren und zugleich dynamischer ausgelegten Verantwortungsbereichen eines Managers, der sich dadurch vor wachsende und zugleich sich ändernde Anforderungen gestellt sieht.
Globalisierung der Märkte: Fallende Handelsschranken, fallende Migrationsbarrieren für Arbeitskräfte und die modernen Kommunikationsmöglichkeiten (dazu ausführlich im nächsten Absatz) haben zu einer weiter andauernden Internationalisierung der Märkte geführt. Die steigende Anzahl von Wettbewerbern führt auf vielen Märkten zu stetig steigendem Wettbewerbsdruck. Zudem verlangt die Globalisierung von einem Manager für das externe ebenso wie für das interne Marketing eine ausgeprägte interkulturelle Kompetenz.
Revolutionäre Technologiesprünge: Den vermutlich gravierendsten Beitrag zur steigenden Komplexität und Dynamik der Managementaufgabe liefern die Auswirkungen revolutionärer technologischer Entwicklungen insbesondere von Informations- und Kommunikationstechnologien (I&K). Beispielhaft seien im Folgenden sechs bedeutende Auswirkungen dargestellt:
Steigende Markttransparenz: Insbesondere durch die Entwicklung des Internets ist es auf der einen Seite für den Kunden einfacher geworden, Anbieter zu vergleichen. Auf der anderen Seite ist es auch für Unternehmen einfacher geworden Konkurrenzanalysen durchzuführen und aktuelle Marktentwicklungen zeitnah aufzugreifen. Zudem helfen Informationsintermediäre durch die Sammlung und Auswertung von Informationen, die Transparenz der Märkte zu erhöhen. All dies führt zu einem höheren qualitativen und auch zeitlichen Wettbewerbsdruck.
Neue Marktregeln: Die immer schnellere Verbreitung von Informationen, die zunehmende informatorische Vernetzung und der sich damit beschleunigende wissenschaftliche Fortschritt führt zu einer Entwicklung von der Effizienzorientierung hin zur Innovationsorientierung. Aufgrund der hohen Innovationsdynamik in der Zukunft wird eine Effizienzorientierung im Management zunehmend mit einer hocheffizienten Produktion von veralteten Gütern einhergehen. Weiterhin führt die weltweite Vernetzung durch das Internet zu einer steigenden Bedeutung von Netzeffekten, die es ermöglichen, steigende Skalenerträge zu generieren. Vormals undenkbare Marketingstrategien, die beispielsweise vorsehen, das Kernprodukt zu verschenken und aufbauend auf den dadurch entstandenen Standard, Zusatzleistungen zu verkaufen, bereichern das Handlungsspektrum sowohl für das Unternehmen als auch für seine Konkurrenten.
Exponentiell steigende Datenberge: Es gibt kaum noch Transaktionen im Wirtschaftsleben, die nicht durch I&K-Technologien unterstützt werden - ob es die Scannerkasse oder das Versenden von Paketen ist, dessen Versendestaus heute schon online abgefragt werden kann. Auf Websites, an Bankautomaten, an der Parkhausschranke, in all den hochtechnologischen Produktionsanlagen ebenso wie beim Telefonieren - überall fallen täglich nahezu unendlich viele digital speicherungsfähige Informationen an. Damit sind für zunehmend viele Bereiche der relevanten Umwelt Beobachtungsdaten vorhanden, woraus die Forderung an das Management abgeleitet wird, diese Informationen auszuwerten.
Kürzere Produktlebenszyklen: Der technologische Fortschritt ermöglicht immer kürzere Entwicklungszeiten. Beispielsweise lag die Entwicklungszeit eines Automobils vor 20 Jahren bei ca. zwölf Jahren, wohingegen heutzutage ein Automobil in 2,5 Jahren entwickelt werden kann. Die kürzeren Produktlebenszyklen machen es u.a. notwendig, ein Produkt in einem kürzeren Zeitraum zu amortisieren.
Neue Benutzeranforderungen: Der technologische Fortschritt hat dazu geführt, dass sich nahezu an jedem Arbeitsplatz ein PC befindet, Mitarbeiter mit Office-Softwarepaketen genauso vertraut sein müssen wie mit Fax, E-Mail und virtuellen Konferenzen. Der permanente Druck, sich mit neuen Werkzeugen des Informationszeitalters auseinander zu setzen, erfordert ein beständiges Bemühen des Mitarbeiters ebenso wie des Managers um das Erlernen neuer Fähigkeiten. Zudem führen die neuen Werkzeuge wie z.B. die Textverarbeitung dazu, dass ein Manager zunehmend mehr Tätigkeitsbereiche mit übernehmen muss, die vormals speziellen Hilfskräften überlassen wurden.
Zunehmender Kommunikationsaufwand: Neue Telekommunikationsdienste (insbesondere E-Mail und Instant Messaging) ermöglichen es, eine Kommunikation unter sehr niedrigen transaktionsbedingten und sozialen Kosten zu initiieren. So gehört es heute schon zum Alltag der meisten Manager, täglich mindestens eine Stunde mit dem Überfliegen der E-Mails zu verbringen. Die Vorzüge der neuen Kommunikationsdienste werden mit höherem Kommunikationsaufwand und gestiegenen Erwartungen an die Antwortgeschwindigkeit erkauft .
Die beschriebenen Beispiele für bestehende Trends im Konsumentenverhalten, für gesellschaftliche und ökonomische Trends sowie für die vielschichtigen Auswirkungen moderner I&K-Technologien zeigen anschaulich, wie die Anforderungen an das Marketingmanagement in ihrer Komplexität und Dynamik zunehmen.
Hinzu kommt, dass ein Manager nach wie vor den selben Zeitumfang zur Bewältigung seiner Aufgaben zur Verfügung hat und somit keine zusätzlichen kognitiven Ressourcen einbringen kann. Neben der in obigen Punkten 4 und 6 beschriebenen zunehmenden Informationsüberlastung (Information Overload) sieht Toffler das Hauptproblem der Informationsgesellschaft in einer Entscheidungsüberlastung (Decision Overload). Weder ist genügend Zeit zur Auswahl von Entscheidungsalternativen vorhanden (Option Paralysis), noch kann die steigende Anzahl an Entscheidungsproblemen bearbeitet werden.
Um den gestiegenen Anforderungen zu entsprechen, existieren zwei grundsätzliche Herangehensweisen. Eine Möglichkeit ist es, mehr Personal mit der Bearbeitung der Problemstellungen zu betrauen. Eine andere ist es, die kognitiven Ressourcen der Entscheidungsträger virtuell zu erhöhen, indem Systeme zur Entscheidungsunterstützung in Teilen gänzlich automatisiert Informationen verarbeiten und Erkenntnisse generieren, präsentieren und anwenden. Für die Errichtung von computergestützten Systemen zur Entscheidungsunterstützung spricht, dass Zusammenhänge ab einer bestimmten Komplexität nicht mehr vom Menschen verstanden werden können.
Daher werden leistungsfähige Analyseverfahren benötigt, die selbständig Datensätze auswerten, Wissen extrahieren und Entscheidungsalternativen bewerten helfen.
Stand der Analyseverfahren: Die Statistik ist das wissenschaftliche Fachgebiet, welches sich vornehmlich mit der Entwicklung von Verfahren beschäftigt, die Sachverhalte anhand von Daten geeignet beschreiben (deskriptive Statistik) und Zusammenhänge aus Datensätzen schließen können (induktive Statistik). Verfahren der klassischen Statistik sind jedoch wenig geeignet, um aus Datensätzen auf komplexe Zusammenhänge zu schließen, ohne über diese Zusammenhänge erhebliches Vorwissen zu besitzen.
Aus der Notwendigkeit heraus für das Management komplexe Zusammenhänge aus Datensätzen entdecken zu müssen, ohne über diese Vorwissen zu besitzen, sind in den vergangenen Jahrzehnten die interdisziplinären Forschungsgebiete des Knowledge Discovery in Databases (KDD) und des Data Mining entstanden. Da es sich um noch junge Fachgebiete handelt, existieren verschiedene Begriffsdefinitionen. Die verbreitetsten Definitionen der Begriffe sind Knowledge Discovery in Databases (KDD) bezeichnet den nichttrivialen Prozess der Identifikation valider, neuartiger, potenziell nützlicher und klar verständlicher Muster in Daten.
Data Mining ist ein Teilschritt des KDD-Prozesses, der aus bestimmten Algorithmen besteht, die in akzeptabler Rechenzeit aus einer vorgegebenen Datenbasis eine Menge von Mustern liefern.
Das Data Mining bezeichnet somit den Analyseprozess im engeren Sinne und greift auf eine Vielzahl von Lernalgorithmen (wie Neuronale Netze, Entscheidungsbäume, Assoziationsregeln und auch klassische statistische Verfahren) zurück. Das Wort Muster in obigen Definitionen steht im weiteren Sinne für Zusammenhänge bzw. Wirkbeziehungen. Die durch die Ergebnisse des Data Mining beschriebenen Kontingenzen lassen jedoch nicht immer einen Kausalschluss zu, so dass das Wort Muster die Abwesenheit eines kausalen Anspruchs verdeutlicht. Auf der anderen Seite ist die Kausalität ein integraler Bestandteil einer Theorie. Bewusstes Handeln beruht grundsätzlich auf (subjektiven) Theorien über die relevante Umwelt. Zudem wird eine Kausalaussage benötigt, wenn die entdeckten Zusammenhänge mit Hilfe des menschlichen Bedeutungswissens durch deduktives Schließen weiterverwendet werden sollen. Daher ist die Untersuchung der Kausalaussage entdeckter Muster ein wichtiger Schritt zur Ableitung von Handlungsempfehlungen für das Management. Im KDD-Prozess wird die Kausalinterpretation im letzten Prozessschritt (insofern möglich) auf der Basis von Vorwissen „rein manuell“ vorgenommen.
In der Statistik sind Verfahren der Kausalanalyse (LISREL, PLS etc.) entwickelt worden. Diese sind jedoch aus der Tradition der klassischen Statistik entstanden und können daher keine komplexen Zusammenhänge nachbilden und erfordern ein hohes Maß an Vorwissen über die zu beschreibenden Zusammenhänge.
Die Verfahrensgruppe des Systems Dynamics können im Gegensatz zur klassischen Kausalanalyse komplexe Zusammenhänge darstellen und simulieren. In neueren Ansätzen ist es zudem möglich, System Dynamics-Systeme anhand von empirischen Daten zu validieren und Parameter anzupassen. Jedoch fehlt dem erweiterten System Dynamics-Ansatz auch der entdeckende Charakter, der benötigt wird, wenn wenig Vorwissen über die gesuchten Zusammenhänge vorhanden ist.
Gang der Untersuchung:
In der Grundlegung in Abschnitt 2 soll ausgehend von einer Darstellung der Ziele der Marketingforschung der Kausalitätsbegriff im Detail beleuchtet werden. Nach einer Definition des Begriffs der Kausalanalyse wird der Ansatz der klassischen Kausalanalyse am Beispiel des LISREL-Ansatzes beschrieben und Erweiterungen des Ansatzes vorgestellt. Im Anschluss daran sollen die grundlegenden Eigenschaften von Problemstellungen der Marketingforschung anhand von Beispielen erarbeitet werden. Daraus wird ein Anforderungskatalog an eine neue Kausalanalyse abgeleitet.
Abschnitt 3 trägt die methodischen Grundlagen für eine neue Kausalanalyse zusammen. Dabei wird zunächst der Anforderungskatalog in dafür notwendige Eigenschaften der verwendeten Methoden transformiert. Es wird geschlußfolgert, dass die verwendete Methodik a) umfassendes Lernvermögen besitzen, b) insbesondere wichtige von unwichtigen Variablen unterscheiden und c) das erlernte Modell verständlich darstellen muss.
Aufbauend auf einer grundlegenden Darstellung des Gegenstandes des Lernens werden vier der leistungsfähigsten Lernverfahren im Detail beschrieben. Im nachfolgenden Vergleich (der anhand eines Bewertungsmodells durchgeführt wird) wird geschlußfolgert, dass zwei der vorgestellten Lernverfahren für eine neue Kausalanalyse geeignet sind. Die Darstellung der nichtgeeigneten Verfahren ist jedoch nützlich, da diese als Grundlage für geeignete Verfahren dienen bzw. im darauffolgenden Kapitel als Benchmark benötigt werden. Beim Vergleich der Lernverfahren werden diese in einem separaten Abschnitt auf ihre Fähigkeit untersucht, wichtige von unwichtigen Variablen unterscheiden zu können.
Daraufhin sollen in Abschnitt 3.3 Verfahren vorgestellt werden, die es ermöglichen, Analyseergebnisse verständlich darzustellen. Dazu wird zu Beginn des Abschnittes eine detaillierte Analyse des menschlichen Verstehensprozesses notwendig, um die Zieldimension der gesuchten Verfahren herausarbeiten zu können. Darauf aufbauend werden skizzenhaft Lernverfahren, die verständliche Ergebnisse produzieren, vorgestellt und argumentiert, dass diese nicht in ausreichendem Maße geeignet sind. Als Alternative werden Verfahren vorgestellt, die auf Basis des Ergebnisses eines Lernverfahrens verständliche Aussagen extrahieren können.
In Abschnitt 4 wird eine neue Methodik der Kausalanalyse vorgeschlagen und empirisch getestet. Aufbauend auf der Darstellung des grundlegenden Ansatzes werden alle Prozessstufen der als NEUSREL bezeichneten Analyse beschrieben und dabei definiert, welche Verfahren notwendig sind, um die gesetzten Anforderungen erfüllen zu können. Im darauffolgenden Abschnitt 4.3 wird eine Software-Implementation der dargestellten NEUSREL-Analyse vorgestellt und anhand von zwei simulierten Beispielproblemstellungen empirisch getestet. Dabei werden die im Rahmen der Simulationsanalyse generierten Daten durch Modelle realer Marketingproblemstellungen erzeugt, um zusätzlich zur Erklärungsgüte eine inhaltliche Validität gewährleisten zu können.
Die Schlussbetrachtung in Abschnitt 5 vergleicht den LISREL und den NEUSREL-Ansatz miteinander und gibt einen Ausblick über zukünftig notwendige Forschungsfelder der Kausalanalyse. Die Arbeit endet mit einem kompakten Fazit, welches die Kernergebnisse der Arbeit zusammenfasst.
Inhaltsverzeichnis:
| Abbildungsverzeichnis | I | |
| Tabellenverzeichnis | IV | |
| Abkürzungsverzeichnis | V | |
| 1. | Einleitung | 1 |
| 1.1 | Problemstellung | 1 |
| 1.2 | Zielsetzung und Abgrenzung | 8 |
| 1.3 | Gang der Untersuchung | 10 |
| 2. | Grundlegung | 13 |
| 2.1 | Kausalität in der Marketingforschung | 13 |
| 2.1.1 | Ziele der Marketingforschung | 13 |
| 2.1.2 | Der Kausalitätsbegriff | 16 |
| 2.2 | Die klassische Kausalanalyse | 24 |
| 2.2.1 | Ansatz der klassischen Kausalanalyse | 24 |
| 2.2.2 | Die LISREL-Methode | 28 |
| 2.2.3 | Erweiterungen des LISREL-Ansatzes | 36 |
| 2.2.4 | Weitere Ansätze der Kausalanalyse | 40 |
| 2.3 | Grenzen der heutigen Kausalanalyse | 41 |
| 2.3.1 | Beispiele für Problembereiche von LISREL | 41 |
| 2.3.2 | Charakteristiken realer Problemstellungen der Marketingforschung | 47 |
| 2.3.3 | Ableitung von allgemeinen Anforderungen an eine neue Kausalanalyse | 48 |
| 3. | Methodische Grundlagen für eine neue Kausalanalyse | 51 |
| 3.1 | Notwendige methodische Eigenschaften einer neuen Kausalanalyse | 51 |
| 3.2 | Theorie des Lernens | 54 |
| 3.2.1 | Vorbetrachtung: Gegenstand der Lerntheorie | 54 |
| 3.2.1.1 | Der Begriff des Lernens | 54 |
| 3.2.1.2 | Lernen als Funktionsschätzung | 60 |
| 3.2.1.3 | Generalisierungsfähigkeit als Kernzielstellung des Lernens | 63 |
| 3.2.1.4 | Die zwei statistischen Paradigmen des Lernens | 69 |
| 3.2.2 | Moderne frequentistische Lernkonzepte | 76 |
| 3.2.2.1 | Frequentistische Neuronale Netze | 76 |
| 3.2.2.2 | Support-Vektor-Maschinen | 99 |
| 3.2.3 | Moderne bayes'sche Lernkonzepte | 105 |
| 3.2.3.1 | Bayes'sche Neuronale Netze | 113 |
| 3.2.3.2 | Gauß'sche Prozessmodelle | 128 |
| 3.2.4 | Zusammenfassung: Vergleich moderner Lernkonzepte | 136 |
| 3.2.4.1 | Allgemeine Kriterien | 137 |
| 3.2.4.2 | Kriterium: Variablenselektion | 143 |
| 3.3 | Verfahren zur verständlicher Darstellung von aufzudeckenden Zusammenhängen | 149 |
| 3.3.1 | Verständlichkeit | 150 |
| 3.3.1.1 | Sprachverstehen (bzw. Textverstehen) | 150 |
| 3.3.1.2 | Darstellungsformen von Zusammenhängen | 156 |
| 3.3.2 | Einfach interpretierbare Lernverfahren | 162 |
| 3.3.3 | Verfahren zur ex-post Interpretation | 170 |
| 4. | Neural Structural Relationships | 177 |
| 4.1 | Der Ansatz NEUSREL | 177 |
| 4.2 | Aufbau eines NEUSREL-Systems | 182 |
| 4.2.1 | Vorverarbeitung | 183 |
| 4.2.2 | Faktoranalyse | 189 |
| 4.2.3 | Festlegung der A-Priori-Matrix | 193 |
| 4.2.4 | Ermittlung der Wirkzeiten | 195 |
| 4.2.5 | Lernverfahren | 197 |
| 4.2.6 | Präsentation | 199 |
| 4.3 | Empirische Analyse einer NEUSREL-Implementierung | 202 |
| 4.3.1 | Der Ansatz der Monte-Carlo-Simulation | 202 |
| 4.3.2 | Spezifikation der NEUSREL-Implementation | 204 |
| 4.3.3 | Analyse eines Unternehmenserfolg-Modells als dynamische Problemstellung | 211 |
| 4.3.3.1 | Die Problemstellung als Ausgangspunkt | 211 |
| 4.3.3.2 | Durchführung der Analyse | 216 |
| 4.3.3.3 | Ergebnisse | 222 |
| 4.3.4 | Analyse eines Außendienst-Modells als statische Problemstellung | 233 |
| 4.3.4.1 | Die Problemstellung als Ausgangspunkt | 233 |
| 4.3.4.2 | Durchführung der Analyse | 238 |
| 4.3.4.3 | Ergebnisse | 243 |
| 5. | Schlussbetrachtung | 253 |
| 5.1 | Abschließender Vergleich von LISREL und NEUSREL | 253 |
| 5.2 | Ausblick | 254 |
| 5.3 | Fazit | 257 |
| Literaturverzeichnis | 258 |
Textprobe:
Kapitel 4.1, Der Ansatz NEUSREL: Ziel dieser Arbeit ist es, einen kausalanalytischen Methodenverbund vorzustellen, der komplexe Beziehungsstrukturen (auch nichtlineare, interaktive und verzögerte Zusammenhänge) auch zwischen latenten Variablen aufbauend auf Vorwissen anhand eines Datensatzes weitgehend exploratorisch modelliert.
Mit Neural Structural Relationships (kurz NEUSREL) sollen alle Verfahren bezeichnet werden, welche den in diesem Abschnitt beschriebenen Ansatz verfolgen.
Der NEUSREL-Ansatz vollzieht sich in einem dreistufigen Vorgehen. In der ersten Stufe werden mögliche latente Variablen definiert und berechnet sowie sonstige Vorverarbeitungen vorgenommen. In der zweiten Stufe ermittelt ein universeller Funktionsapproximator die Qualität und Quantität der Wirkbeziehungen zu jeder einzelnen Größe bzw. Variable. Die dritte Stufe extrahiert aus den in mathematischer Formelsprache vorliegenden Zusammenhängen die nachvollziehbaren Bestandteile und stellt diese in grafischer Form unterstützt mit Maßzahlen und Kenngrößen dar.
Berechnung der latenten Variablen: Latente Variablen sind theoretische Konstrukte, die nicht direkt beobachtbar und damit nicht direkt messbar sind (z.B. Zufriedenheit). Daher müssen Größen als Indikatoren herangezogen werden, in denen sich die latente Variable implizit ausdrückt. So werden zur Operationalisierung einer latenten Variablen möglichst viele messbare Indikatorvariablen zusammengetragen, deren Kerninformation aus theoretischer Sicht hauptsächlich durch die gesuchte latente Variable verursacht ist. Die in allen Indikatorvariablen enthaltene Kerninformation (die latente Variable) kann mit sogenannten Hauptkomponenten-Analyseverfahren (wie die Faktoranalyse) extrahiert werden. Es wird angenommen, dass der durch die latente Variable nicht zu erklärende Teil der Varianz, auf Zufallseinflüsse bzw. Messfehler zurückgeht. Die latente Variable kann rein analytisch durch die klassische Faktoranalyse oder iterativ durch auf Lernverfahren basierende Faktoranalysen berechnet werden.
Im Gegensatz zum LISREL-Ansatz, welcher die Berechnung der latenten Variablen und der Kausalstruktur simultan durchführt, geht der NEUSREL-Ansatz zweistufig vor. Dies hat den Nachteil, dass die Untersuchung kausaler Abhängigkeiten nicht unter expliziter Berücksichtigung von Messfehlern erfolgen kann. Zwar kann der Messfehler durch eine hohe Anzahl an Indikatorvariablen minimiert werden, eine weitere Zerlegung des verbleibenden Fehlers ist jedoch nicht möglich.
Der Vorteil des zweistufigen Vorgehens ist es, dass differenziertere Definitionen der latenten Variable möglich sind. Zum einen kann eine nichtlineare Faktoranalyse Anwendung finden, wenn es eindeutige Hinweise einer nichtlinearen Wirkung von der latenten Variable auf die Indikatoren gibt. Zum anderen bestehen oftmals verschiedene Definitionen eines Konstruktes und damit mehrere unterschiedliche Faktoren, die nicht orthogonal zueinander stehen müssen. Diese Faktoren kann in der ersten Stufe ein spezielles Neuronales Netz (ein sogenanntes Flaschenhals-Netz) ermitteln. Damit kann NEUSREL zur Analyse heterogener Daten verwendet werden.
Modellierung der Struktur der Zusammenhänge: Die Konstruktion von Kausalstrukturen anhand des NEUSREL-Ansatzes kann sich auf die in Abschnitt 2.2.1 herausgearbeiteten fünf (nicht-hinreichenden) Bedingungen für Kausalität stützen: Kovariation, Vorwissen, Zeitverzögerung, injektive Nichtlinearität und Ausschluss von Drittvariableneffekten.
Nach Granger ist eine Größe genau dann kausal für eine zeitlich gleich- oder nachgelagerte andere Größe, wenn sie zu einer besseren Prognostizierbarkeit der anderen Größe beiträgt. Diesem Ansatz folgend wird nach dem NEUSREL-Ansatz versucht, jede latente Variable für sich jeweils mit Hilfe der restlichen Variablen zu prognostizieren. Hierbei findet je Skalierung der zu erklärenden Variable ein Regressions- oder Klassifikationslernverfahren Anwendung. Das Lernverfahren sollte zur Klasse der universellen Funktionsapproximatoren gehören und das ARD-Verfahren beinhalten. Durch das ARD-Verfahren werden alle nicht zur Prognose notwendigen Variablen ausgesondert und damit als nicht-kausal beurteilt.
Liegen nichtmonotone Zusammenhänge vor (siehe Abschnitt 2.2.1), so wird das Lernverfahren einen zur Prognose relevanten Zusammenhang nur in genau einer Richtung finden. In einem solchen Fall stützt sich die Kausalitätsaussage auf ein zweites Argument für Kausalität.
Vorwissen kann in das Lernverfahren dadurch eingebracht werden, indem a priori bestimmte Zusammenhänge und Wirkungsrichtungen ausgeschlossen werden. In Bayes’schen Lernverfahren kann zusätzlich die Einschätzung eines Experten in Form von subjektiven Wahrscheinlichkeiten (inwieweit ein bestimmter Zusammenhang theoretisch vermutet wird) auf die Modellbildung Einfluss nehmen. Bei einer Wahrscheinlichkeit von Null wird wieder der spezifische Zusammenhang ausgeschlossen.
Weiterhin findet Vorwissen insofern Anwendung, da durch die möglichst vollständige Auswahl aller Variablen für das Modell, die Annahme begründet wird, dass keine weiteren Drittvariableneffekte existieren.
In dynamischen Problemstellungen, in denen die Variablen als Zeitreihen vorliegen, ist es zusätzlich möglich, eventuell vorhandene Wirkzeiten herauszufinden und damit ein schlagkräftiges Argument für das Vorliegen von Kausalität zu erhalten. Die Wirkzeit kann gefolgert werden, wenn jede Variable mehrfach zu unterschiedlichen Zeitpunkten in die Modellbildung eingebracht wird. Das mit ARD ausgestattete Lernverfahren ermittelt dann genau die Zeitverschiebung einer Variablen, die für die Prognose der zu erklärenden Variable benötigt wird.
Dekomposition in nachvollziehbare Teilinformationen: Nachdem die Zusammenhänge zwischen den Variablen ermittelt wurden, liegen sie in Form spezifizierter Neuronaler Netze vor. Bis hierhin kann lediglich eine Aussage darüber getroffen werden, wie viel der Varianz einer jeden Variable aufgeklärt werden konnte.
Mit Hilfe der in Abschnitt 3.3.3 vorgestellten Techniken können aus den ermittelten Zusammenhängen Diagramme der additiven Einflüsse, Interaktionsmaßzahlen als Kenngröße für den Anteil der Interaktionen an der Varianzaufklärung, Wirkstärken für jede einzelne Beziehung, 2D-Plots zur grafischen Darstellung von Interaktionen oder Erstellen von Entscheidungsbäumen zur natürlichsprachlichen Darstellung von Interaktionen und eine komplette Darstellung der Kausalstruktur in einem modifizierten Pfaddiagramm abgeleitet werden.
Zusätzlich zu den bekannten linear-additiven Pfaddiagrammen erhält hier jeder Zusammenhang einen Kasten mit zusätzlichen Informationen. Diese bestehen u.a. aus einem zweidimensionalen Plot (der die Form des Zusammenhangs visualisiert) sowie weiteren wichtigen Maßzahlen, wie das Interaktionsmaß I und die Wirkzeit T.
Der NEUSREL-Ansatz stellt ein neues Paradigma der Kausalanalyse dar. Es ist mit dem Nachteil verbunden, der darin besteht, dass keine rein konfirmatorische Analyse durchgeführt werden kann. Dadurch wird es jedoch möglich, eine Reihe von Vorteilen gegenüber klassischen Verfahren nutzbar zu machen: wenig Vorwissen durch exploratives Vorgehen notwendig, Modellierung nichtlinearer Zusammenhänge, Modellierung interaktiver Zusammenhänge, Ermittlung von Wirkzeiten, Verwendbarkeit von nominell skalierten Variablen, Möglichkeit zur multiplen Konstruktdefinition (im Fall heterogener Daten), Möglichkeit zur nichtlinearen Konstruktdefinition, Verwendung weniger restriktiver Modellannahmen, z.B. der Verteilung der Variablen, Nutzung von bis zu fünf statt bislang nur drei Begründungen für Kausalität, Möglichkeit der Modellierung zirkulärer Systeme (keine Trennung in endogene und exogene Variablen nötig), Optimiert für die Kausalstrukturaufdeckung UND Nutzung zur Prognose.
Kapitel 4.2, Aufbau eines NEUSREL-Systems: Das oben skizzierte Vorgehen eines NEUSREL-Systems lässt sich weiter in sechs Teilschritte differenzieren. Abbildung 4.2-1 zeigt alle sechs Stufen in einem Ablaufdiagramm. Der methodische Aufbau eines NEUSREL-Systems soll im Folgenden entlang dieser Teilschritte im Detail dargestellt werden.
Kapitel 4.2.1, Vorverarbeitung: Bevor ein Datensatz in Rohform einem Neuronalen Netz zugefügt werden kann, müssen bestimmte verfahrensbedingte Besonderheiten beachtet werden. Daher ist eine geeignete Transformation und Ergänzung des Datensatzes notwendig, die jedoch selbst keine Informationen hinzufügt, sondern lediglich die im Datensatz enthaltenen umformt.
Kodierung kategorialer Variablen: Kategoriale (bzw. nominale) Variablen beschreiben die Eigenschaften eines qualitativen Merkmals. Um diese in einer computerbasierten Analyse verwenden zu können, müssen kategoriale Variablen numerisch (also als Zahlen) ausgedrückt werden. Als Kodierung bezeichnet man den Vorgang, der einen qualitativen Zustand mit einem numerischen Code versieht.
Eine dichotome Eigenschaft, wie das Geschlecht, kann mit Hilfe einer binären Variable kodiert werden. Hier geben die zwei erlaubten Zustände 0 (männlich) und 1 (weiblich) eindeutig die Ausprägung der Eigenschaft an. Bei einer polytomen Eigenschaft, wie der des Berufs, gibt es verschiedene Codierungsschemata. Insofern jedoch die Ausprägungen nomineller und nicht ordinaler Natur sind, ist zwingend die Einführung mehrerer Variablen notwendig. Im einfachsten Fall wird für jede Ausprägung (z.B. jede Berufsgruppe) eine eigene binäre Variable definiert. Im vorzustellenden Neusrel-System sollen vorerst nur dichotome Eigenschaften als binäre Variablen definiert werden können.
Behandlung des Missing-Data-Problems: In der Realität kommt es vor, dass in Datensätzen aus unterschiedlichsten Ursachen einzelne Daten einfach fehlen. In den Sozialwissenschaften sind meist unzureichend ausgefüllte Fragebögen der Grund dafür. Ist jedoch ein Eigenschaftenvektor unvollständig, kann er nicht computergestützt weiterverarbeitet werden. Die einfachste Behandlungsform von Missing-Values ist es, den defekten Eigenschaftsvektor einfach zu entfernen. Diese Methode kann man sich jedoch nur dann leisten, wenn die erhobene Stichprobe eine ausreichende Fallzahl enthält. Andernfalls sollte versucht werden, die im Vektor vorhandenen Informationen zu nutzen und den fehlenden Wert mit Hilfe der nichtdefekten Eigenschaftsvektoren zu ersetzen.
Für das Ersetzen fehlender Werte gibt es eine Reihe von Methoden, die von einfachen praktischen bis hin zu sehr elaborierten Methoden reichen. Eine einfache Methode ist es, den fehlenden Wert einer Eigenschaft durch den Durchschnittswert der Eigenschaft aller nichtdefekten Vektoren zu ersetzen. Weiterhin existieren einige effektive Heuristiken wie beispielsweise, dass der Durchschnittswert nur von den n-nächsten nichtdefekten Eigenschaftsvektoren berechnet wird. Bei Zeitreihen kann der fehlende Wert im Zuge einer Interpolation zwischen Vorgängern und Nachfolgern (unter der Annahme von Autokorrelation) berechnet werden.
Die Qualität der Missing-Value-Berechnung lässt sich weiter durch den Einsatz lernender Verfahren steigern. Beispielsweise kann ein Neuronales Netz mit den nichtdefekten Vektoren zu dem Zweck angelernt werden, die fehlende Eigenschaft der defekten Vektoren zu prognostizieren (genauer diagnostizieren). Auch können Neuronale Netze als Dichteschätzer eingesetzt werden, die dann die Dichte des Raumes aller Eigenschaften schätzen. Daraus lassen sich für die fehlenden Eigenschaften anhand einer bedingten Dichte Werte ableiten.
Aus praktischen Gründen sollen im vorzustellenden System die lineare Interpolation von Zeitreihen (im Falle von Autokorrelation) und die Heuristik des Durchschnitts der nächsten N Anwendung finden.
Standardisierung der Variablen: Prinzipiell ist eine Standardisierung (i.S. einer Vereinheitlichung der Schwankungsbreiten der Variablen) bei Neuronalen Netzen nicht erforderlich, da diese Transformation die Gewichte der ersten Schicht (nach dem Lernvorgang) durchführen können. Eine Standardisierung der Variablen kann trotzdem sinnvoll sein, da durch sie dem Lernverfahren Arbeit abgenommen wird und in erheblichem Ausmaß Rechenzeit eingespart werden kann. Der gleiche Effekt kann aber auch erreicht werden, indem die zufallsgesteuert initialisierten Gewichte des Neuronalen Netzes in ihrer Ausprägung dem Wertebereich der Variablen angepasst werden. Letztere Methode wurde im vorzustellenden NEUSREL-System implementiert.
58,00 €
PDF-eBook Download: 58,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836615259
Arbeit zitieren:
Buckler, Frank Juli 2001: Neuer Kausalanalyseansatz auf Basis Neuronaler Netze als Instrument der Marketingforschung, Hamburg: Diplomica Verlag
Schlagworte:
Kausalanalyse, Lisrel, Partial Least Squares, Data Mining, Neuronales Netz



