Konzeption eines Projektverwaltungssystems für betriebswirtschaftliche Datenanalyseprozesse in einem offenen Business-Intelligence-System
- Art: Diplomarbeit
- Autor: Frank Riesner
- Abgabedatum: Mai 2002
- Umfang: 158 Seiten
- Dateigröße: 828,3 KB
- Note: 2,3
- Institution / Hochschule: Bayerische Hochschule Deutschland
- ISBN (eBook): 978-3-8324-5954-3
-
ISBN (Paperback) :
978-3-8324-5954-3 P - ISBN (CD) :978-3-8324-5954-3 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Riesner, Frank Mai 2002: Konzeption eines Projektverwaltungssystems für betriebswirtschaftliche Datenanalyseprozesse in einem offenen Business-Intelligence-System, Hamburg: Diplomica Verlag
- Schlagworte: Business Intelligence, Datenanalyse, Data Warehouse, Data Mining, Managementunterstützungssysteme
In den Warenkorb
48,00 €
Diplomarbeit von Frank Riesner
Einleitung:
Die Komplexität der Unternehmensumwelt ist in den vergangenen Jahren zunehmend durch Diskontinuitäten und dynamische Veränderungen gekennzeichnet; betriebliche Entscheidungsträger müssen dieser Entwicklung mit verkürzten Analyse- und Entscheidungsprozessen begegnen. In diesem Zusammenhang bietet das Business- Intelligence-Konzept eine vielversprechende Lösung. Man versteht darunter die analytische Aufgabe, welche fragmentierte Unternehmens- und Umweltdaten in handlungsgerichtetes Wissen für unternehmerische Entscheidungen transformiert.
Business-Intelligence-Systeme (BIS) beinhalten dabei seitens der Informationstechnologie ein enormes Potential, das weite Spektrum der betriebswirtschaftlichen Datenanalyse möglichst komplett abzudecken und verschiedenen Anwendergruppen zu erschließen. Ziel dieser Arbeit ist die Entwicklung einer Konzeption für solche Systeme. Nach einer theoretischen Fundierung der zur Verfügung stehenden Analyseverfahren sowie der Untersuchungsvorgehensweisen und -abläufe wird aufbauend auf den Schwächen früherer Management-Unterstützungssysteme ein umfangreicher Anforderungskatalog für idealtypische BIS definiert. Teil dieser Arbeit ist außerdem die praktische Umsetzung von Auszügen dieser Anforderungen in Form einer Konteption für ein prototypisches Anwendungssystem. Dieses implementiert schwerpunktmäßig ein generisches Projektverwaltungssystem für betriebswirtschaftliche Datenanalyseprozesse.
Dabei können Analyseprojekte und zugehörige Analysephasen problemspezifisch verwaltet und durch eine Ablaufsteuerung zielgerichtet ausgeführt werden. Ein simulierter Analyseprozeß veranschaulicht dabei die Funktionalität der Applikation.
Neben Ausführungen über die allgemeine zukünftige Fortentwicklung innerhalb dieses wissenschaftlichen Gebiets zeigen abschließend einige beispielhafte Ansätze Möglichkeiten zur Erweiterung und Anpassung des prototypischen Business-Intelligence-Systems auf.
Inhaltsverzeichnis:
| Abstract | II | |
| Inhaltsverzeichnis | III | |
| Abkürzungsverzeichnis | VI | |
| Abbildungsverzeichnis | IX | |
| Tabellenverzeichnis | X | |
| 1. | Einleitung | 1 |
| 1.1 | Information als Unternehmensressource | 1 |
| 1.2 | Problemstellung und Zielsetzung | 2 |
| 1.3 | Aufbau und methodische Behandlung | 3 |
| 1.4 | Allgemeine Konventionen | 5 |
| 2. | Betriebswirtschaftliche Datenanalyse | 6 |
| 2.1 | Konzept der Untersuchungssituation | 6 |
| 2.2 | Grundtypen von Datenanalyseproblemen | 8 |
| 2.2.1 | Data-Warehouse-Systeme | 10 |
| 2.2.2 | Verfahren hypothesengetriebener Ansätze | 12 |
| 2.2.3 | Verfahren datengetriebener Ansätze | 18 |
| 2.3 | Phasen und Aufgaben der betriebswirtschaftlichen Datenanalyse | 31 |
| 2.3.1 | Identifikation des Untersuchungsproblems | 33 |
| 2.3.2 | Durchführung der Datenanalyse | 34 |
| 2.3.3 | Umsetzung der Untersuchungserkenntnisse | 34 |
| 2.3.4 | Evaluierung der Untersuchungssituation | 35 |
| 2.3.5 | Einbettung in das Regelkreismodell | 36 |
| 2.4 | Business Intelligence (BI) | 38 |
| 2.5 | Typische Untersuchungssituationen | 44 |
| 3. | Knowledge Discovery in Databases (KDD) | 50 |
| 3.1 | Begriff und Zielsetzung | 50 |
| 3.2 | Phasen und Aufgaben | 52 |
| 3.2.1 | Selektion | 54 |
| 3.2.2 | Exploration | 55 |
| 3.2.3 | Manipulation | 55 |
| 3.2.4 | Datenanalyse | 59 |
| 3.2.5 | Interpretation | 60 |
| 3.3 | Herausforderungen und Einordnung | 61 |
| 4. | Unterstützung von Datenanalysen durch Management-Unterstützungssysteme | 64 |
| 4.1 | Management-Informationssysteme (MIS) | 65 |
| 4.2 | Entscheidungsunterstützungssysteme (EUS) | 66 |
| 4.3 | Führungsinformationssysteme (FIS) | 67 |
| 4.4 | Analytische Informationssysteme (AIS) | 68 |
| 4.5 | Business-Intelligence-Systeme (BIS) | 72 |
| 5. | Anforderungen an Business-Intelligence-Systeme | 73 |
| 5.1 | Fachliche Anforderungen an die Verfahrensintegration | 74 |
| 5.1.1 | Integration von Verarbeitungsfunktionen | 74 |
| 5.1.2 | Kopplung von Untersuchungssituationen | 78 |
| 5.1.3 | Unterstützung des gesamten KDD-Prozesses | 81 |
| 5.2 | Fachliche Anforderungen an die Verfahrensdurchführung | 83 |
| 5.2.1 | Projektverwaltung | 84 |
| 5.2.2 | Problemspezifische Ablaufsteuerung und Dokumentation | 87 |
| 5.2.3 | Ergonomische Benutzerschnittstelle | 88 |
| 5.2.4 | Knowledge-Management-Dienste | 92 |
| 5.2.5 | Bereinigte und konsolidierte Datenbasis | 93 |
| 5.3 | Technische Anforderungen | 95 |
| 5.3.1 | Offenheit und Flexibilität | 96 |
| 5.3.2 | Abstraktion von Heterogenität | 101 |
| 5.3.3 | Datenintegrierte Prozessabwicklung | 103 |
| 5.3.4 | Performanz und Skalierbarkeit | 104 |
| 5.4 | Integrationsgrad von Business-Intelligence-Systemen | 107 |
| 6. | Prototyp für ein Projektverwaltungssystem eines BIS | 111 |
| 6.1 | Zielsetzung | 111 |
| 6.2 | Fachliche Architektur | 114 |
| 6.2.1 | Kommunikation | 114 |
| 6.2.2 | Datenverwaltung | 115 |
| 6.2.3 | Anwendung | 117 |
| 6.3 | Softwaretechnische Architektur | 122 |
| 6.3.1 | Kommunikation | 123 |
| 6.3.2 | Datenverwaltung | 123 |
| 6.3.3 | Anwendung | 124 |
| 6.4 | Ansätze zur Weiterentwicklung | 126 |
| 7. | Fazit und Ausblick | 129 |
| Anhang A: Konzeptionelles Datenmodell der BI-Datenbank | 133 | |
| Anhang B: Fachliches Datenbankschema der BI-Datenbank | 134 | |
| Literaturverzeichnis | 139 | |
| Erklärung gemäß Prüfungsordnung | 147 |
Die Transformation der Daten ist zunächst darauf gerichtet, die Anzahl der Merkmale zielgerichtet zu reduzieren. Damit läßt sich die Komplexität der Ermittlung und Abbildung von Mustern abstrahieren [Düsi00b, 12]. Dabei werden Attribute, die stark korreliert sind, vereinheitlicht bzw. mehrere Variablen auf einer höheren Aggregationsstufe zusammengefaßt. Die Auswahl relevanter Variablen und deren Kombination ist als problematisch anzusehen, vor allem auch aus dem Grund, daß dabei immer Informationen verloren gehen [CHS+98, 54]. Hierunter fällt beispielsweise die Darstellung des Geburtsdatums durch das Alter oder eine fortlaufende Numerierung von Zeitintervallen [Knob00, 36]. Des weiteren ist festzustellen, daß die normalisiert21 abgelegten Daten in OLTPQuellen oft nicht die am besten geeignete Datenstruktur für Analysen ist, da Abhängigkeiten schwierig zu erkennen sind. Daher kann es erforderlich werden, Denormalisierungsmaßnahmen durchzuführen [AdZa97, 123f.]. [...]
Die Bereinigung betrachtet Datensätze in Bezug auf fehlende Einzelwerte oder fehlerhafte Feldinhalte. Datenfehler sind Attributsausprägungen, welche die durch sie beschriebenen Objekte der Realwelt nicht korrekt abbilden [Knob00, 34]. Solche Fälle lassen sich oftmals auf menschliches Versäumen oder Systemfehler bzw. -ausfälle zurückführen. Um Fehlfunktionen der Analysealgorithmen zu vermeiden, müssen fehlende Inhalte zumindest als solche gekennzeichnet sein („NULL“). Zudem können sie aufschlußreiche Muster beinhalten, was schließlich entschieden gegen das Eliminieren solcher Inhalte spricht [AdZa97, 86]. Aus dem gleichen Grund ist die Alternative, den Inhalt durch Annahmen zu vervollständigen, kritisch zu beurteilen. Dafür existieren Verfahren der Parameterschätzung (z. B. MaximumLikelihood-Methode) oder nicht-informative Methoden, wie die Ersetzung durch den Mittelwert [CHS+98, 53], [Düsi00b, 10f.]. Fehlerhafte Werte gefährden die Konsistenz des Analysedatenbestands. Sie sollten möglichst korrigiert oder, falls es mit dem Untersuchungsziel vereinbar scheint, eliminiert werden. Statistisch gesehen handelt es sich dabei um „Ausreißer“. Deren Beurteilung ist eine sehr schwierige Aufgabe, da diese zum einen Hinweise auf interessante Muster beinhalten, zum anderen jedoch schlicht Fehler darstellen können. Daher empfehlen P. Cabena et al.: „You have to distinguish the good outliers from the bad and react appropriately.“ [CHS+98, 52]. [...]
ten Verfahren notwendig, zusätzliche Trainings- und Bewertungsmengen zu bestimmen [Knob00, 30]. 3.2.2 Exploration „Without the right data, there is little gold to be mined; here again we must apply the rule ‚’garbage in, garbage out’.“ [AdZa97, 9]. Diese plakative Feststellung betont nochmals die herausragende Bedeutung, welche die Datenqualität auf Datenanalyseergebnisse hat. Dies und die Tatsache, daß es in Unternehmen bisher oft an einer entsprechenden Sorgfalt bei der Datenerfassung mangelt, begründen den unverhältnismäßig hohen Aufwand, der für das Preprocessing in Anspruch genommen wird (siehe Abb. 3-1). Daher ist es sinnvoll, in einer der Datenbearbeitungsphase vorgeschalteten Aufgabe, die identifizierten Quellbestände nochmals detailliert zu untersuchen, um diese gut kennenzulernen. Dies kann durch einfache SQL-Abfragen, aber auch durch OLAP oder komplexere visuelle Explorationsmethoden sowie statistische Funktionen erfolgen [CHS+98, 49], [Knob00, 31]. Weiterhin können Metainformationen der Attribute hilfreiche Zusatzinformationen zum Datenbestand geben (z. B.: Betriebswirtschaftliche Bedeutung, Datentyp, möglicher Wertebereich, Quellsystem, Eingabeformat etc.) [CHS+98, 47]. Die Exploration zielt somit darauf ab, ein besseres „Gefühl“, d. h. Grundverständnis für die Quelldaten zu erhalten, damit aufwendige Iterationen des KDD-Prozesses reduziert und Fehlinterpretationen von Analyseergebnissen vermieden werden können [Knob00, 30f.]. Mit Blick auf die folgende Phase der Manipulation erlauben die so gesammelten Erfahrungen des weiteren, Inkonsistenzen, Fehler und sonstige Schwächen frühzeitig aufzudecken und somit Manipulationsmaßnahmen effizient zu planen. 3.2.3 Manipulation Ausgangspunkt der Manipulation sind die bezüglich der Untersuchungssituation als relevant identifizierten und bereits genau untersuchten Datenquellen. Da diese sich in der Regel in ihrer Ursprungsform für die Datenanalyse nicht eignen, sind verschiedene Manipulationseingriffe für eine Umwandlung erforderlich. Deren Berechtigung äußert sich in einer meist mangelhaften Datenqualität der Quelldatenbestände. Diese [...]
In den Warenkorb
48,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832459543
Arbeit zitieren:
Riesner, Frank Mai 2002: Konzeption eines Projektverwaltungssystems für betriebswirtschaftliche Datenanalyseprozesse in einem offenen Business-Intelligence-System, Hamburg: Diplomica Verlag
Schlagworte:
Business Intelligence, Datenanalyse, Data Warehouse, Data Mining, Managementunterstützungssysteme



