Metadatenmanagement
Erfolgsfaktor für ein Data Warehouse
- Art: Diplomarbeit
- Autor: Christian Güthlein
- Abgabedatum: November 2000
- Umfang: 98 Seiten
- Dateigröße: 879,0 KB
- Note: 1,3
- Institution / Hochschule: Bayerische Julius-Maximilians-Universität Würzburg Deutschland
- ISBN (eBook): 978-3-8324-4585-0
-
ISBN (Paperback) :
978-3-8324-4585-0 P - ISBN (CD) :978-3-8324-4585-0 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Güthlein, Christian November 2000: Metadatenmanagement, Hamburg: Diplomica Verlag
- Schlagworte: Metadaten, Data Warehouse, Common Warehouse Metamodel, Schnittstellenproblematik, Standardisierungsbestrebungen
In den Warenkorb
48,00 €
Diplomarbeit von Christian Güthlein
Einleitung:
Metadaten sind der Schlüsselfaktor moderner Architekturen zur Informationsversorgung. Nach langen Auseinandersetzungen hat sich durch den Rückzieher von Microsoft die Tür geöffnet für eine Standardisierung der Beschreibung und des Austausches von Metadaten. Das Common Warehouse Model der OMG bringt Vorteile für IT-Abteilung und Anwender.
In dieser Arbeit wird die zentrale Bedeutung von Metadaten für Aufbau und Betrieb von Data Warehouse Systemen herausgearbeitet. Technische Metadaten geben dabei Auskunft über Struktur von Daten und ihre Modifikation durch Bewegung zwischen verschiedenen Lagerorten oder Überführung in neue Formate und Darstellungsformen. Semantische Metadaten liefern inhaltliche Informationen über Beziehungen und Bedeutung von Daten, was Usern ein Verstehen des gelieferten Datenmaterials ermöglicht. Die Speicherung und Verwaltung der Metadaten wird häufig in einer separaten Datenbank vorgenommen, die als zentrales Repository und Drehscheibe für die Metadatenintegration dient. Metadaten der verschiedensten Werkzeuge werden hier gespeichert, damit sie allen anderen Komponenten zur Verfügung stehen. Um dieses Ziel zu erreichen, spielt die Vereinheitlichung der Definitionen von allen verfügbaren Informationsobjekten des Data Warehouse-Systems sowie eine Standardisierung der Austauschformate dieser Informationsobjekte eine besondere Bedeutung.
Dieser Ansatz einer Standardisierung wird derzeit von der Object Management Group forciert. Deren Vorgehensweise und Spezifikationen auf der Grundlage der Beschreibungssprache Unified Modelling Language (UML) und des Datenaustauschstandards eXtended Markup Language (XML) sowie bereits mit dieser Technologie am Markt existente Tools werden in vorliegender Arbeit analysiert.
Inhaltsverzeichnis:
| 1. | Problematik | 1 |
| 2. | Metadaten | 3 |
| 2.1 | Begriffsdefinition | 3 |
| 2.2 | Aufgabenbereich | 5 |
| 2.3 | Anwendungsfelder | 8 |
| 2.4 | Metadatenkategorien | 9 |
| 2.4.1 | Administrative Metadaten | 9 |
| 2.4.2 | Berechtigungs-Metadaten | 9 |
| 2.4.3 | Metadaten zu strukturellen Aspekten | 10 |
| 2.4.4 | Metadaten zum Kontext und Inhalt | 10 |
| 2.4.5 | Metadaten zur Nutzungs- und Wirkungsgeschichte | 11 |
| 3. | Data Warehouse | 11 |
| 3.1 | Definition | 12 |
| 3.2 | Aufbau | 13 |
| 3.3 | Datenintegration | 15 |
| 3.4 | Abfrage | 16 |
| 3.5 | Erfolgsfaktoren für ein Data Warehouse | 18 |
| 4. | Management von Metadaten | 19 |
| 4.1 | Metamodell | 19 |
| 4.2 | Metadatenarchitektur | 20 |
| 4.3 | Aufgabe | 22 |
| 4.4 | Metadaten-Repository | 24 |
| 4.4.1 | Definition | 24 |
| 4.4.2 | Zentrales Repository | 25 |
| 4.4.3 | Dezentrales Repository | 26 |
| 4.4.4 | Metadatenfluss | 27 |
| 4.4.5 | Einsatzbereich | 30 |
| 4.5 | Metadatenstruktur | 30 |
| 4.5.1 | Back Room Metadaten | 31 |
| 4.5.2 | Front Room Metadaten | 32 |
| 4.5.3 | Aufgabenbereich | 34 |
| 4.6 | Metadatenaustausch | 35 |
| 4.7 | Metadatenintegration | 38 |
| 5. | Standardisierungsbestrebungen | 39 |
| 5.1 | Bewertungskriterien | 40 |
| 5.2 | Object Management Group (OMG) | 42 |
| 5.2.1 | Object Management Architecture (OMA) | 43 |
| 5.2.2 | UML | 43 |
| 5.2.3 | Meta Objekt Facility (MOF) | 44 |
| 5.2.3.1 | MOF-Modell | 45 |
| 5.2.3.2 | MOF IDL Mapping | 47 |
| 5.2.3.3 | MOF Schnittstellen | 48 |
| 5.2.4 | XML Metadata Interchange Format (XMI) | 49 |
| 5.2.4.1 | Aufgabe | 49 |
| 5.2.4.2 | Austausch | 51 |
| 5.3 | Common Warehouse Metamodel | 54 |
| 5.3.1 | Aufbau | 55 |
| 5.3.2 | CWM-Metamodelle | 57 |
| 5.4 | Meta Data Coalition (MDC) | 58 |
| 5.4.1 | Open Information Model (OIM) | 59 |
| 5.4.2 | XML Interchange Format (XIF) | 61 |
| 5.4.3 | Aufbau eines OIM Modells | 61 |
| 5.4.3.1 | Analyse und Design Modell | 62 |
| 5.4.3.2 | Datenbank und Data Warehousing Modell | 62 |
| 5.4.3.3 | Objekt und Komponenten Modell | 63 |
| 5.4.3.4 | Knowledge Management Modell | 63 |
| 5.4.3.5 | Business Engineering Modell | 63 |
| 5.4.4 | Aufbau des Modells | 63 |
| 5.4.4.1 | Datenbank Modell | 64 |
| 5.4.4.2 | Data Warehouse Modell | 64 |
| 5.5 | Spezifische Metadatenaustausch-Formatstandards | 65 |
| 5.6 | Vergleich von OIM und CWM | 66 |
| 5.7 | Bewertung | 69 |
| 6. | Anwendungen | 70 |
| 6.1 | Oracle Warehouse Builder | 70 |
| 6.2 | Microsoft Repository | 72 |
| 6.3 | Platinum Repository | 73 |
| 6.3.1 | Platinum Repository Architektur | 74 |
| 6.3.2 | Schnittstellen | 75 |
| 6.3.3 | Einsatz der Standardspezifikationen | 76 |
| 6.4 | Informatica | 77 |
| 6.4.1 | Metadatenaustausch | 77 |
| 6.4.2 | Schnittstelle | 78 |
| 7. | Fazit | 79 |
| Quellenverzeichnis | 81 | |
| Abkürzungsverzeichnis | 88 |
5 Standardisierungsbestrebungen In früheren Generationen von Data Warehouse-Architekturen waren Systementwickler routinemäßig gezwungen, für die Dokumentation der zentralen Programmabläufe oder für die Einlage in das zentrale Informations-Repository individuelle Metadaten „manuell“ zu schreiben. Normalerweise ließen sich Metadaten nicht zwischen Produkten bzw. Decision-Support-Werkzeugen verschiedener Hersteller austauschen. Das führte zwangsläufig zur Umschreibung der Dokumentationsdaten und damit zum Ergebnis der Redundanz und des Risikos inkonsistenter Metadatenbestände [DIEF00]. Durch die Speicherung einer breiten Schicht unterschiedlicher Produkte aus unterschiedlichen Systemen und der damit verbundenen Dokumentation durch die jeweiligen Back Room Metadaten, wobei hier wiederum ein Metadatenformat durch ein Metamodell für verschiedene Produkte definiert werden muss, entsteht der Bedarf, den Metadatenmanagement-Prozess zu automatisieren und ein Sharing zwischen unterschiedlichen Metadatenstrukturen zu erreichen. Dadurch soll sowohl Konsistenz als auch Integrität der Metadaten im Data Warehouse erreicht werden, um dadurch spätere Metadatenveränderungen verfolgen zu können [WHIT00]. [...]
Die Generic Metadaten Sources liegen in einem gemeinsamen Format, wie z. B. einem Standardformat wie CWMI (siehe Kapitel 5.3) oder durch abgrenzende Tabs, Kommata etc., vor, die durch Tools direkt gelesen werden können. Der Unterschied zu den Certified Sources liegt in den Programmieranforderungen begründet, die für das Mapping der Metadaten in die korrekten Attribute des Metamodells nötig sind. Dadurch ist es relevant, dass die Repository-Tool-Schnittstelle leicht anpassbar ist, um das Mapping durchführen zu können. Beispiele sind solche Back Room sowie Front Room Metadaten in Datenbanken und Spreadsheets, die sich relativ einfach in die gemeinsamen Formate übertragen lassen [MARC98a]. In der letzten Gruppe sind Metadaten, die weder im Certified noch im Generic Format vorliegen, sondern als Non-Supported Sources anspruchsvolle Analysen und Programmierungen erfordern, um in die Metamodell Attribute gemappt werden zu können. Darunter fallen hauptsächlich Front Room Metadaten, die unstrukturiert bzw. in einem proprietären Format vorliegen und daher nicht ohne Schwierigkeit bearbeitet werden können [MARC98a]. [...]
Mit Hilfe von XML wird es in absehbarer Zeit möglich sein, unterschiedliche Komponenten von verschiedensten Herstellern innerhalb eines Data Warehouse-Systems über den Metadatenaustausch kommunizieren zu lassen, wodurch das Konzept des herstellerübergreifenden zentralen Repository, das alle Informationsobjekte im Data Warehouse zentral und toolunabhängig verwaltet, durchsetzbar wird [KURZ99, S. 201]. 4.7 Metadatenintegration Für die Konsistenz und Homogenität der Metadaten ist deren Integration in das Repository von fundamentaler Bedeutung. Derzeit existiert eine Vielzahl von Metadata-Repository-Tools. Jedes für sich beansprucht, alle Metadaten von allen Quellen in die Repository-Struktur integrieren zu können. Die Realität sieht dagegen anders aus. Zwar sind die derzeit am Markt erhältlichen Tools durchaus in der Lage, die formalen Metadatenquellen, wie z. B. CASE Tools, ETL-Werkzeuge und andere Repositories, demnach die strukturierten Back Room Metadaten über unterschiedliche Schnittstellen zu integrieren, dennoch ist es der Mehrheit dieser Tools nicht möglich, eine adäquate Basis für die Integration der häufig unstrukturiert vorliegenden Front Room Metadaten bzw. des gesamten Administrationsprozess durch ein einheitliches Metamodell zu schaffen [MARC98a]. Die vorhandenen Tools können aus unterschiedlichen Quellen über verschiedene Schnittstellen Metadaten integrieren. Dabei wird in drei Hauptkategorien, in Certified Sources, Generic Sources und in Non-Supported Sources differenziert, um die Vorgehensweise der Integration der Metadaten aus unterschiedlichen Quellen über Schnittstellen zu klassifizieren. Jede dieser Kategorien benötigt dafür eine variierbare Komplexität der Integrationslevel und der Metamodell-Modifikation, um die verschiedenen Metamodelle der unterschiedlichen Werkzeuge an die Metadaten-Anforderungen anzupassen [MARC98a]. Unter Metadaten aus den Certified Sources versteht man solche, die von Tools direkt gelesen, interpretiert und in die korrekten Attribute des Metamodells geladen werden können, ohne dass vorher zusätzliche Analysen oder Programmiertätigkeiten vorgenommen werden müssen. Als Beispiel kommen Back Room Metadaten von CASE Tools oder Transformationsregeln des ETL-Prozesses in Betracht, welche Repository-Tools, die für die direkte Akzeptanz dieser Metadaten konzipiert wurden, automatisch bearbeiten können [MARC98a]. [...]
In den Warenkorb
48,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832445850
Arbeit zitieren:
Güthlein, Christian November 2000: Metadatenmanagement, Hamburg: Diplomica Verlag
Schlagworte:
Metadaten, Data Warehouse, Common Warehouse Metamodel, Schnittstellenproblematik, Standardisierungsbestrebungen



