Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Metadatenmanagement

Erfolgsfaktor für ein Data Warehouse

Metadatenmanagement
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Christian Güthlein
  • Abgabedatum: November 2000
  • Umfang: 98 Seiten
  • Dateigröße: 879,0 KB
  • Note: 1,3
  • Institution / Hochschule: Bayerische Julius-Maximilians-Universität Würzburg Deutschland
  • ISBN (eBook): 978-3-8324-4585-0
  • ISBN (Paperback) :
    978-3-8324-4585-0 P
  • ISBN (CD) :978-3-8324-4585-0 CD
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Güthlein, Christian November 2000: Metadatenmanagement, Hamburg: Diplomica Verlag
  • Schlagworte: Metadaten, Data Warehouse, Common Warehouse Metamodel, Schnittstellenproblematik, Standardisierungsbestrebungen

Diplomarbeit von Christian Güthlein

Einleitung:

Metadaten sind der Schlüsselfaktor moderner Architekturen zur Informationsversorgung. Nach langen Auseinandersetzungen hat sich durch den Rückzieher von Microsoft die Tür geöffnet für eine Standardisierung der Beschreibung und des Austausches von Metadaten. Das Common Warehouse Model der OMG bringt Vorteile für IT-Abteilung und Anwender.

In dieser Arbeit wird die zentrale Bedeutung von Metadaten für Aufbau und Betrieb von Data Warehouse Systemen herausgearbeitet. Technische Metadaten geben dabei Auskunft über Struktur von Daten und ihre Modifikation durch Bewegung zwischen verschiedenen Lagerorten oder Überführung in neue Formate und Darstellungsformen. Semantische Metadaten liefern inhaltliche Informationen über Beziehungen und Bedeutung von Daten, was Usern ein Verstehen des gelieferten Datenmaterials ermöglicht. Die Speicherung und Verwaltung der Metadaten wird häufig in einer separaten Datenbank vorgenommen, die als zentrales Repository und Drehscheibe für die Metadatenintegration dient. Metadaten der verschiedensten Werkzeuge werden hier gespeichert, damit sie allen anderen Komponenten zur Verfügung stehen. Um dieses Ziel zu erreichen, spielt die Vereinheitlichung der Definitionen von allen verfügbaren Informationsobjekten des Data Warehouse-Systems sowie eine Standardisierung der Austauschformate dieser Informationsobjekte eine besondere Bedeutung.

Dieser Ansatz einer Standardisierung wird derzeit von der Object Management Group forciert. Deren Vorgehensweise und Spezifikationen auf der Grundlage der Beschreibungssprache Unified Modelling Language (UML) und des Datenaustauschstandards eXtended Markup Language (XML) sowie bereits mit dieser Technologie am Markt existente Tools werden in vorliegender Arbeit analysiert.

Inhaltsverzeichnis:

1. Problematik 1
2. Metadaten 3
2.1 Begriffsdefinition 3
2.2 Aufgabenbereich 5
2.3 Anwendungsfelder 8
2.4 Metadatenkategorien 9
2.4.1 Administrative Metadaten 9
2.4.2 Berechtigungs-Metadaten 9
2.4.3 Metadaten zu strukturellen Aspekten 10
2.4.4 Metadaten zum Kontext und Inhalt 10
2.4.5 Metadaten zur Nutzungs- und Wirkungsgeschichte 11
3. Data Warehouse 11
3.1 Definition 12
3.2 Aufbau 13
3.3 Datenintegration 15
3.4 Abfrage 16
3.5 Erfolgsfaktoren für ein Data Warehouse 18
4. Management von Metadaten 19
4.1 Metamodell 19
4.2 Metadatenarchitektur 20
4.3 Aufgabe 22
4.4 Metadaten-Repository 24
4.4.1 Definition 24
4.4.2 Zentrales Repository 25
4.4.3 Dezentrales Repository 26
4.4.4 Metadatenfluss 27
4.4.5 Einsatzbereich 30
4.5 Metadatenstruktur 30
4.5.1 Back Room Metadaten 31
4.5.2 Front Room Metadaten 32
4.5.3 Aufgabenbereich 34
4.6 Metadatenaustausch 35
4.7 Metadatenintegration 38
5. Standardisierungsbestrebungen 39
5.1 Bewertungskriterien 40
5.2 Object Management Group (OMG) 42
5.2.1 Object Management Architecture (OMA) 43
5.2.2 UML 43
5.2.3 Meta Objekt Facility (MOF) 44
5.2.3.1 MOF-Modell 45
5.2.3.2 MOF IDL Mapping 47
5.2.3.3 MOF Schnittstellen 48
5.2.4 XML Metadata Interchange Format (XMI) 49
5.2.4.1 Aufgabe 49
5.2.4.2 Austausch 51
5.3 Common Warehouse Metamodel 54
5.3.1 Aufbau 55
5.3.2 CWM-Metamodelle 57
5.4 Meta Data Coalition (MDC) 58
5.4.1 Open Information Model (OIM) 59
5.4.2 XML Interchange Format (XIF) 61
5.4.3 Aufbau eines OIM Modells 61
5.4.3.1 Analyse und Design Modell 62
5.4.3.2 Datenbank und Data Warehousing Modell 62
5.4.3.3 Objekt und Komponenten Modell 63
5.4.3.4 Knowledge Management Modell 63
5.4.3.5 Business Engineering Modell 63
5.4.4 Aufbau des Modells 63
5.4.4.1 Datenbank Modell 64
5.4.4.2 Data Warehouse Modell 64
5.5 Spezifische Metadatenaustausch-Formatstandards 65
5.6 Vergleich von OIM und CWM 66
5.7 Bewertung 69
6. Anwendungen 70
6.1 Oracle Warehouse Builder 70
6.2 Microsoft Repository 72
6.3 Platinum Repository 73
6.3.1 Platinum Repository Architektur 74
6.3.2 Schnittstellen 75
6.3.3 Einsatz der Standardspezifikationen 76
6.4 Informatica 77
6.4.1 Metadatenaustausch 77
6.4.2 Schnittstelle 78
7. Fazit 79
Quellenverzeichnis 81
Abkürzungsverzeichnis 88

Automatisiert erstellter Textauszug:

5 Standardisierungsbestrebungen In früheren Generationen von Data Warehouse-Architekturen waren Systementwickler routinemäßig gezwungen, für die Dokumentation der zentralen Programmabläufe oder für die Einlage in das zentrale Informations-Repository individuelle Metadaten „manuell“ zu schreiben. Normalerweise ließen sich Metadaten nicht zwischen Produkten bzw. Decision-Support-Werkzeugen verschiedener Hersteller austauschen. Das führte zwangsläufig zur Umschreibung der Dokumentationsdaten und damit zum Ergebnis der Redundanz und des Risikos inkonsistenter Metadatenbestände [DIEF00]. Durch die Speicherung einer breiten Schicht unterschiedlicher Produkte aus unterschiedlichen Systemen und der damit verbundenen Dokumentation durch die jeweiligen Back Room Metadaten, wobei hier wiederum ein Metadatenformat durch ein Metamodell für verschiedene Produkte definiert werden muss, entsteht der Bedarf, den Metadatenmanagement-Prozess zu automatisieren und ein Sharing zwischen unterschiedlichen Metadatenstrukturen zu erreichen. Dadurch soll sowohl Konsistenz als auch Integrität der Metadaten im Data Warehouse erreicht werden, um dadurch spätere Metadatenveränderungen verfolgen zu können [WHIT00]. [...]

Die Generic Metadaten Sources liegen in einem gemeinsamen Format, wie z. B. einem Standardformat wie CWMI (siehe Kapitel 5.3) oder durch abgrenzende Tabs, Kommata etc., vor, die durch Tools direkt gelesen werden können. Der Unterschied zu den Certified Sources liegt in den Programmieranforderungen begründet, die für das Mapping der Metadaten in die korrekten Attribute des Metamodells nötig sind. Dadurch ist es relevant, dass die Repository-Tool-Schnittstelle leicht anpassbar ist, um das Mapping durchführen zu können. Beispiele sind solche Back Room sowie Front Room Metadaten in Datenbanken und Spreadsheets, die sich relativ einfach in die gemeinsamen Formate übertragen lassen [MARC98a]. In der letzten Gruppe sind Metadaten, die weder im Certified noch im Generic Format vorliegen, sondern als Non-Supported Sources anspruchsvolle Analysen und Programmierungen erfordern, um in die Metamodell Attribute gemappt werden zu können. Darunter fallen hauptsächlich Front Room Metadaten, die unstrukturiert bzw. in einem proprietären Format vorliegen und daher nicht ohne Schwierigkeit bearbeitet werden können [MARC98a]. [...]

Mit Hilfe von XML wird es in absehbarer Zeit möglich sein, unterschiedliche Komponenten von verschiedensten Herstellern innerhalb eines Data Warehouse-Systems über den Metadatenaustausch kommunizieren zu lassen, wodurch das Konzept des herstellerübergreifenden zentralen Repository, das alle Informationsobjekte im Data Warehouse zentral und toolunabhängig verwaltet, durchsetzbar wird [KURZ99, S. 201]. 4.7 Metadatenintegration Für die Konsistenz und Homogenität der Metadaten ist deren Integration in das Repository von fundamentaler Bedeutung. Derzeit existiert eine Vielzahl von Metadata-Repository-Tools. Jedes für sich beansprucht, alle Metadaten von allen Quellen in die Repository-Struktur integrieren zu können. Die Realität sieht dagegen anders aus. Zwar sind die derzeit am Markt erhältlichen Tools durchaus in der Lage, die formalen Metadatenquellen, wie z. B. CASE Tools, ETL-Werkzeuge und andere Repositories, demnach die strukturierten Back Room Metadaten über unterschiedliche Schnittstellen zu integrieren, dennoch ist es der Mehrheit dieser Tools nicht möglich, eine adäquate Basis für die Integration der häufig unstrukturiert vorliegenden Front Room Metadaten bzw. des gesamten Administrationsprozess durch ein einheitliches Metamodell zu schaffen [MARC98a]. Die vorhandenen Tools können aus unterschiedlichen Quellen über verschiedene Schnittstellen Metadaten integrieren. Dabei wird in drei Hauptkategorien, in Certified Sources, Generic Sources und in Non-Supported Sources differenziert, um die Vorgehensweise der Integration der Metadaten aus unterschiedlichen Quellen über Schnittstellen zu klassifizieren. Jede dieser Kategorien benötigt dafür eine variierbare Komplexität der Integrationslevel und der Metamodell-Modifikation, um die verschiedenen Metamodelle der unterschiedlichen Werkzeuge an die Metadaten-Anforderungen anzupassen [MARC98a]. Unter Metadaten aus den Certified Sources versteht man solche, die von Tools direkt gelesen, interpretiert und in die korrekten Attribute des Metamodells geladen werden können, ohne dass vorher zusätzliche Analysen oder Programmiertätigkeiten vorgenommen werden müssen. Als Beispiel kommen Back Room Metadaten von CASE Tools oder Transformationsregeln des ETL-Prozesses in Betracht, welche Repository-Tools, die für die direkte Akzeptanz dieser Metadaten konzipiert wurden, automatisch bearbeiten können [MARC98a]. [...]

Arbeit zitieren:
Güthlein, Christian November 2000: Metadatenmanagement, Hamburg: Diplomica Verlag

Schlagworte:
Metadaten, Data Warehouse, Common Warehouse Metamodel, Schnittstellenproblematik, Standardisierungsbestrebungen

Entdecken Sie mehr zum Thema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren