Bachelor + Master Publishing
811 Bachelorarbeiten, 533 Masterarbeiten, 10.103 Diplomarbeiten

Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen

Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen
Über dieses Buch
  • Art: Diplomarbeit
  • Autor: Markus Hochleitner
  • Abgabedatum: November 2004
  • Umfang: 77 Seiten
  • Dateigröße: 545,7 KB
  • Note: 3,0
  • Institution / Hochschule: Wirtschaftsuniversität Wien Österreich
  • Bibliografie: ca. 63
  • ISBN (eBook): 978-3-8366-4070-1
  • Sprache: Deutsch
  • Prämierung:
  • Arbeit zitieren: Hochleitner, Markus November 2004: Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen, Hamburg: Diplomica Verlag
  • Schlagworte: Ontologie, Software-Agenten, Digitale Signatur, Wirtschaftsinformatik, RDF Schema

Diplomarbeit von Markus Hochleitner

Einleitung:

Die Diplomarbeit umfasst das Thema ‚Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen’. Ziel ist die Beschreibung der Rolle, welche die modulare Regelbeschreibungssprache TRIPLE im Semantischen Web einnimmt. Weiter soll anhand von Beispielen jene Möglichkeiten dargestellt werden, die diese Sprache im Bereich der Integration heterogener Informationsquellen bietet. Die Arbeit wird dazu in 4 Teile gegliedert.

Im ersten Teil wird auf das ‚Semantische Web’ im Allgemeinen eingegangen. Insbesondere soll hier dessen Entstehung, Aufbau, Problemstellung und Möglichkeiten näher erläutert werden.

Der zweite Teil der Arbeit beschäftigt sich mit der Rolle der modularen Regelbeschreibungssprache TRIPLE innerhalb des Semantischen Webs. Es werden hier Aufbau, Funktionsweise, Syntax und Eigenschaften der Sprache beschrieben. Diese werden abschließend anhand eines Beispiels veranschaulicht.

Im dritten Teil wird auf die Problematik der Integration heterogener Informationsquellen eingegangen. Dazu werden die Grundlagen beschrieben, sowie ein Überblick darüber gegeben, welche Arten von Integrationskonflikten auftreten können. Anschließend wird anhand von Beispielen erläutert, welche Möglichkeiten die modulare Regelbeschreibungssprache TRIPLE auf dem Gebiet der Integration bietet.

Die Arbeit schließt mit einer Zusammenfassung des gewählten Themas.

Inhaltsverzeichnis:

1. Einleitung 6
2. Semantisches Web 7
2.1 W3C 8
2.1.1 Geschichte 8
2.1.2 Aufgaben und Ziele 9
2.2 Die Idee des Semantischen Web 11
2.3 Problemstellung 12
2.4 Anwendungen des Semantischen Webs 13
2.4.1 Software-Agenten 13
2.4.2 RSS 15
2.4.3 Gezieltere Suche 17
2.5 Schichtenmodell 18
2.5.1 UNICODE / URI 19
2.5.2 XML, XML Schema, Namespaces 21
2.5.3 RDF, RDF Schema 24
2.5.4 Schema Schicht - Ontology vocabulary 36
2.5.5 Logik Schicht 38
2.5.6 Proof und Trust 38
2.5.7 Digitale Signatur 39
2.6 Fazit und Ausblick 39
3. TRIPLE 42
3.1 Definition 42
3.2 Problemstellung 43
3.3 Eigenschaften 44
3.4 CPU Beispiel 46
4. Integration heterogener Informationsquellen 49
4.1 Einleitung 49
4.2 Grundlagen der Integration 49
4.3 Integrationsprozess 52
4.4 Klassifikation von Integrationskonflikten 55
4.4.1 Strukturelle Heterogenitätskonflikte 55
4.4.2 Semantische Heterogenitätskonflikte 57
4.4.3 Inkonsistenz- und Redundanzprobleme 57
4.5 Integration mittels TRIPLE 58
4.5.1 Grundlagen 58
4.5.2 Parametrisierte Modelle 59
5. Verwandte Arbeiten 66
6. Zusammenfassung 68

Textprobe:

Kapitel 3, TRIPLE:

TRIPLE ist eine schichtbasierte, modulare Regelbeschreibungssprache, die speziell für das Semantische Web entwickelt wurde. Dabei liegt der Schwerpunkt auf der Transformation und Abfrage von RDF Modellen. TRIPLE basiert auf der Hornlogik und enthält auch viele Fähigkeiten von F-Logik.

Hornlogik wird zur Beschreibung von Inferenzaktionen verwendet und schafft einen Kompromiss zwischen der Mächtigkeit des Ausdrucksformalismus und der Ausführbarkeit des Modells. Aufgrund dieses Kompromisses wird eine Formulierung mancher Sachverhalte sehr umständlich und damit auch fehleranfällig und schwer verständlich.

Bei F-Logik handelt es sich um eine Sprache zur Modellierung von Ontologien. Ihre Wurzeln liegen dabei in den objektorientierten deduktiven Datenbanken, wodurch sie traditionelle Funktionalitäten wie Klassen, Instanzen und Beziehungen für die Datenstrukturierung bietet.

Generell kann TRIPLE als Nachfolger von SiLRI (Abkürzung von engl.: Simple Logicbased RDF Interpreter) betrachtet werden. Einer der wichtigsten Unterschiede zu F-Logic und SiLRI ist vor allem die Tatsache, dass TRIPLE keine feststehende Semantik für objektorientierte Eigentümlichkeiten wie Klassen und Vererbung innehat. Ihre Schichtenarchitektur erlaubt es vielmehr, solche Merkmale auf einfache Weise für verschiedene objektorientierte und andere Datenmodelle wie UML, Topic-Maps oder RDF Schema zu definieren. Mit der Eigenschaft _modular_ wird auf die Erweiterbarkeit von TRIPLE hingewiesen, Description-Logic Module wie beispielsweise für DAML+OIL einzubinden. Ein weiterer Vorteil liegt letztendlich darin, dass TRIPLE eine leicht lesbare Syntax innehat, welche auf RDF basiert.

Das Semantische Web ermöglicht die Veröffentlichung von Daten verschiedenster Gruppen. Viele hoch spezialisierte Datenmodelle wie UML, TopicMaps, RDF Schema oder DAML+OIL haben sich bereits in diesem Bereich etabliert. Problematisch erweist sich nun die Tatsache, dass eine Vielzahl an unterschiedlichen Formaten, Sprachen, Speicher- und Abfragemechanismen im Zusammenhang mit semantischen Daten existieren. Um auf Daten, die auf verschiedenen Datenmodellen beruhen, zuzugreifen, müssten diese ständig von einer Repräsentationssprache in eine andere übersetzt werden. Dies hat sich allerdings bisher als schwierig erwiesen. Als Ansatz für dieses Problem kommt RDF zum Einsatz. Als verbreitetes Datenmodell wurde es für die Repräsentation und den Austausch von semistrukturierten Daten (engl.: semi structured data) konzipiert. Der Begriff semistrukturiert umfasst hierbei Daten, die weder auf einem festgesetzten Schemabasieren noch völlig ungeordnet sind. Semistrukturierte Daten werden im Internet zunehmend in der Form von XML-Dokumenten gespeichert und übertragen. Obwohl schon viele Abfragesprachen für RDF im Einsatz sind, mangelt es ihnen dennoch an einer wichtigen Eigenschaft: Sie können nicht auf verschiedene Datenmodelle, welche unterschiedliche semantische Eigenschaften aufweisen, zugreifen.

Als Lösung für diese Problematik wurde TRIPLE entwickelt. Diese Regelbeschreibungssprache unterstützt Anwendungen, die von RDF Gebrauch machen, wodurch Schlussfolgerungen und Transformationen in unterschiedlichen Semantiken realisiert werden können. Auch können Inferenzmaschinen für Datenmodelle, wie RDF-Schema, direkt in TRIPLE implementiert werden, falls diese in Hornlogik ausgedrückt werden können. Ist dies nicht der Fall, bietet TRIPLE die Möglichkeiten, diese über Module, welche mit externen Inferenzmaschinen interagieren, darzustellen.

Aufgrund dieser ausgeweiteten Funktionalität bietet sich der Einsatz von TRIPLE im Bereich der Integration heterogener Informationsquellen an. Zu diesem Thema wird weiterführend in Kapitel 4 Stellung genommen. Dazu werden die Grundlagen beschrieben sowie ein Überblick darüber gegeben, welche Arten von Integrationskonflikten auftreten können, bevor abschließend anhand von Beispielen erläutert wird, welche Möglichkeiten TRIPLE auf dem Gebiet der Integration bietet.

Arbeit zitieren:
Hochleitner, Markus November 2004: Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen, Hamburg: Diplomica Verlag

Schlagworte:
Ontologie, Software-Agenten, Digitale Signatur, Wirtschaftsinformatik, RDF Schema

diplom.de
Bachelor + Master Publishing

Hermannstal 119 k
22119 Hamburg

Fon: +49 (0) 40 655992-0
Fax: +49 (0) 40 655992-22

Service-Telefon

Rufen Sie uns an:
+49 (0) 40 655992-0

Mo-Fr
09.00-16.00 Uhr

diplom.de in den Medien

Folgen Sie uns bei Twitter & werden Sie diplom.de-Fan bei Facebook!
Schreibtipps unserer Lektoren, Neuigkeiten aus dem Verlagsalltag und das Expertenwissen unserer Autoren als Tweet & Post!
Wir freuen uns auf Sie!

diplom.de BACHELOR + MASTER PUBLISHING

Bachelorarbeiten, Masterarbeiten, Diplomarbeiten, Magisterarbeiten, Dissertationen und andere Abschlussarbeiten aus allen Fachbereichen und Hochschulen können Sie bei uns als eBook sofort per Download beziehen oder sich auf CD oder als Buch zusenden lassen. Seit mehr als 15 Jahren ist diplom.de der seriöse, professionelle und erfolgreiche Partner für die Veröffentlichung wissenschaftlicher Abschlussarbeiten.

© Diplomica Verlag GmbH 1996-2011, AG Hamburg HRB 80293 - GF Björn Bedey, USt-IdNr.: DE214910002 - Verkehrsnummer: 12285 - Impressum
Index der Arbeiten - Index der Autoren