Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen
- Art: Diplomarbeit
- Autor: Markus Hochleitner
- Abgabedatum: November 2004
- Umfang: 77 Seiten
- Dateigröße: 545,7 KB
- Note: 3,0
- Institution / Hochschule: Wirtschaftsuniversität Wien Österreich
- Bibliografie: ca. 63
- ISBN (eBook): 978-3-8366-4070-1
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Hochleitner, Markus November 2004: Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen, Hamburg: Diplomica Verlag
- Schlagworte: Ontologie, Software-Agenten, Digitale Signatur, Wirtschaftsinformatik, RDF Schema
28,00 €
PDF-eBook Download: 28,00 €
Diplomarbeit von Markus Hochleitner
Einleitung:
Die Diplomarbeit umfasst das Thema ‚Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen’. Ziel ist die Beschreibung der Rolle, welche die modulare Regelbeschreibungssprache TRIPLE im Semantischen Web einnimmt. Weiter soll anhand von Beispielen jene Möglichkeiten dargestellt werden, die diese Sprache im Bereich der Integration heterogener Informationsquellen bietet. Die Arbeit wird dazu in 4 Teile gegliedert.
Im ersten Teil wird auf das ‚Semantische Web’ im Allgemeinen eingegangen. Insbesondere soll hier dessen Entstehung, Aufbau, Problemstellung und Möglichkeiten näher erläutert werden.
Der zweite Teil der Arbeit beschäftigt sich mit der Rolle der modularen Regelbeschreibungssprache TRIPLE innerhalb des Semantischen Webs. Es werden hier Aufbau, Funktionsweise, Syntax und Eigenschaften der Sprache beschrieben. Diese werden abschließend anhand eines Beispiels veranschaulicht.
Im dritten Teil wird auf die Problematik der Integration heterogener Informationsquellen eingegangen. Dazu werden die Grundlagen beschrieben, sowie ein Überblick darüber gegeben, welche Arten von Integrationskonflikten auftreten können. Anschließend wird anhand von Beispielen erläutert, welche Möglichkeiten die modulare Regelbeschreibungssprache TRIPLE auf dem Gebiet der Integration bietet.
Die Arbeit schließt mit einer Zusammenfassung des gewählten Themas.
Inhaltsverzeichnis:
| 1. | Einleitung | 6 |
| 2. | Semantisches Web | 7 |
| 2.1 | W3C | 8 |
| 2.1.1 | Geschichte | 8 |
| 2.1.2 | Aufgaben und Ziele | 9 |
| 2.2 | Die Idee des Semantischen Web | 11 |
| 2.3 | Problemstellung | 12 |
| 2.4 | Anwendungen des Semantischen Webs | 13 |
| 2.4.1 | Software-Agenten | 13 |
| 2.4.2 | RSS | 15 |
| 2.4.3 | Gezieltere Suche | 17 |
| 2.5 | Schichtenmodell | 18 |
| 2.5.1 | UNICODE / URI | 19 |
| 2.5.2 | XML, XML Schema, Namespaces | 21 |
| 2.5.3 | RDF, RDF Schema | 24 |
| 2.5.4 | Schema Schicht - Ontology vocabulary | 36 |
| 2.5.5 | Logik Schicht | 38 |
| 2.5.6 | Proof und Trust | 38 |
| 2.5.7 | Digitale Signatur | 39 |
| 2.6 | Fazit und Ausblick | 39 |
| 3. | TRIPLE | 42 |
| 3.1 | Definition | 42 |
| 3.2 | Problemstellung | 43 |
| 3.3 | Eigenschaften | 44 |
| 3.4 | CPU Beispiel | 46 |
| 4. | Integration heterogener Informationsquellen | 49 |
| 4.1 | Einleitung | 49 |
| 4.2 | Grundlagen der Integration | 49 |
| 4.3 | Integrationsprozess | 52 |
| 4.4 | Klassifikation von Integrationskonflikten | 55 |
| 4.4.1 | Strukturelle Heterogenitätskonflikte | 55 |
| 4.4.2 | Semantische Heterogenitätskonflikte | 57 |
| 4.4.3 | Inkonsistenz- und Redundanzprobleme | 57 |
| 4.5 | Integration mittels TRIPLE | 58 |
| 4.5.1 | Grundlagen | 58 |
| 4.5.2 | Parametrisierte Modelle | 59 |
| 5. | Verwandte Arbeiten | 66 |
| 6. | Zusammenfassung | 68 |
Textprobe:
Kapitel 3, TRIPLE:
TRIPLE ist eine schichtbasierte, modulare Regelbeschreibungssprache, die speziell für das Semantische Web entwickelt wurde. Dabei liegt der Schwerpunkt auf der Transformation und Abfrage von RDF Modellen. TRIPLE basiert auf der Hornlogik und enthält auch viele Fähigkeiten von F-Logik.
Hornlogik wird zur Beschreibung von Inferenzaktionen verwendet und schafft einen Kompromiss zwischen der Mächtigkeit des Ausdrucksformalismus und der Ausführbarkeit des Modells. Aufgrund dieses Kompromisses wird eine Formulierung mancher Sachverhalte sehr umständlich und damit auch fehleranfällig und schwer verständlich.
Bei F-Logik handelt es sich um eine Sprache zur Modellierung von Ontologien. Ihre Wurzeln liegen dabei in den objektorientierten deduktiven Datenbanken, wodurch sie traditionelle Funktionalitäten wie Klassen, Instanzen und Beziehungen für die Datenstrukturierung bietet.
Generell kann TRIPLE als Nachfolger von SiLRI (Abkürzung von engl.: Simple Logicbased RDF Interpreter) betrachtet werden. Einer der wichtigsten Unterschiede zu F-Logic und SiLRI ist vor allem die Tatsache, dass TRIPLE keine feststehende Semantik für objektorientierte Eigentümlichkeiten wie Klassen und Vererbung innehat. Ihre Schichtenarchitektur erlaubt es vielmehr, solche Merkmale auf einfache Weise für verschiedene objektorientierte und andere Datenmodelle wie UML, Topic-Maps oder RDF Schema zu definieren. Mit der Eigenschaft _modular_ wird auf die Erweiterbarkeit von TRIPLE hingewiesen, Description-Logic Module wie beispielsweise für DAML+OIL einzubinden. Ein weiterer Vorteil liegt letztendlich darin, dass TRIPLE eine leicht lesbare Syntax innehat, welche auf RDF basiert.
Das Semantische Web ermöglicht die Veröffentlichung von Daten verschiedenster Gruppen. Viele hoch spezialisierte Datenmodelle wie UML, TopicMaps, RDF Schema oder DAML+OIL haben sich bereits in diesem Bereich etabliert. Problematisch erweist sich nun die Tatsache, dass eine Vielzahl an unterschiedlichen Formaten, Sprachen, Speicher- und Abfragemechanismen im Zusammenhang mit semantischen Daten existieren. Um auf Daten, die auf verschiedenen Datenmodellen beruhen, zuzugreifen, müssten diese ständig von einer Repräsentationssprache in eine andere übersetzt werden. Dies hat sich allerdings bisher als schwierig erwiesen. Als Ansatz für dieses Problem kommt RDF zum Einsatz. Als verbreitetes Datenmodell wurde es für die Repräsentation und den Austausch von semistrukturierten Daten (engl.: semi structured data) konzipiert. Der Begriff semistrukturiert umfasst hierbei Daten, die weder auf einem festgesetzten Schemabasieren noch völlig ungeordnet sind. Semistrukturierte Daten werden im Internet zunehmend in der Form von XML-Dokumenten gespeichert und übertragen. Obwohl schon viele Abfragesprachen für RDF im Einsatz sind, mangelt es ihnen dennoch an einer wichtigen Eigenschaft: Sie können nicht auf verschiedene Datenmodelle, welche unterschiedliche semantische Eigenschaften aufweisen, zugreifen.
Als Lösung für diese Problematik wurde TRIPLE entwickelt. Diese Regelbeschreibungssprache unterstützt Anwendungen, die von RDF Gebrauch machen, wodurch Schlussfolgerungen und Transformationen in unterschiedlichen Semantiken realisiert werden können. Auch können Inferenzmaschinen für Datenmodelle, wie RDF-Schema, direkt in TRIPLE implementiert werden, falls diese in Hornlogik ausgedrückt werden können. Ist dies nicht der Fall, bietet TRIPLE die Möglichkeiten, diese über Module, welche mit externen Inferenzmaschinen interagieren, darzustellen.
Aufgrund dieser ausgeweiteten Funktionalität bietet sich der Einsatz von TRIPLE im Bereich der Integration heterogener Informationsquellen an. Zu diesem Thema wird weiterführend in Kapitel 4 Stellung genommen. Dazu werden die Grundlagen beschrieben sowie ein Überblick darüber gegeben, welche Arten von Integrationskonflikten auftreten können, bevor abschließend anhand von Beispielen erläutert wird, welche Möglichkeiten TRIPLE auf dem Gebiet der Integration bietet.
28,00 €
PDF-eBook Download: 28,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836640701
Arbeit zitieren:
Hochleitner, Markus November 2004: Semantisches Web, TRIPLE und Integration von heterogenen Informationssquellen, Hamburg: Diplomica Verlag
Schlagworte:
Ontologie, Software-Agenten, Digitale Signatur, Wirtschaftsinformatik, RDF Schema



