Identifizierung und Rekonstruktion eines allgemeinen Schemas für Web-Content-Management-Systeme
- Art: Diplomarbeit
- Autor: Thomas Goßler
- Abgabedatum: Oktober 2002
- Umfang: 76 Seiten
- Dateigröße: 2,0 MB
- Note: 1,0
- Institution / Hochschule: Friedrich-Alexander-Universität Erlangen-Nürnberg Deutschland
- ISBN (eBook): 978-3-8324-6437-0
-
ISBN (Paperback) :
978-3-8324-6437-0 P - ISBN (CD) :978-3-8324-6437-0 CD
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Goßler, Thomas Oktober 2002: Identifizierung und Rekonstruktion eines allgemeinen Schemas für Web-Content-Management-Systeme, Hamburg: Diplomica Verlag
- Schlagworte: Entity Relationship-Diagramm, WCMS, Java, Asset Management, XML
In den Warenkorb
48,00 €
Diplomarbeit von Thomas Goßler
Zusammenfassung:
Heute existiert eine Klasse von Softwaresystemen zur Unterstützung einer effizienten Verwaltung und Strukturierung großer Informationsmengen für das Internet (Web-Content-Managementsysteme). Diese Systeme unterscheiden sich teilweise grundlegend in ihrer Funktionalität. Ausgehend von einer klaren Abgrenzung der Aufgaben eines solchen Systems können einige wesentliche Aspekte in den Mittelpunkt gerückt werden.
Die Art der Datenhaltung ist von grundlegendem Interesse. Im Vergleich der verschiedenen verfügbaren Datenbanktechnologien zeigt sich, dass eine XML-fähige objektrelationale Datenbank die Belange des Web-Content-Managements optimal unterstützt. Aus pragmatischer Sicht hat aber die Verwendung einer rein relationalen Datenbank trotzdem Vorteile. Das Digital Asset Management ist für eine zentrale Speicherung der einzelnen Bestandteile des Web-Contents zuständig. Eine Unterstützung für die Verwaltung von Versionen und Varianten ist dabei wichtig. Die nutzerindividuelle Aufbereitung von Inhalten (Personalisierung) ist ein aufwendiges Thema und sollte deshalb in Form einer Komponente austauschbar sein. Trotz der damit verbundenen Unabhängigkeit des Web-Content-Managementsystems von speziellen Belangen der Personalisierung muss eine grundsätzliche technische Unterstützung für eine solche Komponente vorhanden sein. Dadurch ergeben sich einige Anforderungen an das zugrunde liegende Datenbankschema.
Alle genannten Themenbereiche sind stark von der Handhabung der einzelnen Inhaltsbestandteile – der Assets – abhängig. In diesem Zusammenhang kommt dem Ansatz der strikten Trennung von Struktur, Inhalt, Darstellung und Programmlogik besondere Bedeutung zu. Er ermöglicht nicht nur eine arbeitsteilige Erstellung und Pflege der Assets, sondern erweitert auch die Flexibilität bei der Personalisierung. Auf Basis der XML kann eine orthogonale Verarbeitung der vier Bestandteile realisiert werden, welche auch das Cross-Media Publishing optimal unterstützt. Durch die orthogonale Einbringung von Programmlogik kann der Web-Content auch nachträglich in bestehende Web-Applikationen integriert werden. Existierende Web-Content-Managementsysteme unterstützen dieses Konzept nur unzureichend.
In dieser Arbeit werden die technischen Grundkonzepte der genannten Themenbereiche genauer betrachtet. Insbesondere ein allgemeines Datenbankschema wird eingeführt, welches die Anforderungen an ein Web-Content-Managementsystem umfassend berücksichtigt. Die Seitenverwaltung hat dabei besondere Bedeutung, da sie die Trennung der oben beschriebenen vier Aspekte des Web-Contents abbildet. Der Zugriff auf den Datenbestand und die Steuerung des Publizierungsprozesses ermöglicht ein Application Programming Interface (API), dessen Objektmodell durch UML-Klassendiagramme visualisiert wird. Eine Implementierung des API in Java und eine Beispiel-Webseite belegen die Einsatzfähigkeit der vorgestellten Konzepte.
Inhaltsverzeichnis:
| 1. | Einleitung | 1 |
| 1.1 | Motivation und Zielsetzung | 1 |
| 1.2 | Aufbau der Arbeit | 2 |
| 2. | Anforderungsanalyse | 5 |
| 2.1 | Datenhaltung | 5 |
| 2.1.1 | Relationale Datenbanksysteme | 5 |
| 2.1.2 | Objektorientierte Datenbanksysteme | 6 |
| 2.1.3 | XML-Datenbanksysteme | 7 |
| 2.1.4 | Bewertung im Kontext des Web-Content-Managements | 8 |
| 2.2 | Funktionale Aspekte | 9 |
| 2.2.1 | Asset-Management | 10 |
| 2.2.2 | Trennung von Struktur, Inhalt, Darstellung und Programmlogik | 12 |
| 2.2.3 | Publizierung: Staging- vs. Live-Server-Konzept | 14 |
| 2.2.4 | Personalisierung des Web-Contents | 15 |
| 2.2.5 | Unterstützung von Semantic Web-Konzepten | 16 |
| 2.2.6 | Weitere Aspekte | 17 |
| 3. | Datenmodell und -verarbeitung | 19 |
| 3.1 | Speicherung der Assets | 21 |
| 3.2 | Seitenverwaltung | 23 |
| 3.3 | Struktur, Inhalt und Darstellung | 25 |
| 3.3.1 | Zusammenführung von Struktur und Inhalt | 25 |
| 3.3.2 | Transformation ins Ausgabeformat | 27 |
| 3.4 | Programmlogik als separater Bestandteil | 29 |
| 3.5 | Vorbereitung für die Personalisierung des Web-Contents | 31 |
| 3.6 | Kontextverwaltung zur Strukturierung des Web-Contents | 35 |
| 3.7 | Link-Management | 36 |
| 3.8 | Integration von Semantic Web-Konzepten | 37 |
| 4. | Application Programming Interfaces | 43 |
| 4.1 | Administrations-API | 43 |
| 4.1.1 | Anforderungen | 44 |
| 4.1.2 | Modell und Verwendung | 45 |
| 4.1.3 | Dateneditor als Beispielanwendung | 47 |
| 4.2 | Publizierungs-API | 48 |
| 4.2.1 | Anforderungen | 50 |
| 4.2.2 | Modell | 51 |
| 4.2.3 | Verwendung | 54 |
| 5. | Evaluierung der Einsatzfähigkeit | 57 |
| 5.1 | Anforderungen an eine Beispielanwendung | 57 |
| 5.2 | Verwendung von COCOON als Publizierungskomponente | 58 |
| 5.3 | Eine Beispiel-Webseite | 60 |
| 5.4 | Bewertung | 65 |
| 6. | Zusammenfassung und Ausblick | 67 |
| Literatur und Web-Referenzen | 69 | |
| Anhang | 73 | |
| A. | Ausgewählte Quelltexte | 73 |
| B. | Einrichtung der Softwareumgebung | 74 |
Die Variable name muss dabei den Klassennamen des hinzuzufügenden Parameters enthalten, die Variable value eine Referenz auf die Instanz des entsprechenden Parameterobjekts. Bei der Publizierung werden dann zunächst die Beschreibungen zur Einbettung der Programmlogik (Logicsheets) angewendet, das heißt die entsprechenden XSLTransformationen werden vorgenommen. Sofern Logik eingebettet wurde, wird das resultierende XML-Dokument mit Programmlogik (jetzt als XSP-Dokument zu bezeichnen) dann in der Datei „PubMan.xsp“ auf dem Datenträger gespeichert, ansonsten in der Datei „PubMan.xml“. Die Dateiendung weist COCOON an, entweder eine Übersetzung des eingebetteten Java-Quelltext vorzunehmen („.xsp“) oder das Dokument als pure XML-Daten normal weiterzuverarbeiten („.xml“). Anschließend werden die Darstellungsbeschreibungen (Stylesheets) auf den Datenträger geschrieben, so dass sie von COCOON verwendet werden können. Da in der aktuellen Version von COCOON 2 der Arbeitsablauf in der Konfigurationsdatei „sitemap.xmap“ definiert werden muss, also nicht dynamisch zur Laufzeit festgelegt werden kann, wurde eine Prozesskette von neun Transformationen festgelegt (Abbildung 38). [...]
Zur Publizierung von Web-Content mit eingebetteter serverseitiger Programmlogik ist ein Seitenprozessor notwendig, der den Quelltext übersetzt oder interpretiert, ausführt und das Ergebnis der Ausführung wieder in den Publizierungsprozess einbindet. Es existieren zahlreiche Ansätze, die solche Prozessoren verwenden (z.B. PHP, ASP, JSP, XSP, u. a.). Für eine Abbildung der konsequenten Trennung von Struktur, Inhalt, Darstellung und Programmlogik ist das Konzept der eXtensible Server Pages (XSP) aufgrund der XMLkonformen Strukturierungskonstrukte besonders gut geeignet. XSP ist zum Zeitpunkt der Entstehung dieses Textes nur in den beiden Open Source-Projekten AxKit und COCOON der Apache Software Foundation ([AXML02]) verfügbar. Da die Beispielimplementierung in Java erfolgen soll, wurde COCOON als zu verwendetes System gewählt (AxKit basiert auf Perl). COCOON wird von den Entwicklern als XML-Publishing-Framework bezeichnet. Oberflächlich betrachtet stellt es eine Möglichkeit zur Publizierung von XML-Dokumenten als Webseiten durch Transformation mit XSLT dar, wobei eingebetteter Java-Quelltext übersetzt, ausgeführt und das Ergebnis in das XML-Dokument wieder eingebunden wird. Obwohl COCOON wesentlich leistungsfähiger ist, als dieser kurzen Charakterisierung zu entnehmen ist, soll an dieser Stelle nicht näher darauf eingegangen werden1. Die genannte Funktionalität reicht aus, um den Einsatzzweck in dieser Arbeit zu erfüllen. COCOON wird dabei ausschließlich für die Abschlusstransformation des strukturierten Inhalts und der Beschreibungen für die Darstellung und die Einbettung der Programmlogik in das gewünschte Ausgabeformat eingesetzt, implementiert also die in Abschnitt 4.2 vorgestellte Schnittstellendefinition für die Publizierungskomponente. Da COCOON in erster Linie eine Servlet-basierte Web-Applikation entsprechend dem Jakarta Tomcat-Standard ist und somit einerseits diverse Konfigurationsdateien benötigt, andererseits aber zur Laufzeit auch noch eigene spezifische Verzeichnisstrukturen anlegt, ist es nicht möglich, es in einer Komponente ohne Nebenwirkungen vollständig zu kapseln. Deshalb ist die hier verwendete Implementierung der Schnittstellendefinition für die Publizierungskomponente als Adapter für COCOON zur Anbindung an das WCMS zu sehen. COCOON benötigt als Servlet einige Parameter zur korrekten Funktionsweise. Es handelt sich dabei um die Objektinstanzen des Servlet-Kontext (ServletContext), der Abfrage (HttpServletRequest) und der Antwort (HttpServletResponse). Da die Schnittstellenmethode publish der Publizierungskomponente keine spezifischen Parameter enthalten kann, wurde eine zusätzlich Methode zur Definition zusätzlicher Parameter definiert: [...]
In Abschnitt 2 wurden die wichtigsten Anforderungen an ein Web-ContentManagementsystem erörtert. Neben der Wahl des Datenhaltungssystems und dem AssetManagement stand dabei die Trennung von Struktur, Inhalt, Darstellung und Programmlogik im Vordergrund. Abschnitt 3 griff diese Schwerpunktthemen erneut auf und vermittelte wichtige Konzepte für eine technische Umsetzung. Insbesondere wurde ein Datenschema vorgestellt, welches als verallgemeinerte und umfassende Basisdatenstruktur für WebContent-Managementsysteme gelten soll. Abschnitt 4 ergänzte die vorhergehenden Überlegungen durch zwei Modelle für Application Programming Interfaces (APIs), welche den administrativen und den lesenden Zugriff in möglichst effizienter Weise ermöglichen sollen. Um diesen Ergebnissen noch mehr Substanz zu verleihen, soll in diesem Abschnitt ein einfaches Beispiel für den Einsatz der Technologien gezeigt werden. Anhand einer einfachen Webseite, welche über den Dateneditor aus Abschnitt 4.1.3 basierend auf dem Administrations-API in die Datenbank bzw. das Datenschema aus Abschnitt 3 eingefügt wurde, soll die Funktionalität des Publizierungs-API demonstriert werden. Aus Gründen des Aufwands wurde keine Webseite bzw. –anwendung aus der „realen Welt“ nachgebildet. Die verwendete Beispielseite erfüllt die Anforderungen aber genauso gut. [...]
In den Warenkorb
48,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783832464370
Arbeit zitieren:
Goßler, Thomas Oktober 2002: Identifizierung und Rekonstruktion eines allgemeinen Schemas für Web-Content-Management-Systeme, Hamburg: Diplomica Verlag
Schlagworte:
Entity Relationship-Diagramm, WCMS, Java, Asset Management, XML



