Veröffentlichen auch Sie Ihre Arbeiten - es ist ganz einfach!
Mehr InfosBachelorarbeit, 2010, 66 Seiten
Bachelorarbeit
Hochschule Mittweida (FH) (Mathematik / Physik / Informatik , Studiengang Wirtschaftsinformatik)
1,1
i. Abbildungsverzeichnis
ii. Tabellenverzeichnis
iii. Listingsverzeichnis
iv. Abkürzungsverzeichnis
0. Einleitung
1. Aufgabenstellung
1.1. Motivation
1.2. Zielsetzung
1.3. Fallbeispiel
1.4. Abgrenzung
1.5. Aufbau
2. Enterprise-Content-Management (ECM)
2.1. Definition
2.2. Bisherige Entwicklung
2.3. Basis-Komponenten
2.4. Architektur eines ECM-Systems
2.5. Vorteile gegenüber herkömmlicher Datenhaltung
3. Referenzlösung Alfresco
3.1. Total Cost of Ownership
3.2. Enterprise Application Integration (EAI)
3.3. Einsatz von Frameworks
3.4. Systemarchitektur
3.5. Anpassbarkeit an spezielle Bedürfnisse
3.5.1. Der Open Source Weg
3.5.2. Content-Modelling
3.5.3. Konfiguration des Systems
4. Dokumente im Unternehmen
4.1. Von der Vision zur Realität
4.2. Bedeutung innerhalb von Geschäftsprozessen
4.2.1. Was ist ein Geschäftsprozess?
4.2.2. Was ist Workflow-Management?
4.2.3. Geschäftsprozesse und Dokumente
4.2.4. Rechtliche Aspekte
4.3. Archivierung als Anwendungsfall
4.3.1. Anforderungen
4.3.2. Einsatzziele
4.3.3. Vorteile gegenüber Produktivsystemen ohne Archiv
4.4. ECM eine vielseitige Lösung
5. Dokumentenmanagement mit SAP
5.1. Überblick
5.2. Plattform „NetWeaver“
5.3. Relevante Business Services
5.4. SAP ArchiveLink
5.4.1. Verwaltungskonzept
5.4.2. Ablagearten
5.5. SAP HTTP Content Server 4.5 Schnittstelle
5.5.1. Content-Modell
5.5.2. Arbeitsweise
5.5.3. Funktionen
6. SAP-Alfresco-Connector
6.1. Analyse
6.1.1. Ziel / Produktzweck
6.1.2. Produkteinsatz
6.1.3. Identifikation der Schnittstellen
6.1.4. Produktübersicht / Architektur
6.1.5. Anwendungsfall „Dokument erzeugen“
6.2. Entwurf
6.2.1. Charakteristik des Connectors
6.2.2. Architekturmodell
6.2.3. Verwaltung von Content-Repositorien
6.2.4. Umsetzung des SAP-internen Dokumentenbegriffs
6.2.5. Sequenz „Dokument erzeugen“
6.3. Implementierung
6.3.1. Einsatz von JAX-RS
6.3.2. Webservice „Dokument erzeugen“
6.3.3. Archive-Type-Mapping
6.3.4. Aufgabe „Dokument spezifizieren“
7. Zusammenfassung
7.1. Fazit
7.2. Ausblicke
8. Literaturverzeichnis
v. Erklärung zur selbstständigen Anfertigung
Abbildung 1: ECM-Zyklus
Abbildung 2: Schichtenmodell
Abbildung 3: Integrationstopologie - Hub & Spoke am Beispiel der angestrebten Systemlandschaft
Abbildung 4: Alfresco Systemarchitektur, (Quelle: Alfresco Wiki, Alfresco Repository Architecture, 11.05.2009)
Abbildung 5: Flussdiagramm: Urlaubsbeantragung
Abbildung 6: Flussdiagramm: Anfrage eines Kunden
Abbildung 7: Überblick Dokumentenmanagement mit SAP (Quelle: Heck, Rinaldo, Geschäftsprozessorientiertes DMS mit SAP, 2009 S. 33)
Abbildung 8: Relevante DMS-Komponenten
Abbildung 9: Verknüpfungsdaten (Quelle: SAP AG, SAP ArchiveLink, 2001 S. 54)
Abbildung 10: Dokumentenbegriff in SAP (Quelle: SAP AG, SAP ArchiveLink, 2001 S. 239)
Abbildung 11: Komponentendiagramm: Architektur des Connectors
Abbildung 12: Anwendungsfalldiagramm: Dokument erzeugen
Abbildung 13: Klassendiagramm: Content-Repository
Abbildung 14: Klassendiagramm: Content-Modell
Abbildung 15: Sequenzdiagramm: Dokument erzeugen
Abbildung 16: Komponentendiagramm: Redirection
Tabelle 1: Arten von Content (Quelle: Kampffmeyer, Enterprise-Content-Management zwischen Vision und Realität, 2003 S. 6)
Tabelle 2: Funktionsbereiche des NetWeaver Application Servers
Tabelle 3: Content Server: Funktionsüberblick
Tabelle 4: Kriterien des SAP-Alfresco Connectors
Listing 1: Pfad-Annotierung
Listing 2: Methodenkopf
Listing 3: Repositorium erlangen
Listing 4: Multipart Form-Data erzeugen
Listing 5: Dokument erstellen
Listing 6: Komponenten erstellen
Listing 7: Antwort generieren
Listing 8: CMIS-Typdefinition
Listing 9: SAP-Funktionsbaustein
Listing 10: SAP-Tabellenabfrage
Listing 11: Type-Mapping
Abbildung in dieser Leseprobe nicht enthalten
Der Einsatz von betrieblicher Standardsoftware spielt innerhalb der meisten mittelständischen und großen Unternehmen bei der Abbildung von Geschäftsprozessen oder Organisationsstrukturen eine entscheidende Rolle. Was soweit führt, dass ein Tagesgeschäft ohne den Einsatz von Softwarelösungen nahezu undenkbar ist. Trotz der gewachsenen Bedeutung solcher Produkte handelt es sich immer noch um Standardsoftware, welche charakteristisch nur einen klar definierten Anwendungsbereich abdeckt und somit nicht alle individuellen Bedürfnisse des Kunden erfüllt. Um Insellösungen zu vermeiden, existieren vom Hersteller integrierte Schnittstellen. Oftmals passen diese jedoch nur zu kostenintensiven, zusätzlichen Komponenten, die wiederum nur einen Teil der gestellten Anforderungen befriedigen.
Die Betrachtung dieses Sachverhaltes im Zusammenhang mit der Thematik Enterprise-Content-Management (ECM) zeigt, dass betriebliche Standardsoftware nur einen Teil der Gesamtanforderungen, meist nur das klassische Content-Management, liefert. Entsprechende Bestandteile wie Dokumentenmanagement, Wissensmanagement, Kollaboration oder Schriftgutverwaltung sind entweder bloß rudimentär oder überhaupt nicht vorhanden und verdeutlichen, wie weit ein solches Produkt von einem eigentlichen ECM-System entfernt ist. Zwar lassen sich durch sogenanntes Customizing[1] eine Reihe von Anpassungen vornehmen, doch spezielle Bedürfnisse und Fähigkeiten bleiben so gut wie immer auf der Strecke oder erliegen den zahlreichen Vorteilen der Standardsoftware wie z.B. dem hohen Verbreitungs- und Reifegrad.
Um die Lücke zwischen Ist- und Soll-Zustand zu schließen, ist es notwendig die fehlenden Aspekte im Rahmen von Individualentwicklungen zu realisieren. Dabei stehen den Entwicklern verschiedene Alternativen zur Verfügung. Eine verbreitete Variante ist dabei der Einsatz von standardisierten Schnittstellen, welche es erlauben Entwicklungen möglichst versionssicher und produktunabhängig zu platzieren.
Dieser Abschnitt soll an die konkrete Aufgabe heranführen und die Rahmen-bedingungen dieser Bachelorarbeit festlegen.
Seit einigen Jahren setzen Unternehmen verstärkt auf die Verwendung von Open Source Software statt herkömmlicher proprietärer Lösungen. Vor allem im Bereich der ECM-Systeme etablieren sich immer mehr Produkte, welche den Entscheidungsprozess bei der Auswahl von Software wesentlich beeinflussen. Eines davon beschreibt die Lösung von Alfresco, welche basierend auf einer modularen Java-Architektur eine Verbindung neuester Konzepte und Modelle mit modernsten Technologien aufweist. Da viele bereits gewachsene Systemlandschaften vorwiegend auf Standardsoftware vertrauen, ist die Idee entstanden eine Anbindung zu realisieren, welche es vorsieht Alfresco als Archivkomponente für ein verbreitetes ERP System der SAP AG einzusetzen.
Das Ziel dieser Bachelorarbeit soll die Entwicklung eines Connectors[2] sein, der als Bindeglied zwischen einem SAP ERP System und einer Alfresco Instanz fungiert. Das spätere Softwareprodukt soll es ermöglichen innerhalb von SAP archivierte Dokumente im Content-Repository von Alfresco abzulegen und bei Bedarf wiederzuerlangen. Des Weiteren soll die Notwendigkeit von Dokumenten innerhalb von Unternehmen in den Zusammenhang mit der Thematik Enterprise-Content-Management gebracht werden, um die Einsatzmöglichkeiten solcher Systeme zu identifizieren.
Durch Customizing und die Verwendung des SAP-Alfresco-Connectors soll anhand eines Fallbeispiels gezeigt werden, dass vergleichbare Aktivitäten generell realisierbar sind. Der zu verwirklichende Anwendungsfall soll die Archivierung der im operativen System entstehenden Ausgangsrechnungen betreffen.
Die folgenden Punkte sind nicht Bestandteil dieser Arbeit:
- Es soll keine detaillierte Untersuchung der vom späteren Softwaresystem verwendeten Schnittstellen erfolgen.
- Da eine Beschreibung konkreter Vorgehensweisen zur Integration von Dokumenten in bestehende Arbeitsläufe zu umfangreich und zu speziell wäre, soll mit ECM lediglich eine allgemeine Lösungsvariante aufgezeigt werden.
- Um den Rahmen dieser Bachelorarbeit einzuhalten, soll keine vollständige Abhandlung des Softwareentwicklungsprozesses erstellt, sondern die Realisierung des SAP-Alfresco-Connectors anhand ausgewählter Schwerpunkte behandelt werden.
Für einen besseren Überblick soll im Folgenden Aufbau sowie Inhalt der einzelnen Kapitel vorgestellt werden.
Kapitel 2 führt in die Thematik Enterprise-Content-Management ein. Dabei werden die Begrifflichkeiten, Bestandteile und Konzepte erläutert, die den Einsatz von ECM in einem Unternehmen kennzeichnen.
In Kapitel 3 wird die Referenzlösung Alfresco vorgestellt. Anhand der Charakteristik dieser Lösung werden Kriterien aufgezeigt, welche für einen Einsatz im Unternehmen sprechen.
Kapitel 4 erläutert die Notwendigkeit von Dokumenten innerhalb von Geschäfts-prozessen. Hierbei wird Archivierung als einer von vielen Anwendungsfällen behandelt.
Kapitel 5 befasst sich mit den für die Realisierung relevanten Bestandteilen des SAP-Dokumentenmanagements. Dies umfasst die Softwarekomponenten, welche eine Anbindung von externen Ablagesystemen ermöglichen.
Kapitel 6 beschreibt die Entwicklung des Connectors. Dabei werden die Schwer-punkte der einzelnen softwaretechnischen Phasen aufgezeigt.
Im folgenden Kapitel soll eine Einführung in die Thematik ECM erfolgen.
Gemäß der Association for Information and Image Management (AIIM) lässt sich der Begriff ECM wie folgt definieren:
„Enterprise-Content-Management umfasst die Technologien zur Erfassung, Verwaltung, Speicherung, Bewahrung und Bereitstellung von Inhalten und Dokumenten zur Unterstützung organisatorischer Prozesse.“ [1]
Betrachtet man diese Definition genauer, so erschließen sich weitere Fragen und es lässt sich erahnen, dass das Thema ECM erheblich komplexer ist. Im Abschnitt 2.3 sollen deshalb die konventionellen Informationstechnologien unter der Überschrift „Basis-Komponenten“ veranschaulicht werden.
Zum Verständnis des Begriffs „Inhalt“ ist es wichtig, ihn noch einmal genauer zu spezifizieren, um die Unterschiede zwischen Inhalten und Dokumenten zu verdeutlichen.
Unter dem Term Inhalt, oftmals auch Content genannt, verbirgt sich eine Trennung zwischen den beschreibenden Daten und dem eigentlichen Inhalt. Im Gegensatz dazu beschreibt ein Dokument eine Einheit, welche meistens an einen bestimmten Zweck und eine Verwendung gebunden ist. Als Content können wiederum alle Arten von unstrukturierten, schwach strukturierten und strukturierten Informationen, die in elektronischer Form zur Nutzung bereitstehen, bezeichnet werden.
Tabelle 1 : Arten von Content (Quelle: Kampffmeyer, Enterprise-Content-Management zwischen Vision und Realität, 2003 S. 6)
Abbildung in dieser Leseprobe nicht enthalten
Die Aufgabe eines Enterprise-Content-Management-Systems besteht nun darin, den verschiedenen Inhalten durch Metadaten, Kategorisierung, Ablageort sowie durch Schaffung von Beziehungen zu anderem Content einen Kontext zu verleihen. Dies soll es dem Anwender ermöglichen, gewünschte Inhalte innerhalb kürzester Zeit wiederzufinden und mit Hilfe der verschiedenen Informationstechnologien den Lebenszyklus des Contents maßgeblich zu beeinflussen.
Die Ursprünge von ECM lassen sich bis in die 1980er Jahre zurückführen als die ersten Unternehmen begannen elektronische Dokumente datenbankgestützt zu verwalten. Damalige Anwendungen besaßen noch vorwiegend Client-Server-Architekturen. Dies verschaffte den Inhalten zwar unternehmensweite Verfügbarkeit, produzierte jedoch enorme Kosten, was die Wartung, Anpassbarkeit und Weiterentwicklung betraf. Erst 2001 als Dokumenten- und Web-Content-Management miteinander verwuchsen, konnten ganz neue Konzepte und Verfahren, die nun in Enterprise-Content-Management inbegriffen sind, erarbeitet werden. Mit dem Web 2.0 Hype im Jahre 2003 und den damit verbunden Technologien gelang es letztendlich ECM zu etablieren und einen eigenen Markt dafür zu schaffen [2] S. 6.
Die Basiskomponenten verinnerlichen die bereits in der Definition genannten Technologien und übernehmen damit alle wesentlichen Arbeitsfelder, welche mit Enterprise-Content-Management verbunden werden. Der Theorie zu Folge existieren die folgenden fünf Funktionsbereiche:
- Die Erfassungs-Komponente beinhaltet Funktionalität zur Erstellung, Erfassung, Aufbereitung und Verarbeitung von analogen und digitalen Informationen, so dass diese im Anschluss den anderen Komponenten und letztendlich dem Nutzer zur Verfügung stehen.
- Bevor eine Verwaltung von Content erfolgen kann, muss eine temporäre Sicherung der Daten erfolgen. Die Speicherungs-Komponente realisiert dies durch die Verwendung unterschiedlichster Repositorien, wie z.B. Dateisysteme, Datenbanken oder Data Warehouses, und ist dabei nicht mit der langfristigen Bewahrung von Dokumenten zu verwechseln.
- Einen sehr komplexen Teil beschreibt die Verwaltungs-Komponente, welche sich wiederum in fünf Unterkomponenten gliedern lässt. Durch die damit verbundenen Anwendungen wird eine Bearbeitung, Nutzung und Verwaltung der Inhalte ermöglicht. Beispiele hierfür sind das Definieren von Arbeitsabläufen, das Wiederauffinden von Dokumenten sowie das Setzen von Berechtigungen.
- Die Bereitstellungs-Komponente fungiert als sogenannter „Output-Manager“, welcher mit Hilfe von spezifischen Transformationstechniken die Generierung von benutzerspezifischen Dokumenten, unter anderem in Form von HTML-, XML- und PDF-Dokumenten, gewährleistet. Der Endanwender kann die gewünschten Informationen so zu jeder Zeit auf bevorzugter Art und Weise, ob per Internet, E-Mail oder über vorhandene E-Business-Portale, erhalten.
- Die Bewahrungs-Komponente ist im Gegensatz zur Speicherungs-Komponente für die Langzeitarchivierung von Dokumenten zuständig. Des Weiteren beinhaltet dies auch die Verwaltung von Bewahrungsregeln und das Anbinden von speziellen Speichermedien, welche die Inhalte vor Veränderungen schützen sollen.
Die folgende Abbildung zeigt das Zusammenspiel der einzelnen Komponenten in Form eines Zyklus, der für jedes zu verwaltende Dokument einmal abläuft. Ein Durchlaufen aller Komponenten ist dabei nicht zwangsläufig erforderlich.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1 : ECM-Zyklus
Wie bereits erwähnt, gliedert sich die Verwaltungs-Komponente in mehrere Subkomponenten. Laut dem amerikanischen Forschungsunternehmen Forrester[3] lässt sie sich in fünf Hauptanwendungsbereiche unterteilen, welche für ein Unternehmen je nach Einsatzgebiet des Softwareprodukts von ganz unterschiedlicher Relevanz sein können. Eine Aufteilung erfolgt in:
- Dokumentenmanagement bezeichnet eine bereits ausgereifte Informations-technologie, die es ermöglicht physische Dokumente in einer virtuellen Umgebung darzustellen und zu verwalten. Das Aufgabenfeld erstreckt sich über die Erfassung und Verarbeitung von Dokumenten bis hin zur Bereitstellung und Verbreitung.
- Web-Content-Management befasst sich mit der Organisation und der Verwaltung von Webseiten und dem dazugehörigen Inhalt.
- Records-Management beinhaltet die dauerhafte Aufbewahrung und Archivierung von Schriftgut sowie die systematische Aufzeichnung von Geschäftsvorgängen.
- Image-Management beschreibt die Vorgänge zur Verwaltung eingescannter Dokumente. Dazu gehören neben dem Prozess des Scannens, Qualitäts-kontrolle, Metadatenerfassung sowie die Speicherung von elektronischen Informationen.
- Digital-Asset-Management wird vorrangig in der Marketingbranche eingesetzt. Es befasst sich mit der Erfassung, Erzeugung und Bearbeitung von elektronischen Medien wie z.B. Fotos, Videos und Illustrationen.
Im Gegensatz dazu beinhalten andere Untergliederungen der Verwaltungs-Komponente an Stelle des Image-Managements, welches auch den Erfassungs-technologien zugeordnet werden kann, und dem speziellen Digital-Asset-Management die beiden folgenden Teilkomponenten:
- Mit Hilfe von Kollaboration wird eine Unterstützung der Zusammenarbeit einer Gruppe von Personen realisiert. Neben der Überwindung von Hindernissen wie räumlicher und zeitlicher Distanz, ist das Ziel sogenannter Groupware-Applikationen die Bereitstellung eines formalen und kontrollierbaren gemeinsamen Arbeitsbereiches.
- Workflow-Management befasst sich mit den Aufgaben der Analyse, Durchführung und Steuerung von Geschäftsprozessen. Es stellt ein Werkzeug in der Form eines Programmes dar, welches eine Verwaltung der einzelnen Workflows ermöglicht. Eine genaue Begriffsdefinition findet sich in Abschnitt 4.2.2.
Um den Anforderungen an heutige ECM Lösungen gerecht zu werden, hat sich beim Entwurf gezeigt, dass eine Schichtenarchitektur, sogenanntes Layering, sich als am geeignetsten erweist, wenn es darum geht die zahlreichen Komponenten eines solchen Systems zu organisieren. Eine Trennung des Gesamtsystems erfolgt in fünf Schichten. Dabei ist zu beachten, dass ein Zugriff lediglich von einer „höher“ gelegenen Schicht auf eine „tiefer“ liegende erfolgen kann. Die folgende Abbildung soll dies verdeutlichen:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2 : Schichtenmodell
Die Anwendungsschicht beinhaltet die in Punkt 2.3 genannten Komponenten eines Enterprise-Content-Management-Systems und bildet mit dem darunterliegenden Repositorium den Kern der Anwendung. Schnittstellen, welche die Grundlage schaffen ein Softwareprodukt in die vorhandene Systemlandschaft zu integrieren, setzen direkt auf das Content-Repository und dessen Dienste auf. Externe Anwendungen erhalten somit einen Zugang zur Datenzugriffsschicht und damit auf verwaltete Inhalte sowie deren Metadaten. Durch den Einsatz dieses Architekturmodells ist es möglich einzelne Schichten wie z.B. Präsentation auszutauschen ohne die darunter liegende Logik zu beeinflussen.
Bei der Entwicklung von Softwaresystemen jeglicher Art stößt man früher oder später immer wieder auf das Problem der Datenhaltung. Ein Großteil der Anwendungen wählt dabei einen der beiden herkömmlichen Wege, welche im folgenden Abschnitt erläutert werden sollen.
Eine Vorgehensweise beinhaltet die Nutzung des klassischen Dateisystems. Dabei werden Routinen und Werkzeuge des Betriebssystems genutzt, um die anwendungs-spezifischen Dateien zu bewahren. Da es keinen Kontext gibt, in dem die verwalteten Inhalte stehen, außer dem Dateinamen, dem Anwendungstyp und dem Speicherort, ist es fast unmöglich Content in dieser Art und Weise zu handhaben. Auch Abfragen, wie bei einer Datenbank üblich, oder das Speichern von zusätzlichen Metadaten sind nur schwer realisierbar. Das Dateisystem allein sollte daher lediglich für überschaubare Mengen von Dokumenten eingesetzt werden.
[...]
[1] Die Anpassung des Softwareproduktes an individuelle Bedürfnisse.
[2] Eine Schnittstelle zwischen zwei oder mehreren Softwaresystemen.
[3] Ein unabhängiges Technologie- und Marktforschungsunternehmen.
Kommentare