Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows
- Art: MA-Thesis / Master
- Autor: Matthias Röger
- Abgabedatum: September 2008
- Umfang: 145 Seiten
- Dateigröße: 2,8 MB
- Note: 1,3
- Institution / Hochschule: Universität Konstanz Deutschland
- Bibliografie: ca. 73
- ISBN (eBook): 978-3-8366-3329-1
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Röger, Matthias September 2008: Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows, Hamburg: Diplomica Verlag
- Schlagworte: Data Warehouse, Business Process Intelligence, Workflow-Analyse, OLAP, Business Intelligence Plattform
48,00 €
PDF-eBook Download: 48,00 €
MA-Thesis / Master von Matthias Röger
Einleitung:
Die Einsatzfelder der Data-Warehouse-Technologie sind weit gestreut und reichen von betriebswirtschaftlichen Aufgabenstellungen über wissenschaftliche Analysen bis hin zu technischen Belangen, wobei die Analyse von Geschäftsprozessen in Unternehmen den häufigsten Einsatzbereich darstellt.
Eine wachsende Zahl von Unternehmen integrieren und automatisieren ihre Geschäftsprozesse und verfolgen dabei das Ziel, dass sie neben der Effizienzsteigerung und der Verbesserung der Qualität auch eine Reduktion der Kosten sowie der menschlichen Fehlleistungen erreichen. In diesem Zusammenhang werden Geschäftsprozessmanagementsysteme (Business Process Management System, BPMS) eingesetzt, um das Prozessdesign und die Prozessausführung zu optimieren. Dabei nehmen diese Systeme große Datenmengen über die ausgeführten Geschäftsprozesse auf. Herkömmliche BPMS setzen ihren Schwerpunkt auf die Unterstützung des Designs und führen Simulationen durch, um Engpässe in den Abläufen zu identifizieren. Dabei spielen Analysefähigkeiten, um Durchführungen hinsichtlich bestimmter Geschäftsmetriken zu quantifizieren, kaum eine Rolle. Auch wurden die zugrunde liegenden Geschäftsprozessmodelle nicht dafür entworfen, diese Art der Analyse von Prozessdaten zu unterstützen. Allerdings können diese Möglichkeiten der Datenanalyse einen wesentlichen Beitrag dazu leisten, notwendige Informationen im Verlauf von Entscheidungsprozessen zur Verfügung zu stellen.
Aus diesem Hintergrund heraus entwickelt sich gegenwärtig das neue Gebiet Business Process Intelligence. Dieses überwindet die Defizite solcher Standard-BPMS durch die Anwendung von Analysetechniken aus dem Business-Intelligence-Umfeld auf Geschäftsprozesse. So erfolgt z.B. die Speicherung der Prozessausführungsdaten in einem DWH, worauf eine Analyse mit OLAP- bzw. Data-Mining-Anwendungen möglich ist, bzw. Wissensextraktionen in verschiedenen Bereichen durchgeführt werden können.
Diese Problematik lässt sich auch auf die medizinische Domäne übertragen. So entwickelt sich zur Zeit im Umfeld der Medizintechnik das vielversprechende Konzept der Chirurgischen Workflows. Dabei handelt es sich um die intelligente Erfassung von Prozessbeschreibungen chirurgischer Eingriffe, um auf deren Basis sowohl klinische wie auch technische Analysen zu ermöglichen. Wurden bereits im Vorfeld vom ICCAS der Einsatz verschiedener BPMS untersucht und in dieser Domäne für nicht zweckmäßig befunden, hat diese Arbeit zur Aufgabe, ein Modell zur Erfassung chirurgischer Workflows in Form eines Data Warehouses zu konzipieren, auf dessen Grundlage eine multidimensionale Datenanalyse chirurgischer Eingriffe erfolgen kann.
Diese Arbeit lieferte auch einen Beitrag zu einem Buchkapitel über konzeptionelles Data-Warehouse-Design für Business Process Intelligence.
Zielsetzung:
Die Zielsetzung dieser Arbeit besteht in erster Linie darin, ein multidimensionales Datenmodell zu konzipieren, welches in der geforderten Art und Weise die Charakteristiken von chirurgischen Eingriffen erfassen und abbilden kann, um so eine Datenbasis zur Verfügung stellen zu können, worauf die Analyse der chirurgischen Workflows erfolgt.
Zunächst sind daher die Anforderungen zu klären, welche die späteren Anwender an das Data Warehouse hinsichtlich möglicher Fragestellungen bzw. einzusetzender Analyseverfahren stellen. Auf dieser Grundlage muss eine Strukturierung der chirurgischen Prozesse erfolgen, um eine geeignete Gestaltung des Aufzeichnungsschemas ableiten zu können. So stellt sich z.B. die Frage nach der Granularität der Analyse oder aus welchen Perspektiven die Workflows später zu analysieren sind. Des Weiteren ist die Datenerfassungsstrategie festzulegen. Die Modellierung der Fakt- und Dimensionsschemata muss in einer geeigneten Weise erfolgen (durch sie wird die Transformation der Workflows in den Datenwürfel vorgegeben) und wo nötig das standardmäßige multidimensionale Modell angepasst bzw. erweitert werden, um den unterschiedlichen Anforderungen der späteren Anwender gerecht werden zu können. Nach der konzeptionellen Phase der multidimensionalen Datenmodellierung erfolgt die Realisierung des entstandenen Modells auf Grundlage eines relationalen OLAP-Systems. Auf diesem System findet im Zusammenspiel mit der Business Intelligence Suite Pentaho eine OLAP-Analyse der chirurgischen Workflows statt. Zu deren Durchführung müssen die Workflow-Daten in die Datenbank geladen, Pentaho entsprechend konfiguriert und die gewünschten OLAP-Würfel modelliert werden.
Gang der Untersuchung:
Im ersten Kapitel wird die im Rahmen dieser Masterarbeit behandelte Anwendung sowie der Kooperationspartner Innovation Center Computer Assisted Surgery (ICCAS) vorgestellt. Es werden die zu analysierenden Daten beschrieben und die Anwendungsgebiete der Analyse chirurgischer Workflows aufgezeigt.
Das zweite Kapitel liefert die Grundlagen zum Thema Business Intelligence (BI), Data Warehouse (DWH), multidimensionales Datenmodell und Online Analytical Processing (OLAP) sowie Business Process Intelligence (BPI). Insbesondere die Themen DWH und OLAP werden ausführlich behandelt, um auch dem auf diesem Gebiet unerfahrenen Leser ein grundlegendes Verständnis zu ermöglichen; Leser, welche bereits Kenntnisse auf diesem Gebiet besitzen, können durch dieses Kapitel ihre Kenntnisse auffrischen oder es überspringen.
Das dritte Kapitel stellt dar, wie man chirurgische Workflows strukturieren kann und geht dabei auf die umgesetzte Erfassungsstrategie sowie die Granularität der Analyse ein. Als Ergebnis wird auf konzeptioneller Ebene ein Modell zur Erfassung chirurgischer Workflows in Form eines E/R-Diagramms geliefert.
Im vierten Kapitel erfolgt die Transformation des Workflow in eine Datenwürfeldarstellung. Dabei werden die Herausforderungen und Lösungen aufgezeigt, welche die Transformation vom Workflow zum Datenwürfel mit sich bringt. Aufbauend auf den Erkenntnissen des dritten Kapitels erfolgt hier nun die Modellierung eines dimensionalen Fakt-Modells.
Kapitel fünf beschreibt die logische und physische Umsetzung des dimensionalen Fakt-Modells. Dabei werden die eingesetzten Erweiterungen des Galaxy-Schemas dargestellt. Ein weiteres Thema ist der durchgeführte ETL-Prozess der zu analysierenden Daten.
Das Kapitel sechs gibt zunächst einen allgemeinen Überblick über die Business Intelligence Suite Pentaho, auf welcher das DWH realisiert wurde und auch die OLAP-Analyse erfolgt. Im ersten Teil werden der Aufbau und die Anwendungsgebiete von Pentaho gezeigt und die verfügbaren Komponenten kurz vorgestellt, wobei der Fokus auf den OLAP-Server Mondrian gerichtet ist. Im zweiten Teil erfolgt eine Beschreibung der Konfigurationsdatei des Mondrian Schemas, welches den OLAP-Würfel abbildet und den Zugriff auf die Datenbank während der Analyse regelt. Zudem wird das Vorgehen gezeigt, wie mit Hilfe eines Modellierungstools ein OLAP-Würfel erstellt und zur Analyse in die Pentaho Suite integriert wird.
In Kapitel sieben werden beispielhaft Anwendungsfälle aus dem OLAP-Bereich der Analyse chirurgischer Workflows gezeigt. Das Kapitel acht enthält eine kurze Zusammenfassung und schließt mit einem Ausblick.
Inhaltsverzeichnis:
| 1. | Einführung | 9 |
| 1.1 | Einleitung | 9 |
| 1.1.1 | Aufgabenstellung und Zielsetzung | 9 |
| 1.1.2 | Aufbau dieser Arbeit | 10 |
| 1.2 | Kooperationspartner Innovation Center for Computer Assisted Surgery (ICCAS) | 11 |
| 1.2.1 | Vorstellung ICCAS | 11 |
| 1.2.2 | Workflow-Aufzeichnung | 12 |
| 1.2.3 | Anwendungsgebiete Analyse chirurgischer Workflows | 13 |
| 1.2.3.1 | Profiteure der chirurgischen Workflowanalyse | 14 |
| 1.2.3.2 | Typen möglicher Anfragen | 14 |
| 1.2.3.3 | Aufgezeichnete Datentypen | 15 |
| 1.2.4 | Datenfluss Workflow-Aufzeichnung | 16 |
| 2. | Grundlagen | 19 |
| 2.1 | Business Intelligence | 19 |
| 2.2 | Data Warehouse | 21 |
| 2.2.1 | Der Begriff Data Warehouse | 21 |
| 2.2.2 | Merkmale eines Data Warehouses | 21 |
| 2.2.3 | Das Data-Warehouse-System und seine Komponenten | 22 |
| 2.2.3.1 | Datenquellenebene | 23 |
| 2.2.3.2 | Datenhaltungsebene (DWH, Data Mart, Daten Ein- u. Ausgabe) | 23 |
| 2.2.3.3 | Analyseebene | 25 |
| 2.2.3.4 | Metadaten-Repository, Administration und Monitoring | 25 |
| 2.2.3.5 | Operational Data Store (ODS) | 25 |
| 2.3 | Online Analytical Processing | 26 |
| 2.3.1 | Abgrenzung OLAP versus OLTP | 26 |
| 2.3.2 | Codd'sche Grundregeln und FASMI-Definition für OLAP-Systeme | 28 |
| 2.3.3 | Multidimensionales Datenmodell | 29 |
| 2.3.3.1 | Multidimensionaler Datenwürfel (Cube) | 29 |
| 2.3.3.2 | Dimensionen und Dimensionshierarchien | 30 |
| 2.3.3.3 | Fakten | 33 |
| 2.3.3.4 | Kennzahlen | 34 |
| 2.3.4 | Standard OLAP-Operationen zur Datenanalyse | 36 |
| 2.3.4.1 | Roll-up und Drill-down | 36 |
| 2.3.4.2 | Slice und Dice | 37 |
| 2.3.4.3 | Pivotierung (Rotation) | 38 |
| 2.3.5 | Konzeptionelle Modellierung | 38 |
| 2.3.5.1 | Probleme herkömmlicher Modellierungstechniken beim konzeptionellen Entwurf | 38 |
| 2.3.5.2 | Vorstellung verschiedener Design-Notationen | 39 |
| 2.3.5.3 | Grundprinzip des Dimensional Fact Model und dessen Erweiterung | 39 |
| 2.3.5.4 | Modellbeschreibung mit X-DFM | 40 |
| 2.3.6 | Umsetzung des Multidimensionalen Datenmodells | 41 |
| 2.3.6.1 | Relationales OLAP (ROLAP) | 41 |
| 2.3.6.2 | Multidimensionales OLAP (MOLAP) | 46 |
| 2.3.6.3 | Hybrides OLAP (HOLAP) | 47 |
| 2.4 | Business Process Intelligence und chirurgische Workflows | 47 |
| 2.4.1 | Business Process Intelligence | 47 |
| 2.4.2 | Konzept der Chirurgischen Workflows | 49 |
| 3. | Strukturierung chirurgischer Workflows | 51 |
| 3.1 | Vertikale Strukturierung des Prozesses | 52 |
| 3.1.1 | Datenerfassungsstrategie | 52 |
| 3.1.1.1 | Aufgabengetriebene (logische) Strukturierung | 52 |
| 3.1.1.2 | Statusgetriebene (ereignisbasierte) Strukturierung | 53 |
| 3.1.1.3 | Einsatz von Aufgaben- bzw. Statusgetriebener Datenerfassung | 53 |
| 3.1.2 | Granularität der Analyse | 54 |
| 3.1.2.1 | Workflow-Ebene | 54 |
| 3.1.2.2 | Intra-Workflow-Ebene | 54 |
| 3.2 | Horizontale Gliederung des Prozesses | 55 |
| 3.3 | Erstellung des konzeptionellen Datenmodells | 56 |
| 3.3.1 | Bereich der Workflow-Ebene | 57 |
| 3.3.2 | Bereich Intra-Workflow-Ebene | 58 |
| 4. | Vom Workflow zum Datenwürfel: Herausforderungen und Lösungen | 61 |
| 4.1 | Phasen der konzeptionellen Modellierung | 61 |
| 4.2 | Faktschemata ohne Kennzahlen | 62 |
| 4.2.1 | Fakt-Identifikator | 63 |
| 4.2.2 | Kennzahlen dynamisch erzeugen | 64 |
| 4.3 | Entwicklung der grundlegenden Faktschemata | 64 |
| 4.3.1 | Ausgangslage | 65 |
| 4.3.2 | Fakt-Generalisierung | 66 |
| 4.3.3 | Modellierung von Satelliten-Fakttypen | 67 |
| 4.3.4 | Fakt-Hierarchie | 68 |
| 4.4 | Auflösung von ‘viele-zu-viele’-Beziehungen zwischen Fakten und Dimensionen | 70 |
| 4.4.1 | Ausgangslage | 70 |
| 4.4.2 | Das Problem und die Lösung | 71 |
| 4.5 | Austauschbarkeit von Fakt- und Dimensionsrollen | 73 |
| 4.5.1 | Ausgangslage | 73 |
| 4.5.2 | Das Problem und die Lösung | 73 |
| 4.6 | Austauschbarkeit von Kennzahl- und Dimensionsrollen | 75 |
| 4.6.1 | Ausgangslage | 75 |
| 4.6.2 | Das Problem und die Lösung | 76 |
| 4.6.3 | Realisierung Kennzahlspezifikation zur Laufzeit | 77 |
| 4.7 | Modellierung von Dimensionshierarchien | 79 |
| 4.7.1 | Typen von Hierarchien | 79 |
| 4.7.2 | Abgeleitete Kategorien und abgeleitete Dimensionen | 80 |
| 4.7.3 | Arten von gemeinsamen Dimensionen | 81 |
| 4.7.3.1 | Vollständige Dimensionsteilung | 82 |
| 4.7.3.2 | Eingeschlossene Dimension | 83 |
| 4.7.3.3 | Partielle Dimensionsteilung | 83 |
| 5. | Umsetzung des multidimensionalen Datenmodells | 85 |
| 5.1 | Abbildung des multidimensionalen Modells auf das relationale Modell | 85 |
| 5.1.1 | Abbildung von Fakttypen | 86 |
| 5.1.2 | Abbildung von Dimensionshierarchien | 87 |
| 5.1.3 | Auflösung der Dualität zwischen Fakten und Dimensionen | 88 |
| 5.1.4 | Abbildung von generalisierten Fakttypen | 88 |
| 5.2 | Datenimport | 89 |
| 6. | Business Intelligence Suite Pentaho | 91 |
| 6.1 | Einleitung | 91 |
| 6.2 | Modularer Aufbau und Anwendungsbereiche von Pentaho | 91 |
| 6.3 | Komponenten von Pentaho | 92 |
| 6.3.1 | BI-Plattform und Action Sequenzen | 93 |
| 6.3.2 | Pentaho BI-Server und dessen Architektur | 93 |
| 6.3.3 | Data Mining (WEKA) | 94 |
| 6.3.4 | Pentaho Data Integration (alias KETTLE) | 95 |
| 6.3.5 | Pentaho Dashboards | 96 |
| 6.3.6 | Reporting (JfreeReport) | 96 |
| 6.4 | Datenanalyse mit Pentaho | 97 |
| 6.4.1 | OLAP-Server Mondrian | 97 |
| 6.4.2 | JPivot OLAP-Frontend | 98 |
| 6.4.3 | Architektur des Analysemoduls von Pentaho | 99 |
| 6.5 | Konfigurationsdatei Mondrian Schema | 101 |
| 6.6 | Modellierungstool Cube Designer und Schema Workbench | 105 |
| 6.7 | Der Weg zur Pentaho-Lösung | 107 |
| 6.7.1 | Systemumgebung | 107 |
| 6.7.2 | Vorbereitung Pentaho PCI / PostgreSQL | 107 |
| 6.7.3 | Entwicklung einer Pentaho Solution mit dem Cube Designer | 108 |
| 6.7.3.1 | Verbindung zur relationalen Datenbank | 108 |
| 6.7.3.2 | Definition der Kennzahlen | 109 |
| 6.7.3.3 | Definition analytischer Dimensionen und Hierarchien | 109 |
| 6.7.3.4 | Veröffentlichung des Schemas für den Pentaho Server | 110 |
| 6.8 | Probleme mit dem Mondrian Server und dem Cube Designer | 111 |
| 7. | Anwendungsfälle | 113 |
| 7.1 | Verlauf einer bestimmten Operation nachvollziehen | 113 |
| 7.2 | Vergleich bestimmter Kennzahlen verschiedener Operationen | 114 |
| 7.3 | Analyse der Nutzungsarten bestimmter Instrumente | 116 |
| 7.4 | Erfassung mehrerer Workflows zur Qualitätssicherung | 118 |
| 8. | Zusammenfassung und Ausblick | 120 |
| 9. | Literaturverzeichnis | 122 |
| 10. | Anhang: Administration von Pentaho | 128 |
Textprobe:
Business Intelligence Suite Pentaho:
Die Pentaho Corporation ist Hauptsponsor des Pentaho BI Projektes, einer fortlaufenden Initiative der Open Source Community. Dabei handelt es sich um eine kommerzielle Open Source (OS) Alternative für Business Intelligence, die 2002 von ehemaligen Managern und Brachenkennern aus dem BI-Umfeld in Orlando, Florida (USA), gegründet wurde. Mit der Pentaho Open BI Suite bietet sie ein breites Spektrum an OS Anwendungen bzw. Funktionalitäten, wie z.B. ein umfassendes Reporting, einen OLAP-Server, ein Tool zur Datenintegration, eine Data Mining Engine, Dashboarding, die BI-Plattform selbst als deren Basis, sowie zahlreiche weitere Tools zur Unterstützung des Anwenders. Pentaho ist die weltweit führende und am weitesten verbreitete OS BI Suite und gehört zu den 100 OS Projekten mit den meisten Downloads. Das Geschäftsmodell von Pentaho beinhaltet parallel zur kostenlosen eine kommerzielle Version, welche gegen ein jährliches Abonnement neben Produkterweiterungen auch Support, Schulungen, Zertifizierungen und weitere Kundenunterstützung (Beratung) bietet. Zudem bestehen Partnerschaften mit verschiedenen Softwarehäusern. Pentaho ist nicht von sich aus gewachsen, sondern vereint unter dem gemeinsamen Dach der Pentaho BI Suite neben Eigenentwicklungen hauptsächlich bereits bestehende OS Projekte durch deren Sponsoring bzw. Zukauf.
Im nachfolgenden Abschnitt wird der logische Aufbau der Pentaho Open BI Suite und die darin enthaltenen Module bzw. Anwendungen gezeigt.
Modularer Aufbau und Anwendungsbereiche von Pentaho:
Durch den modularen Aufbau und der offenen Architektur der Pentaho BI Suite ist es möglich, die jeweiligen Module, welche wiederum aus einzelnen Komponenten bestehen, separat als Stand-Alone-Anwendungen zu nutzen oder auch in externe Anwendungen zu integrieren. Kommen die einzelnen Komponenten gemeinsam in der Pentaho BI Suite zum Einsatz, werden die jeweiligen Engines der entsprechenden Module mit dem Pentaho BI-Server gekoppelt. Abbildung 6-1 zeigt die wesentlichen Anwendungsgebiete (vgl. Rubrik Products in der Pentaho Open BI Suite.
Als Datenbasis kann Pentaho neben den gängigen JDBC-fähigen RDBMS (wie z.B. Oracle, DB2, MS SQL Server, PostgreSQL u.a.) auch Daten nutzen, die im XML-Format zur Verfügung stehen. Des Weiteren besteht die Möglichkeit, eine Verbindung zu Daten des OLAP-Cubes über einen MDX-Abfragestring herzustellen. Zur Datenintegration stellt Pentaho das ETL-Tool Pentaho Data Integration (PDI) zur Verfügung, welches aus dem OS Projekt KETTLE hervorging und zur Aufgabe hat, Daten aus unterschiedlichen Quellen zu extrahieren, in ein bestimmtes Format zu transformieren und diese dann in das DWH zu laden. Zudem ermöglicht es den Einsatz in Enterprise Information Integration (EII) Szenarien. Pentaho verfügt über einen Metadaten-Layer, welcher nach den Vorgaben des Common Warehouse Model (CWM) umgesetzt wird und auf deren Basis eine logische Sicht auf die Zugriffsebene der Datenbank besteht. Da hierüber das Business-Modell realisiert ist, profitiert der Anwender in mehrfacher Weise, wie z.B. durch die Verwendung von benutzerfreundlichen Begriffen anstelle der Tabellen- u. Spaltennamen der Datenbanken, einer zentralen Definition von Formatierungen oder einem reduzierten Aufwand (infolge der Kapselung des Business-Modells und den relationalen Datenbank-Strukturen) bei Schema-Änderungen der Datenbank.
Kern der BI Suite ist die BI-Plattform, die den zentralen Zugriffspunkt der Plattform darstellt. Dabei stehen dem Administrator über eine Webanwendung verschiedene Zugriffspunkte zur Verfügung. Hierzu zählen z.B. die Umsetzung von Security-Maßnahmen, die Administration der Module, die Verwaltung der Caches der verschiedenen Komponenten oder auch die Pflege des Repositories. Die BI-Plattform übernimmt auch die Ausführung der sogenannten Action Sequences. Dabei handelt es sich um XML-Dateien, in welchen verschiedene Aktionen definiert werden. Auf diese Weise wird eine durchgängige Prozessorientierung von Pentaho realisiert und ermöglicht dadurch die Implementierung eines prozessorientierten BI-Systems.
Weitere Anwendungsbereiche, welche in den folgenden Abschnitten erläutert werden, ist neben den Bereichen Reporting und Dashboards auch der Bereich Analyse. Da das Analyse-Modul, insbesondere der OLAP-Bereich (und das zugehörige Modellierungstool Cube Designer) mit den Drill- und Explore-Funktionen sowie der graphischen Darstellung während der praktischen Umsetzung dieser Arbeit zum Einsatz kamen, widmet sich ein eigener Abschnitt dem Modul Analyse ausführlicher. Um die Ergebnisse der Analysen und Auswertungen auch darstellen bzw. weiterverarbeiten zu können, setzt die Präsentationsschicht auf die einzelnen Anwendungen auf. Der Präsentationsschicht sind z.B. Browser, Portale oder auch Web-Services zuzurechnen sowie die Möglichkeit, Ergebnisse via E-Mail weiterleiten zu können.
Komponenten von Pentaho:
Aus funktionaler Sicht lassen sich die einzelnen Komponenten verschiedenen Modulen zuordnen, die im Folgenden näher erläutert werden.
BI-Plattform und Action Sequenzen:
Die Basis der BI-Suite stellt die BI-Plattform dar. Diese besteht aus dem Pentaho BI-Server (wie im nächsten Abschnitt beschrieben) und dem Pentaho Design Studio. Der BI-Server stellt den Dreh- und Angelpunkt der gesamten Plattform dar und ist für die Ausführung der sogenannten Action Sequenzen verantwortlich, wobei es sich um die kleinste Einheit handelt, welche die Solution Engine verarbeiten kann. Diese werden in Form von XML-Dokumenten definiert und geben vor, wie Aktivitäten (z.B. Datenbankanfragen, Reportgenerierung, E-Mail-Aktionen) und in welcher Folge diese auszuführen sind. Der Datenfluss kann zwischen Aktivitäten innerhalb einer Action-Sequenz oder zwischen Ausführungen verschiedener Action-Sequenzen erfolgen. Action-Sequenzen definieren zunächst den zur Ausführung notwendigen Input, den auszuführenden Prozess selbst und den daraus resultierenden Output, welcher für weitere Action Sequenzen wiederum als Input dienen kann.
Das Pentaho Design Studio ist eine Eclipse-basierte Anwendung zum Definieren, Testen und Administrieren von Action Sequenzen. Es setzt sich aus einer Sammlung von Editoren, Viewern und Modulen zusammen und vereint diese in einer grafischen Oberfläche.
Pentaho BI-Server und dessen Architektur:
Mit dem Pentaho BI-Server wird eine J2EE-kompatible Webanwendung angeboten, welche auf verschiedenen Applikationsservern (wie z.B. Tomcat bzw. JBoss; die PCI-Version hat den JBoss-Server vorinstalliert) lauffähig ist. Der Anwender hat über ein Web-Frontend Zugriff auf den Server, welcher auch über Webservices, Java- u. AJAX-Schnittstellen angesprochen werden kann.
Die Solution Engine stellt das Herz des BI-Servers dar. Sie verwaltet den Zugriff auf das Solution Repository und übernimmt zugleich die Steuerung und das Scheduling von Action Sequenzen. Eine Solution besteht aus mehreren Dokumenten und ist eine logische Gruppierung von Action Sequenzen und den zugehörigen Ressourcen. Zur Erzeugung der Solution stellt Pentaho Tools, wie z.B. den Cube Designer, zur Verfügung. Auf diese Solution erfolgt auf Dateiebene kein direkter Zugriff von der Solution Engine, sondern über das Solution Repository, in welche die Solution zuvor geladen wird. Während der Ausführung der Action Sequenzen wird aufdie entsprechenden Server Engines der jeweiligen Module zugegriffen. Im Runtime Repository speichert der BI-Server Ergebnisse, während im Audit Repository die Aktivitäten in einem Audit-Log aufgezeichnet werden. Das Berechtigungskonzept ermöglicht die Vergabe von Zugriffsrechten auf der Ebene von Verzeichnissen sowie auf Action Sequenzen.
48,00 €
PDF-eBook Download: 48,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836633291
Arbeit zitieren:
Röger, Matthias September 2008: Konzeption und Realisierung eines Data Warehouses zur Analyse chirurgischer Workflows, Hamburg: Diplomica Verlag
Schlagworte:
Data Warehouse, Business Process Intelligence, Workflow-Analyse, OLAP, Business Intelligence Plattform



