Marktübersicht der Open Source Business Intelligence Systeme
- Art: Projektarbeit
- Autor: Sören Stuckenbrock
- Abgabedatum: September 2009
- Umfang: 44 Seiten
- Dateigröße: 649,4 KB
- Note: 1,0
- Institution / Hochschule: AKAD Fachhochschule Pinneberg Deutschland
- Bibliografie: ca. 20
- ISBN (eBook): 978-3-8366-3648-3
- Sprache: Deutsch
- Prämierung:
- Arbeit zitieren: Stuckenbrock, Sören September 2009: Marktübersicht der Open Source Business Intelligence Systeme, Hamburg: Diplomica Verlag
- Schlagworte: Produktrecherche, Produktvergleich, Data Mining Software, Datenbereitstellung, Wirtschaftsinformatik
28,00 €
PDF-eBook Download: 28,00 €
Projektarbeit von Sören Stuckenbrock
Einleitung:
1.1 Problembereich:
Vor dem Hintergrund der an Dynamik gewinnenden Märkte ist Information heute in vielen Bereichen zur wichtigen unternehmerischen Ressource avanciert. Ansätze, das Management durch Informationstechnologie (IT) bei der Entscheidungsfindung zu unterstützen, gibt es bereits seit den sechziger Jahren des zwanzigsten Jahrhunderts. Der aktuelle Entwicklungsstand dieser Systemgattung der Datenverarbeitung wird als Business Intelligence (BI) bezeichnet.
Große Anteile des Marktes für BI-Systeme sind auf die Lösungen der führenden Softwarehersteller verteilt. Beschaffung und Einführung derartiger Produkte sind in der Regel jedoch mit hohen Kosten verbunden, was deren Attraktivität für kleine und mittlere Unternehmen (KMU) negativ beeinträchtigt.
Für KMU kann hingegen ein anderes Segment des BI-Marktes von Interesse sein:
das Segment der Open Source Software (OSS).
Denn obwohl Open Source Software nicht zwangsweise kostenlos sein muss, ist dies dennoch häufig der Fall. Und obwohl durchaus weitere Gründe für den Einsatz von OSS sprechen, stellen Kostenaspekte in den Unternehmen derzeit das Hauptargument hierfür dar.
Hinsichtlich der Informationsbeschaffung auf der Kundenseite stellt der OSSMarkt jedoch recht hohe Anforderungen an Interessenten und potenzielle Nutzer. Schließlich stehen hinter vielen Open Source Projekten keine Firmen mit hohen Marketingetats, welche die Informationen zu ihren Produkten aufbereiten und aktiv an den Kunden herantragen. Der Interessent muss stattdessen selber aktiv werden und nach Open Source Lösungen, welche zur Bewältigung seiner individuellen Problemstellung beitragen können, recherchieren.
Die Durchführung einer Produktrecherche im Marktsegment der Open Source Business Intelligence Systeme (im Weiteren auch als OSBI-Systeme abgekürzt) sowie die Dokumentation der Ergebnisse sind Gegenstand des vorliegenden Projektberichts.
1.2 Ziele der Untersuchung und Vorgehensweise:
Die vorliegende Arbeit soll eine Dokumentation der für den Unternehmenseinsatz relevanten Informationen über die derzeit am Markt verfügbaren Open Source Business Intelligence Systeme ergeben.
Zunächst muss demnach eine klare Abgrenzung erfolgen, welche Produkte diesem Markt zuzuordnen sind und somit einer Erwähnung bedürfen. Ob ein Softwareprodukt als Open Source Software bezeichnet werden kann, wird in der vorliegenden Arbeit daran festgemacht, ob es einem von der Open Source Initiative anerkannten Lizenzmodell unterliegt. Desweiteren wird davon ausgegangen, dass eine Anwendung nur dann dem Business Intelligence Segment zuzurechnen ist, wenn Sie sich in das BI-Referenzmodell einordnen lässt.
Eine Ausnahme wird jedoch im Hinblick auf relationale Datenbankmanagementsysteme (RDBMS) gemacht. Obwohl diese meist integraler Bestandteil von BI-Lösungen sind, sollen sie in der Ausarbeitung nicht betrachtet werden. Zum einen sind sie nicht speziell für den Einsatz in BI-Szenarien gedacht, zum anderen sind die prominenten Vertreter der Open Source RDBMS (MySQL, PostgreSQL) heute so verbreitet, dass der Informationsbedarf hierzu gesättigt ist.
Nachdem geklärt ist, welche Kriterien eine Software erfüllen muss, um für eine Betrachtung im Rahmen der vorliegenden Ausarbeitung in Frage zu kommen, ist zu erörtern, welche Eigenschaften der Produkte für den Einsatz im Unternehmen von Bedeutung sind. Dieser Fragestellung wird in Abschnitt 2.2 nachgegangen.
Die Recherche nach relevanten Produkten erfolgt schließlich über Fachliteratur und einschlägige Suchanfragen bei den gängigen Internet-Suchmaschinen.
Abschließend sei erwähnt, dass das Ergebnis des vorliegenden Projektberichts keine Evaluation von OSBI-Systemen darstellt. Es wird kein Vergleich der Systeme im Hinblick auf die Eignung für unternehmensindividuelle Einsatzszenarien durchgeführt, denn bei der Entwicklung eines Vorgehensmodells zur Evaluation von OSBI-Systemen müssten auch Unternehmensparameter berücksichtigt werden.
1.3 Aufbau der Arbeit:
In Kapitel 2 werden Grundlagen behandelt, welche für das Verständnis der weiteren Ausarbeitung erforderlich sind. So wird in Abschnitt 2.1 ein theoretisches Modell für Business Intelligence-Lösungen erläutert und begründet, weshalb die Einordnung der Applikationen innerhalb dieses Modells von Bedeutung ist. In Abschnitt 2.2 wird erläutert und begründet, welche Eigenschaften der betrachteten Softwaregattung aus Unternehmenssicht relevant sind.
Im 3. Kapitel werden die recherchierten Produkte vorgestellt. Hierbei wird den als wichtig erachteten Produkten jeweils ein eigener kurzer Abschnitt gewidmet.
In den Übersichtstabellen werden die Profile aller ermittelten Produkte verglichen.
Die vorliegende Arbeit endet in Kapitel 4 mit einer kritischen Reflexion der Vorgehensweise und einer Einschätzung der zukünftigen Entwicklung des Open Source Business Intelligence Marktes.
Inhaltsverzeichnis:
| Abbildungsverzeichnis | IV | |
| Tabellenverzeichnis | V | |
| Abkürzungsverzeichnis | VI | |
| 1. | Einleitung | 1 |
| 1.1 | Problembereich | 1 |
| 1.2 | Ziele der Untersuchung und Vorgehensweise | 2 |
| 1.3 | Aufbau der Arbeit | 3 |
| 2. | Grundlagen | 4 |
| 2.1 | Business Intelligence Referenzmodell | 4 |
| 2.1.1 | Definition | 4 |
| 2.1.2 | Datenbereitstellung | 5 |
| 2.1.3 | Informationsgenerierung und –speicherung | 6 |
| 2.1.4 | Informationszugriff | 6 |
| 2.2 | Betrachtete Eigenschaften der ermittelten Softwaresysteme | 7 |
| 2.2.1 | Einsatzbereich und Funktionsumfang | 7 |
| 2.2.2 | Reifegrad | 8 |
| 2.2.3 | Lizenzbedingungen und –kosten | 9 |
| 2.2.4 | Aktivität der Community | 10 |
| 2.2.5 | Professioneller Support und Gewährleistung | 10 |
| 2.2.6 | Entwicklungsprognose | 10 |
| 2.2.7 | Darstellung der Bewertungskausalität | 11 |
| 3. | Vorstellung der Produkte | 12 |
| 3.1 | Vorbemerkung | 12 |
| 3.2 | ETL Software | 12 |
| 3.2.1 | Apatar | 12 |
| 3.2.2 | CloverETL | 12 |
| 3.2.3 | JasperETL / Talend Open Studio | 13 |
| 3.2.4 | KETL | 13 |
| 3.2.5 | Kettle / Pentaho Data Integration | 14 |
| 3.2.6 | Palo ETL Server | 14 |
| 3.2.7 | Weitere ETL-Tools | 15 |
| 3.2.8 | Tabellarische Übersicht | 15 |
| 3.3 | OLAP Software | 15 |
| 3.3.1 | JasperAnalysis | 15 |
| 3.3.2 | Mondrian / jPivot / Pentaho Analysis | 17 |
| 3.3.3 | Palo OLAP Server | 17 |
| 3.3.4 | Weitere OLAP-Tools | 18 |
| 3.3.5 | Tabellarische Übersicht | 19 |
| 3.4 | Reporting Software | 19 |
| 3.4.1 | BIRT | 19 |
| 3.4.2 | JasperReports | 21 |
| 3.4.3 | Palo Worksheet Server | 21 |
| 3.4.4 | Pentaho Reporting | 21 |
| 3.4.5 | Weitere Reporting-Tools | 22 |
| 3.4.6 | Tabellarische Übersicht | 23 |
| 3.5 | Data Mining Software | 23 |
| 3.5.1 | KNIME | 23 |
| 3.5.2 | WEKA | 23 |
| 3.5.3 | RapidMiner | 25 |
| 3.5.4 | Weitere Data Mining-Tools | 25 |
| 3.5.5 | Tabellarische Übersicht | 26 |
| 3.6 | Business Intelligence Software Suiten | 26 |
| 3.6.1 | Jasper BI Suite | 26 |
| 3.6.2 | Palo BI Suite | 28 |
| 3.6.3 | Pentaho BI Suite | 29 |
| 3.6.4 | SpagoBI | 29 |
| 3.6.5 | BEE | 30 |
| 3.6.6 | Tabellarische Übersicht | 30 |
| 3.7 | Open Source Business Intelligence Landkarte | 32 |
| 4. | Schluss | 33 |
| 4.1 | Kritische Würdigung der Vorgehensweise | 33 |
| 4.2 | Fazit und Ausblick | 33 |
| Literaturverzeichnis | VII | |
| An h a n g | ||
| A | Weiterführende Informationen zu den Softwareprodukten | IX |
| A.1 | ETL Software | IX |
| A.2 | OLAP Software | X |
| A.3 | Reporting Software | X |
| A.4 | Data Mining Software | XI |
| A.5 | Business Intelligence Software Suiten | XI |
Textprobe:
Kapitel 3.3, OLAP Software:
3.3.1 JasperAnalysis:
Die OLAP-Komponente der Jasper BI Suite basiert auf den Projekten Mondrian und jPivot, welche in Abschnitt 3.3.2 genauer beschrieben werden. Sie erweitert diese im Hinblick auf die Integration in den Jasper BI-Softwarestack.
So lassen sich die in JasperAnalysis definierten OLAP-Cubes als Datenquellen in JasperServer-Reports verwenden. Die Metadaten zur Beschreibung der mehrdimensionalen Analysemodelle können im zentralen Metadaten-Repository des JasperServers abgelegt und verwaltet werden. Desweiteren kann auf die zentralen Authentisierungs- und Autorisierungsmechanismen des JasperServers zurückgegriffen werden.
Zur Definition und zum Testen der Mondrian OLAP-Schemata existiert mit der JasperAnalysis Workbench ein grafisches Desktop-Tool, welches auch den direkten Upload der Schemata in das JasperServer-Repository ermöglicht.
Jaspersoft bietet ein kostenpflichtiges Add-On an, welches es ermöglicht, JasperAnalysis als Datenquelle für Pivot-Tabellen in Excel zu verwenden.
3.3.2 Mondrian / jPivot / Pentaho Analysis:
Mondrian ist eine relationale OLAP (ROLAP)-Engine, deren Entwicklung primär im Rahmen der Pentaho BI-Suite vorangetrieben wird. Dementsprechend bildet sie auch die Basis für deren OLAP-Komponente. Die Schemata der OLAP-Würfel werden bei Mondrian in XML-Dateien definiert. Bei einem solchen Schema handelt es sich um die Beschreibung der Abbildung des multidimensionalen Datenmodells auf die Tabellen eines relationalen (Star-)Schemas. Pentaho bietet ein grafisches Tool zur Erstellung von Mondrian-Schemata an.
Mondrian nimmt in den Quasi-Industriestandards Multidimensional Expressions (MDX) oder XML for Analysis (XMLA) formulierte OLAP-Queries entgegen, generiert daraus SQL-Statements und setzt diese gegen die unterliegende relationale Datenbank ab. Ein kostenpflichtiges Add-On ermöglicht es, Mondrian als Datenquelle für Pivot-Tabellen in Excel zu verwenden.
Mit jPivot existiert eine Java-API zur Erzeugung webbasierter Pivot-Tabellen, mit welcher sich OLAP-Webanwendungen entwickeln lassen. jPivot generiert anhand der Aktionen, welche der Benutzer auf der Weboberfläche ausführt, MDX oder XMLA Queries und setzt diese gegen Mondrian oder einen anderen OLAP-Server ab, der diese Abfragesprachen beherrscht.
3.3.3 Palo OLAP Server:
Der Palo OLAP Server ist die OLAP-Komponente der Palo BI Suite des deutschen Anbieters Jedox. Im Gegensatz zu Mondrian handelt es sich dabei um einen MOLAP-Server, der zudem komplett speicherbasiert ist. Während OLAP-Anfragen auf kleine und mittlere Datenbestände dadurch architekturbedingt sehr performant sind, ist die maximale Größe der OLAP-Cubes jedoch durch den Hauptspeicher des Servers limitiert.
Cubes können bei Palo OLAP über ein grafisches Desktop-Tool beschrieben werden. Die Integration in Excel ist bei Palo besonders fortgeschritten. So kann der OLAP-Server nicht nur als Datenquelle für Excel Pivot-Tabellen fungieren (ein entsprechendes Plugin hierfür ist kostenlos erhältlich), sondern es können über Excel auch einzelne Zellwerte in den MOLAP-Cubes verändert werden. Darüber hinaus existiert ein Adapter für die Tabellenkalkulation der freien Office-Suite OpenOffice, welcher von der Technischen Universität Chemnitz entwickelt wird.
Der Fokus von Palo OLAP liegt eindeutig auf der engen Integration mit Office-Software. Mittlerweile kann der Server jedoch auch MDX-Queries und XMLA-Anfragen verarbeiten. Damit steht der Anbindung von beliebigen OLAP-Clients, welche diese Schnittstellen unterstützen, nichts mehr im Weg.
3.3.4 Weitere OLAP-Tools:
REX ist ein als Java-Desktop-Applikation implementierter OLAP-Client, welcher die Abfragesprachen MDX und XMLA unterstützt.
pocOLAP ist eine webbasierte OLAP-Lösung mit integriertem Datenbank-Backend. Sie stellt Pivot-Tabellen im Web bereit. Eine klare Trennung zwischen OLAP-Server und -Client ist nicht ersichtlich. MDX und XMLA werden offensichtlich nicht unterstützt. Das Datenbank-Backend (Hypersonic SQL) ist vollständig in Java implementiert. Ein JDBC-Treiber ist verfügbar, womit der Befüllung via JDBC-kompatibler ETL-Software nichts im Wege stehen sollte.
Bei HydraCube handelt es sich um eine MOLAP-Engine, die für den verteilten Clusterbetrieb ausgelegt ist. Sie unterstützt MDX als Abfragesprache. Die Versionsnummer 0.2 lässt jedoch auf eine sehr frühe Version schließen und die Entwicklung dieses Projekts scheint seit einigen Jahren still zu stehen. Desweiteren unterliegt HydraCube einer Lizenz, die nicht explizit von der Open Source Initiative anerkannt ist.
Auch Cubulus ist eine OLAP-Engine, allerdings nach relationalem Modell. Sie ist in Python implementiert, enthält eine Weboberfläche und beherrscht eine Teilmenge der MDX-Syntax. Wie bei HydraCude scheint die Entwicklung von Cubulus nicht weiterverfolgt zu werden.
Der OlapNavigator ist ein OLAP-Webfrontend. Er unterstützt MDX-Abfragen und besitzt ein Exportmodul für Excel-Dateien. Die Releasezyklen scheinen recht lang zu sein und die aktuelle Version ist ebenfalls bereits ein dreiviertel Jahr alt.
FreeAnalysis besteht aus drei Komponenten: einem OLAP-Desktop-Client, einem OLAP-Web-Client und einem Schema-Designer für Mondrian-Schemata, letzterer ist ebenfalls eine Desktop-Applikation. Die beiden Clients beherrschen MDX und XMLA. Das letzte Release ist zirka zwei Jahre alt und FreeAnalysis unterliegt keiner von der Open Source Initiative anerkannten Lizenz.
Bei OpenOLAP for MySQL/PostgreSQL scheint es sich um OLAP-Engines inklusive entsprechender Clients zu handeln, welche auf der jeweiligen im Namen enthaltenen Datenbank aufsetzen. Genau lässt sich dies unter vertretbarem Aufwand leider nicht verifizieren, da die ansonsten sehr ausführlich erscheinende Dokumentation größtenteils in japanischer Sprache verfasst ist. Die letzten Releases beider Projekte sind bereits über drei Jahre alt.
28,00 €
PDF-eBook Download: 28,00 €
Link zur Arbeit:
http://www.diplom.de/ean/9783836636483
Arbeit zitieren:
Stuckenbrock, Sören September 2009: Marktübersicht der Open Source Business Intelligence Systeme, Hamburg: Diplomica Verlag
Schlagworte:
Produktrecherche, Produktvergleich, Data Mining Software, Datenbereitstellung, Wirtschaftsinformatik




