Whitepaper

Open Source Business Intelligence Ein Vergleich der Open Source BILösungen Jaspersoft, Palo und Pentaho

©

it-novum GmbH

Whitepaper

Open Source Business Intelligence

Kurzfassung Kurzfassung Es gibt verschiedene Open Source-Lösungen für Business Intelligence auf dem Markt. Dieses Dokument stellt drei besonders ausgereifte Vertreter vor: Pentaho, JasperSoft und Palo. Verglichen werden die Funktionen sowohl der Community Version als auch der jeweiligen kostenpflichtigen Version. Ziel des Produktvergleichs ist es, dem Anwender die Auswahl der richtigen Business Intelligence-Software zu erleichtern.

Fragen, Anmerkungen, Kritik Sie haben Fragen zum vorliegenden Dokument, Anmerkungen, Kritik? Dann schreiben Sie uns an [email protected]

Webinar Wir bieten regelmäßig Webinare zu Jedox und Pentaho an. Bei Interesse schreiben Sie an [email protected]

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

2

Whitepaper

Open Source Business Intelligence

Inhalt

1

Einleitung: Open Source Software im Bereich Business Intelligence 4

2

Business Intelligence ................................................................ 8

3

Anbieter von Open Source Business Intelligence ................ 19

4

Gesamtbetrachtung................................................................ 46

5

Weitere Downloads und Kontakte ....................................... 49

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

3

Open Source Business Intelligence

Whitepaper

1 Einleitung: Open Source Software im Bereich Business Intelligence Kennen Sie die Situation, dass für die Bereitstellung von Berichten immer die IT-Abteilung

herangezogen

wird

oder

die

Auswertung

von

Geschäftskennzahlen sehr zeitaufwändig und kostenintensiv ist? Bei Besprechungen werden Reports mit unterschiedlichen Datenbeständen herangezogen; zudem sind viele Datenbestände über mehrere Datenquellen und Systeme verteilt. Solche Situationen erschweren es, aussagekräftige Berichte zu erstellen und die dazugehörigen Daten zu analysieren. Doch gerade Geschäftsdaten sind meistens die Grundlage für unternehmerische Entscheidungen von großer Tragweite. Früher waren Begrifflichkeiten wie „IT-basierte Managementunterstützung“, „Management Support Systeme“ oder „Management-Informationssysteme“ weit verbreitet und wurden eingesetzt, um Führungskräfte in ihrer Tätigkeit zu unterstützen. Heute hat sich der Begriff „Business Intelligence“ (BI) durchgesetzt. Business Intelligence Business Intelligence ist heute ein wichtiges Anwendungsfeld im Umfeld betriebswirtschaftlicher Applikationen. BI umfasst die Methoden, mit denen die Daten eines Unternehmens aufbereitet und strukturiert ausgewertet werden

können.

Die

eigentlichen

Anwendungen

sind

vielfältig:

Kennzahlensysteme und Balanced Scorecards, Konsolidierung, Reporting, Management-Dashboards, Ursachenanalyse, Datenkorrelation etc. BI hat in den letzten Jahren nicht ohne Grund so ein großes Marktinteresse erfahren. Auslöser waren z.B. ungeeignete Reporting- und AnalyseFunktionalitäten von anderen (insbesondere ERP-) Systemen, die diese Anforderungen nur mit viel Mühe und Aufwand umsetzen konnten, die Notwendigkeit, Daten aus mehreren (oft unterschiedlichen) Vorsystemen zu konsolidieren, um einen

umfassenden Überblick

zu gewinnen (z.B.

Konzernreporting), oder schlicht die wirtschaftliche Situation als äußerer Druck zur Verbesserung der eigenen Organisation und Prozesse mit Hilfe besseren Zahlenmaterials. Ein wesentlicher Grund ist auch der Wunsch nach einem einfachen Zugriff auf Geschäftsdaten und Analysen über vertraute,

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

4

Whitepaper

Open Source Business Intelligence

nicht-technische Frontends wie Excel oder Portale, die auch Fachanwendern und nicht nur der IT das Arbeiten mit diesen Daten ermöglichen. Aufgeführt wurde oft auch die Entlastung der operativen Transaktionssysteme. Dieser Performancegrund ist aber durch die stetig günstigere und leistungsfähigere Hardware kaum noch relevant. Die Auswertung von unternehmerischem Zahlenmaterial geschieht durch analytische Informationssysteme, die auf einen konsolidierten Datenbestand (oftmals in Form sogenannter „Cubes“) zugreifen. .Je größer das Unternehmen ist, desto mehr Daten entstehen. Dazu kommt, dass auf Grund von heterogenen integriert

IT-Landschaften

werden

müssen.

Daten Das

aus

stellt

verschiedenen nicht

nur

Vorsystemen

hohe

technische

Anforderungen, sondern auch semantische, z.B. die Normierung von Daten (Euro und Dollar in einem globalen Umsatzreport). Natürlich sind diese Daten ohne eine entsprechende Aufbereitung nicht wirklich nützlich für die Unternehmensführung. Werden sie aber unter Verwendung von BI-Systemen bearbeitet und verändert, bekommen sie einen Bezug zueinander und sind in Entscheidungsprozessen einsetzbar. BI-Systeme sind also mit wenigen Ausnahmen ein „Muss“ für alle Managementebenen. Entscheider erhalten dadurch einen einfachen Zugang zu Kennzahlen, Berichten und Scorecards und können selber Analysen mit zeitlicher

Betrachtung

(wie

z.B.

Drill-Down-Analysen)

durchführen.

Führungskräfte haben spezielle Anforderungen, die BI-Systeme gut erfüllen können: Schnelligkeit, Einfachheit der Nutzung, Gebrauchstauglichkeit für ITfremde Personen, Datenqualität, stetige Aktualität, Verlässlichkeit, Integrität und Konsistenz. Software-Lösungen für BI Kommerzielle Anbieter im Bereich Business Intelligence bieten vielfältige und integrierte Gesamtpakete. Sie unterscheiden sich im Leistungsumfang, der Benutzerfreundlichkeit und dem Preis. Ein eigenes Produktsegment stellt Open Source BI-Software dar. Sie basiert oft auf

einem

modularen

Aufbau:

Während

die

Gesamtlösung

Plattformcharakter hat, können ihre Bestandteile auch separat eingesetzt werden. Daneben gibt es eine Reihe von Open Source-Lösungen für einzelne Bereiche der Business Intelligence.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

5

Whitepaper

Open Source Business Intelligence

Open Source hat sich seit einiger Zeit auf dem Markt für Business Intelligence etabliert

und

stellt

auf

einigen

Anwendungsgebieten

eine

absolut

ernstzunehmende Konkurrenz zu den kommerziellen Lösungen dar. Es handelt sich dabei um Softwarepakete, die im Internet zum Download stehen. Sowohl das Programm an sich als auch der Quellcode können heruntergeladen werden. Neben den kostenlosen „Community“-Versionen gibt es inzwischen auch

kostenpflichtige

„Enterprise

Editionen“,

die

professionelle

Dienstleistungen (Support etc.) und mehr Funktionen bieten. Vorteile von Open Source Für eine Open Source BI-Lösung spricht nicht nur der Kostenaspekt. Klare Vorteile bringen auch die Unabhängigkeit von einem bestimmten Hersteller und eine größere Flexibilität und Integrationsfähigkeit in heterogene ITLandschaften dank der verwendeten offenen Technologien und Schnittstellen. Der Open Source-Diamant Die marktführenden Anbieter im Open Source-Bereich, von denen einige im Rahmen des vorliegenden Dokuments betrachtet werden, zeichnen sich durch bestimmte Eigenschaften aus. Für eine bildliche Darstellung dieser Eigenschaften und einen vereinfachten Vergleich mit den Charakteristika proprietärer Software haben wir das Modell eines Diamanten entwickelt. Es setzt die Aspekte Abhängigkeit, Funktionalität/Innovation, Flexibilität, Sicherheit und Kosten zueinander in Beziehung und hilft, Klarheit über die Vor- und Nachteile einer IT-Lösung zu gewinnen (siehe Abbildung 1).

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

6

Whitepaper

Open Source Business Intelligence

Abbildung 1: Der Open Source-Diamant

Der bekannteste Vorteil quelloffener Software ist der frei zugängliche Quellcode. Damit hat der Anwender grundsätzlich die Möglichkeit, selbst Erweiterungen am Code durchzuführen (ob das der Endanwender macht oder einen darauf spezialisierten Dienstleister beauftragt, ist in diesem Fall nicht ausschlaggebend) und diese anderen zur Verfügung zu stellen. Ein weiterer Vorteil der strukturellen Transparenz von Open Source-Software ist ein umfassenderer und gründlicherer Innovationszyklus, weil die Anwender entscheidenden Einfluss auf die Weiterentwicklung haben. Proprietäre Software ist dagegen von einem Hersteller abhängig und kann vom Anwender weder editiert noch ergänzt oder verbessert werden. Das beschränkt ihr Innovationspotenzial auf die Weiterentwicklungsressourcen und -bereitschaft des Produzenten. Die weiteren im Open Source-Diamanten beschriebenen Eigenschaften werden

auf

unserer

Website

www.it-

novum.com/opensource_diamant_4629.html näher erläutert.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

7

Whitepaper

Open Source Business Intelligence

2 Business Intelligence Der Begriff „Business Intelligence“ wurde Mitte der neunziger Jahre zum ersten Mal vom Analystenhaus Gartner verwendet. Er umschreibt die Bereitstellung und Analyse von Daten mit dem Ziel, Führungskräfte in ihrer Tätigkeit zu unterstützen. Business Intelligence hilft beim Umgang mit Problemstellungen wie dem richtigen Aufeinanderbeziehen von Daten aus unstrukturiert abgelegten Datenquellen, um sie danach zur Beschreibung und Analyse unternehmerischer Zustände heranzuziehen. Business Intelligence stellt verschiedene Methoden und spezialisierte Applikationen zur Verfügung, um interne und externe Daten zu sammeln, zusammenzuführen und auszuwerten. Den Rahmen dafür bilden im Wesentlichen drei Prozessstufen: 1)

Datenbeschaffung Die

benötigten

Daten

können

aus

einer

oder

mehreren

Ursprungsquellen herangezogen werden. Das kann ein ERP-System, eine Datenbank, eine Datei (z.B. eine Excel-Datei) u.a. sein. Die zur Datenbeschaffung eingesetzte BI-Funktionalität ist der ETL-Prozess (Extraction, Transformation, Loading).

2) Analytische Auswertung Die gewonnenen Daten werden mittels analytischer Verfahren verarbeitet. Hierbei handelt es sich entweder um eine einfache Ansammlung der Daten - mit Hilfe der Analysetechnik OLAP (Online Analytical

Processing)

-

oder

um

komplexe

statistische

Untersuchungen über die Data Mining-Methode erarbeitet.

3) Präsentationsfunktion Dem

Analyseschritt

folgt

die

Aufbereitung

der

Daten

zu

Präsentationszwecken in Form von Berichten (Reports). Sie werden entweder als pdf-Dokumente oder in Form von Dashboards auf dem Frontend von Portalen veröffentlicht. Nach Abschluss der drei Verarbeitungsphasen bieten die dargestellten Daten eine Hilfestellung bei der Entscheidungsfindung für Unternehmen, das sich so besser auf Chancen und Risiken einstellen und dementsprechend agieren kann.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

8

Whitepaper

Open Source Business Intelligence

Abbildung 2: Die Business Intelligence-Plattform (Schema)

2.1 ETL - Extraktion, Transformation, Laden Die Beschaffung der Daten setzt sich aus folgenden Schritten zusammen: •

Extraktion der Daten aus dem ERP-System, einer Datenbank, einer Datei oder aus anderen bestehenden Ursprungsquellen



Transformation

der

Daten,

um

sie

im

nächsten

Schritt

weiterverarbeiten zu können •

Laden der erzielten Daten in eine zentrale Datensammelstelle (Data Warehouse), um sie später für die verschiedenen Geschäftseinheiten zu trennen.

Der ETL-Prozess wandelt operative Daten in subjekt- bzw. themenorientierte Daten um. Dadurch können sie für die Entscheidungsfindung des Managements eingesetzt werden. Dieser Vorgang setzt sich aus mehreren Teilprozessen zusammen: Filterung, Harmonisierung, Aggregation und Anreicherung.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

9

Whitepaper

Open Source Business Intelligence

Filterung Die Filterungsschicht umfasst die Extraktions- und die Bereinigungsphase (data cleansing). Aus internen und externen Quellsystemen werden die benötigten Daten ausgewählt und zwischengespeichert. Bevor die Daten in das Data Warehouse geladen werden, werden sie vorerst in einer sogenannten „Staging Area“ gelagert (Extraktion). Anschließend erfolgt die Bereinigung der zwischengelagerten Daten von formellen und von inhaltlichen Mängeln. Harmonisierung Nach erfolgreicher Filterung der Daten folgt die Harmonisierungsschicht. Sie dient der Verknüpfung der gefilterten Daten. Dabei sind zwei Aspekte zu untersuchen,

die

syntaktische

Harmonisierung

und

die

betriebswirtschaftliche Harmonisierung. •

Syntaktische Synchronisierung Operative und externe Daten haben eine uneinheitliche Struktur und müssen syntaktisch harmonisiert werden. Das geschieht durch verschiedene Vorgänge: 1)

Abstimmung von Kodierungen: Daten können unterschiedlich kodiert sein, deshalb muss mit Hilfe von Zuordnungstabellen eine Wahl getroffen werden.

2)

Lösung des Synonym-Problems: Es existieren unterschiedlich benannte, aber den gleichen Inhalt enthaltende Spalten. Dieses Problem lässt sich durch die Einigung auf einen Spaltennamen beheben.

3)

Lösung des Homonym-Problems: Hier sind die Spaltennamen identisch, aber der Inhalt unterscheidet sich. Die Lösung ist die Vergabe von neuen Spaltennamen.

4) Bereinigung

von

Schlüsseldisharmonien:

Wenn

die

extrahierten und bereinigten Daten andere Primärschlüssel aufweisen als in der operativen Datenhaltung, werden künstliche Primärschlüssel erzeugt und die vorherigen Primärschlüssel als Fremdschlüssel mitgeführt. •

Betriebswirtschaftliche Harmonisierung

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

10

Whitepaper

Open Source Business Intelligence

Für

eine

optimale

Überführung

entscheidungsunterstützende

der

operativen

Datenbestände

Daten

muss

in die

betriebswirtschaftliche Harmonisierung durchgeführt werden. Sie gleicht die betriebswirtschaftlichen Kennziffern ab und legt die gewünschte Granularität (Detaillierungsgrad) der Daten fest: 1)

Abgleichung der betriebswirtschaftlichen Kennziffern: Die Daten werden betriebswirtschaftlich vereinheitlicht. Daten wie Währung müssen nach gebiets- und ressortspezifischen Kriterien in homogene Werte transformiert werden.

2)

Festlegung der gewünschten Granularität der dispositiven Daten: Je niedriger die Datengranularität, desto detaillierter sind

die

Daten.

Granularitäten

Im

Management

bevorzugt,

werden

weil

die

niedrige Analysen

dementsprechend detaillierter betrachtet werden können. Zur Festlegung des gewünschten Detaillierungsgrades sind weitere Transformationsregeln nötig. Aggregation Die

gefilterten

und

harmonisierten

Daten

werden

der

nächsten

Transformationsschicht übergeben. Diese Schicht befasst sich mit der Aggregation (Verdichtung, Ansammlung) der Daten. Es werden bestimmte Aggregationsalgorithmen angewendet, da ein bestimmter Granularitätsgrad nicht nötig ist. So werden in diesem Schritt Vorsummierungen getroffen, weil gewisse betriebswirtschaftliche Kennzahlen nur mit diesen berechnet werden können. Im Rahmen der Aggregation werden Dimensionshierarchietabellen entworfen. Dabei entstehen Elemente wie „Gesamt“ oder „Alle“, die die Summation der Einzeldaten enthalten. Anreicherung Hier werden die betriebswirtschaftlichen Kennzahlen berechnet und integriert. Dieser Prozess ist wichtig für Informationen, die von mehreren Endanwendern benutzt werden. Dabei werden verschiedene Kennzahlen für verschiedene Anwender errechnet. Beispielsweise ist für einen Produktmanager der

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

11

Whitepaper

Open Source Business Intelligence

wöchentliche Deckungsbeitrag auf Produktebene wichtig, ein Filialleiter hat dagegen mehr Interesse an den jährlichen Deckungsbeiträgen auf Filialebene. Nach den Transformationsprozessen sind die Daten so aufbereitet, dass sie in das Data Warehouse aufgenommen werden können. Dieser Prozess nennt sich Laden (Loading). Die Daten werden von der Staging Area in das Data Warehouse verschoben und stehen jetzt für analytische Zwecke zur Verfügung.

Abbildung 3: Normierung der Daten für die spätere betriebswirtschaftlich einheitliche Darstellung

2.2 Online Analytical Processing (OLAP) Die Technologien des „Online Analytical Processing“ (OLAP) bilden die Grundlage des Berichtswesens (Reporting). Dazu werden die im Data

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

12

Whitepaper

Open Source Business Intelligence

Warehouse eingelagerten Daten in einem sogenannten OLAP-Cube (Würfel) aufbereitet und zur Verfügung gestellt, sodass sich die Anwender die benötigten Daten herausziehen und anzeigen lassen können. Beim OLAP werden relationale Datenmodelle mit Hilfe von zweidimensionalen Tabellen abgebildet. Die eindeutige Identifikation der einzelnen Zeilen erfolgt über Primärschlüssel. Um eine engere Analyserichtung gewährleisten zu können, bedarf es multidimensionaler Datenräume. Diese werden mit Hilfe von Datenwürfeln (Cubes) verwirklicht. Die Struktur eines Cubes erlaubt die Abbildung mehrerer Dimensionen. Im Gegensatz dazu lässt sich ein normaler Würfel nur auf drei Dimensionen abbilden. Um Analysen im Sinne der Business Intelligence durchführen zu können, bedarf es mehrerer Ebenen bzw. Dimensionen. Zwei Gesichtspunkte kennzeichnen einen Cube: •

Fakten: Stehen im Mittelpunkt des Cubes und werden durch betriebswirtschaftliche Kennzahlen gebildet.



Dimensionen: Stellen die Ebenen dar, die bei der Analyse zum Einsatz kommen. Sie sind gleichzeitig die Achsen des Cubes.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

13

Whitepaper

Open Source Business Intelligence

D

Abbildung 4: Beispiel für einen Cube: Ein sogenannter Vertriebswürfel

i Die Erstellung eines Cubes ist verbunden mit einer gut durchdachten Aufbereitung der Daten. Die Daten müssen normiert vorliegen, um einen Cube erstellen zu können und durchlaufen zunächst Prozesse wie den ETLProzess, um in nächster Ebene als Tabelle in ein Data Warehouse integriert zu werden. Dimensionsebenen werden herausgegriffen und anhand dieser wird eine Faktentabelle erstellt, die die notwendigen Primärschlüssel der einzelnen Dimensionstabellen enthält. Dabei kann ein Cube mehr als nur drei Dimensionen enthalten. Die Faktentabelle umfasst zusätzlich zu den Primärschlüsseln der Dimensionstabellen auch Kennzahlen wie beispielsweise „Umsatz“

oder

„Gewinn“.

Diese

Kennzahlen

werden

innerhalb

der

Faktentabelle über die Dimensionen hinweg berechnet und im Cube gespeichert.

Cubes werden

hauptsächlich im

Controlling

eingesetzt.

So werden

beispielsweise einzelne Cubes für das Vertriebscontrolling erstellt, die einzelne Kennzahlen wie „Umsatz pro Jahr“ oder „Anzahl der Aufträge pro Kunde“ beinhalten. Diese Kennzahlen dienen gleichzeitig der strategischen Planung und Kontrolle des Unternehmens.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

14

Whitepaper

Open Source Business Intelligence

Mit Hilfe von Internet und Intranet hat der Anwender die Möglichkeit, sich die Tabellen bzw. Cubes über den Web-Browser anzeigen zu lassen, um daraus die Analysen zu konstruieren. Die Daten können daneben auch als Excel-Datei ausgegeben werden. In OLAP-Systemen sollen die Informationen aus verschiedenen Perspektiven und in verschiedenen Detaillierungsstufen veranschaulicht werden. Dazu dienen Funktionen wie Drill-Down, Drill-Up, Drill-Across, Dicing und Slicing (Abbildung 5). •

Drill-Down: Erlaubt eine detailliertere Betrachtung der Daten in vertikaler Richtung.



Drill-Up bzw. Roll-Up: Entspricht der nächsthöheren Verdichtungsebene und ist das Gegenteil des Drill-Down.



Drill-Across:

Erlaubt

das

Vertauschen

der

Dimensionen

untereinander. •

Dicing: Filtert bestimmte Attribute zur Betrachtung. Dadurch, dass alle anderen Attribute ausgeblendet werden, entsteht ein kleinerer Cube.



Slicing: Es wird nur eine Scheibe des Cubes berücksichtigt.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

15

Whitepaper

Open Source Business Intelligence

Es gibt verschiedene OLAP-Umsetzungskonzepte wie das R-OLAP (Relationales OLAP) und das M-OLAP (Multidimensionales OLAP). R-OLAP basiert auf Daten, die in einer relationalen Datenbank gespeichert sind. Dieses Konzept findet bei hohen Datenvolumen und großen Benutzerkreisen Anwendung. M-OLAP (Multidimensionales OLAP) arbeitet mit multidimensionalen Datenbanken. Dabei sind die abgespeicherten Daten transformiert und bilden von vornherein einen Würfel). Der Vorteil ist die schnellere Antwortzeit bei Datenabfragen. Abfragen auf multidimensionalen Datenstrukturen werden mit MDX-Anweisungen (Multidimensional Expressions) durchgeführt. 2.3 Data Mining Beim Data Mining handelt es sich um ein weiteres Analyseverfahren. Die existierende Datensammlung wird nach Zusammenhängen untersucht und die neu entdeckten Hypothesen festgehalten. Eingesetzt werden verschiedene Methoden der Statistik, der Mathematik und der Künstlichen Intelligenz: •

Entscheidungsbäume



Künstliche Neuronale Netze (KNN)



Clusterverfahren



Assoziationsanalyse

2.4 Reporting Das Reporting (deutsch: Berichtswesen) ist die Gesamtheit aller Methoden und Techniken für die betriebliche Berichterstattung. Dabei wird gerne in „Standard-Reporting” und „Ad-hoc-Reporting” unterschieden. Reports oder Berichte erleichtern Mitarbeitern die Erledigung ihrer Aufgaben und dienen dem Management als Informationsquelle. Um einen Bericht zu erstellen, müssen die folgenden Punkte festgelegt werden: der Berichtszweck, der

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

16

Whitepaper

Open Source Business Intelligence

Berichtsinhalt, Sender und Empfänger und sowie der Zeitpunkt der Berichterstattung. Aktive Berichtssysteme arbeiten selbstständig. Nachdem Form und Inhalt des Berichts einmal festgelegt sind, generieren sie automatisch die Reports und stellen sie dem Empfänger zu. Passive Berichtssysteme erzeugen Berichte nur auf Anfrage eines Benutzers. Ad-hoc-Berichtssysteme sind ein Teil der passiven Berichtssysteme. Im Bereich des Ad-hoc-Reportings ist der Endbenutzer jedoch nicht nur an der Berichtserzeugung, sondern auch an dessen Gestaltung beteiligt. Bereits der Name „ad hoc“ drückt aus, dass ein Bericht „aus dem Stegreif“ erstellt wird. Das

bedeutet,

dass

der

Anwender

während

der

Berichtserzeugung

selbstständig das Layout des gewünschten Reports festlegt. Eine solche interaktive

Zusammenstellung

der

Daten

bevorzugt

besonders

der

Anwenderkreis der Analytiker, wie beispielsweise die Controller. Ihnen reichen häufig die Informationen aus den Standardreports nicht aus. Sie benötigen die

Möglichkeit,

Daten

auf

Produktsegmente

oder

Einzelkunden

herunterzubrechen. Hier helfen die Ad-hoc-Analysen weiter. Ad-hoc-Berichte basieren ausschließlich auf multidimensionalen Daten, weil sich ihre Struktur optimal für derartige Auswertungen eignet. Ad-hoc-Analysen werden häufig in Tabellenkalkulationsprogrammen wie beispielsweise Microsoft Excel durchgeführt. Je nach zugrunde liegender Datenbank werden verschiedene Plugins für die Erstellung von Ad-hoc-Berichten angeboten. Häufig können die auszuwählenden Dimensionen einfach mit Drag-and-Drop selektiert werden. Ad-hoc-Berichte können ebenso wie Standardberichte in Form von Tabellen oder Diagrammen umgesetzt werden. Sie zeichnen sich durch eine sehr große Benutzerfreundlichkeit aus, weil schnelle Sichtänderungen auch vom unerfahrenen Anwender durchgeführt werden können. 2.5 Dashboards Die wichtigsten Kennzahlen eines Unternehmens werden gerne im sogenannten Dashboard auf einer einzigen Bildschirmseite präsentiert. Ein Dashboard ist eine Ansammlung von einzelnen Berichten, die wiederum aus Kennzahlen, Messpunkten oder Key Performance Indicators (KPIs) bestehen, wobei die Berichte aufeinander aufbauen. Es ähnelt dem Cockpit eines Piloten, weil die Daten durch Tachometer, Liniendiagramme, Ampeln, Landkarten und

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

17

Whitepaper

Open Source Business Intelligence

andere Darstellungen visualisiert werden. Das soll Entscheidungsträgern einen schnellen Blick auf die wichtigsten Unternehmensdaten ermöglichen. Dashboards zeichnen sich durch folgende Merkmale aus: •

Komprimierte Darstellung: Die benötigten Informationen werden in verdichteter

Form,

meist

auf

einer

einzigen

Bildschirmseite,

dargestellt, um den Übersichtscharakter zu betonen. Dazu werden geeignete Visualisierungstechniken verwendet. •

Konzentration auf wesentliche Informationen: Auf eine Überhäufung an

Detailinformationen

wird

verzichtet.

Auffällige

Visualisierungsmerkmale wie z.B. Ampeln werden eingesetzt, damit der Betrachter die Informationen schnell erfassen kann. •

Spezifische Lösung: Dashboards werden den Bedürfnissen des Endanwenders angepasst.

Key Performance Indicators (KPIs) sind Kennzahlen von besonders großer Bedeutung für unternehmerische Entscheidungen. Mit ihrer Hilfe wird gerne die Wirtschaftlichkeit eines Unternehmens durch einen Soll-Ist-Vergleich ermittelt. Sie sind deshalb ein wichtiges Hilfsmittel für Führungspersonen. Weil solche Kennzahlen für sich allein genommen keine Aussagekraft haben, werden sie dem Benutzer in Verbindung mit anderen Kennzahlen präsentiert. Zur visuellen Darstellung der KPIs dienen die Dashboards, die die Werte mit Hilfe der bereits erwähnten Ampeln, Tachometern oder Thermometern verdeutlichen. 2.6 Portale Portale bieten eine individuell angepasste Zugriffsmöglichkeit auf Inhalte und Applikationen. Durch ein Portal erhält der Anwender einen zentralen Zugang zu ausgewählten Themenbereichen sowie den zugehörigen Informationen und Diensten. Portale basieren auf Web-Technologien. Ihre Inhalte werden in Web-Browsern dargestellt. Das erfordert einen Web-Server, der die Nutzeranfragen (Requests) beantwortet, damit die benötigten Informationen in Form von Portlets dargestellt werden können. Portlets sind kleine Fenster auf der WebSeite eines Portals, die mit beliebigen Inhalten befüllt und innerhalb des Portalfensters verschoben werden können. Der Vorteil eines Portals ist, dass

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

18

Whitepaper

Open Source Business Intelligence

sich der Benutzer nur einmal am Portal anmelden muss, nach der Authentifizierung aber auf alle im Portal enthaltenen Anwendungen und Dienste Zugriff hat. In der Business Intelligence dienen Portale zur Darstellung von webbasierten Berichten und Dashboards. Das Portal fungiert innerhalb eines Unternehmens als zentraler „Point of Access“ auf unternehmerische Kennzahlen und deren Darstellung in Reports oder Dashboards. Der Benutzer meldet sich einmal am Portal an und kann dann auf die BI-Funktionalitäten im Portal zugreifen.

3 Anbieter von Open Source Business Intelligence Pentaho, JasperSoft und Jedox sind drei marktführende Anbieter von kommerzieller Open Source-Software für Business Intelligence. Ihre Produkte sind mittlerweile auf dem Markt gut etabliert, weshalb sie im Fokus des vorliegenden Dokuments stehen. Alle drei Anbieter unterscheiden in ihrer Produktpalette zwischen kostenpflichtigen Enterprise Edition-Versionen und einer Community-Version, die kostenlos zum Download zur Verfügung steht. Die Enterprise Edition-Versionen bieten meist mehr Funktionen als die Community-Versionen und eine Reihe von Dienstleistungen, die Support, Schulungen oder gar Consulting umfassen können. 3.1 Pentaho: Pentaho BI-Suite Pentaho ist neben JasperSoft der bekannteste Anbieter kommerzieller Open Source-Software. Pentaho entwickelt und vertreibt eine Business IntelligencePlattform,

die

Pentaho

BI-Suite.

Daneben

bietet

das

Unternehmen

kostenpflichtige Dienstleistungen wie professionellen Support an. Die Pentaho BI-Suite entstand 2002, als verschiedene Open Source-Projekte im Business Intelligence-Bereich wie JFreeReport, Kettle, Mondrian und Weka zu einer BI-Plattform zusammengefasst wurden. Die Pentaho BI-Suite hat einen modularen Aufbau. Die einzelnen Module entsprechen den BI-Funktionsbereichen ETL-Prozesse, OLAP-Analysen, Data Mining, Reporting und Dashboards. Sie können im Rahmen der Suite verwendet werden, es ist aber auch möglich, einzelne Komponenten alleine einzusetzen (Abbildung 6).

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

19

Whitepaper

Open Source Business Intelligence

Abbildung 6: Der modulare Aufbau der Pentaho-BI-Suite

Zur

Umsetzung

der

BI-Funktionalitäten

setzt

Pentaho

den

Java-

Applikationsserver Tomcat ein. Die Benutzeroberfläche (user console) und die administrative Sicht (administration console) sind Java-Webanwendungen. Die user console umfasst Beispielordner, kann aber um weitere Ordner ergänzt werden. Neue Berichte oder OLAP-Analysen können hier angelegt werden, für einen besseren Überblick lassen sich verschiedene Ordner mit Unterordnern erstellen und verwalten. Die administration console dient zur Benutzerverwaltung, der Vergabe von Berechtigungen und der Konfiguration von Datenbanken. 3.1.1 ETL: Pentaho Data Integration (Kettle) Das ETL-Tool von Pentaho heißt Pentaho Data Integration. Es ist aus dem sehr beliebten Open Source-Projekt Kettle hervorgegangen und wird auch als integrierter Bestandteil der Suite noch gerne Kettle genannt. Pentaho Data Integration unterliegt der LGPL-Lizenz. Der Einsatz ist sowohl mit Pentaho als auch als Standalone-Tool möglich. Aufbau

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

20

Whitepaper

Open Source Business Intelligence

Pentaho Data Integration besteht aus vier Einzelapplikationen: •

Spoon ist verantwortlich für die grafische Benutzerschnittstelle.



Pan ist zuständig für die Stapelverarbeitung von Transformationen.



Kitchen erledigt die Stapelverarbeitung von Job-Ketten.



Carte hat die Aufgabe, einen "Remote-Server" zu aktivieren, mit dem Spoon-Transformationen remote ausgelöst werden können.

Kettle basiert auf der Entwicklungsumgebung Eclipse und ist deshalb ähnlich strukturiert und mit Hilfe von Plugins erweiterbar. Neben freien existieren auch kostenpflichtige Plugins, wie z.B. ein SAP-Plugin mit dem Namen „ProERPconn", das den Datenaustausch mit SAP-Systemen ermöglicht.

Mit Kettle können entweder Transformationen oder Jobs angelegt werden. Transformationen umfassen den Import und Export der Daten. Jobs konzentrieren sich auf die Umsetzung von mehreren Transformationen und anderen Prozessen. Nutzung Die Entwicklungsumgebung von Kettle ist übersichtlich aufgebaut und unkompliziert zu bedienen. Per Mausklick können die „Steps" (einzelne Bestandteile) des Jobs bzw. der Transformation erzeugt werden. Die "Hops" sind die Verbindungspfeile zwischen den Steps (Abbildung 7). Der Datentransfer

von

bzw.

in

eine

Datenbank

erfordert

eine

Datenbankanbindung. Diese Anbindung wird einmalig im View-Fenster erstellt

und

kann

mehrmals

verwendet

werden.

Wenn

Kettle

im

Zusammenhang mit Pentaho verwendet wird, bietet Pentaho die Option, generierte Jobs in einer speziellen „administration console“ zu verwalten.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

21

Whitepaper

Open Source Business Intelligence

Erfahrungen und Einstufungen Vom Aufbau ausgehend ist Pentaho Data Integration sehr gut strukturiert, übersichtlich und unkompliziert in der Bedienung. Für die Gliederung der ETLElemente nach Anwendungsbereichen gibt es eine einheitliche Struktur. Kettle eignet sich daher gut für ETL-Einsteiger. Ebenfalls positiv ins Auge fallen die großen Erweiterungsmöglichkeiten durch die vielen Plugins. Für SAPAnwender gibt es ein eigenes Plugin für Kettle, den „ProERPconn“ des Pentaho-Partners proratio. Er ist ohne weiteres in die Umgebung implementierbar, allerdings kostenpflichtig. 3.1.2Pentaho Analysis Services (Mondrian) Die Pentaho Analysis Services bestehen im Wesentlichen aus dem Open Source-Projekt Mondrian. Sie setzen sich zusammen aus der SchemaWorkbench, der Mondrian-Webanwendung und dem Aggregation Designer. 3.1.2.1 Mondrian Schema-Workbench Die Mondrian Schema-Workbench wird sowohl von Pentaho als auch von Mitbewerber JasperSoft genutzt und ist für die Erstellung von MondrianSchemata basierend auf R-OLAP-Systemen geeignet. Ein Schema wird per Drag-and-Drop-Technik angefertigt und als XML-Datei abgespeichert. Wichtig ist dabei die Betrachtung von R-OLAP-Systemen, weil sich die SchemaWorkbench

auf

die

strukturierten

Tabellen

eines

Relationalen

Datenbankmanagement Systems bezieht. Zur Erstellung eines Schemas wird

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

22

Open Source Business Intelligence

Whitepaper

ein

Cube

definiert,

der

aus

einer

Faktentabelle

und

mehreren

Dimensionstabellen besteht. Aufbau Die Schema-Workbench umfasst Komponenten wie Cubes, die zugehörigen Dimensionen, Hierarchien, Levels oder Kennzahlen. Das Schema wird in einer Baumstruktur angezeigt. MDX-Abfragen können in einem Editor durchgeführt werden. Nutzung Über die Oberfläche kann der Anwender ein neues Schema bzw. eine neue MDX-Anweisung erstellen oder ein Vorhandenes öffnen. Sobald ein neues Schema erzeugt wird, muss eine Datenbankverbindung angegeben werden. Per Mausklick wird ein Cube generiert und die zugehörige Faktentabelle mit ihren Dimensionstabellen hinzugefügt. Es entsteht eine Baumstruktur, mit der weitere Elemente wie Kennzahlen oder Hierarchien einfach angelegt werden können. Die Schema-Workbench speichert das Schema im XMLFormat und es besteht die Möglichkeit, das Schema in der jeweiligen BIPlattform zu publizieren. 3.1.2.2

Mondrian-Webanwendung Für das Webfrontend für Mondrian gibt es momentan drei Anwendungen: Das von Pentaho erst kürzlich erworbene Produkt ClearView des Drittanbieters LucidEra, JPivot und die Pentaho Analysis Tools (PAT). Klassisches Webfrontend war bis vor kurzem das Open Source-Projekt JPivot. JPivot besitzt alle Funktionen zur Durchführung von OLAP-Analysen, wurde jedoch von Anwendern als umständlich und visuell wenig ansprechend wahrgenommen. Seit kurzem setzt Pentaho daher ClearView ein, allerdings nur in der Enterprise Edition. Die Community Version enthält weiterhin JPivot, es ist aber geplant, JPivot durch das Open Source-Projekt Pentaho Analysis Tools (PAT) zu ersetzen. PAT gilt als anwenderfreundlicher und zeitgemäßer als JPivot, eine erste stabile Version soll Weihnachten 2009 veröffentlicht werden. Da PAT im Gegensatz zu JPivot noch nicht in die Pentaho BI-Plattform integriert ist, die meisten User aber bis zur Einbindung von PAT mit JPivot arbeiten dürften, wird im Folgenden die Arbeitsweise von JPivot beschrieben.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

23

Whitepaper

Open Source Business Intelligence

Der Datenzugriff wird bei JPivot über MDX-Abfragen durchgeführt. Mit Hilfe des Mondrian-Schemas werden die Abfragen in eine SQL-Syntax übersetzt und auf der Datenbank ausgeführt. JPivot ermöglicht die grafische Darstellung der Ergebnisse in Form von Tabellen oder Diagrammen. Die Mondrian Cubes können in Excel mit Hilfe von Pivot-Tabellen ausgewertet werden. Zu diesem Zweck enthält die Pentaho-Plattform mittlerweile nicht mehr das Excel-Add-In Pentaho Spreadsheet Services, es gibt aber einen Drittanbieter namens Simba. Mit dem kostenpflichtigen SimbaO2X-Plugin kann Excel als Frontend zur Darstellung von Mondrian Cubes verwendet werden, was für Anwender aus technikfernen Fachabteilungen sicher eine attraktive Alternative zum eher umständlich zu bedienenden JPivot ist.

Abbildung 8: Der Zugriff auf Excel Pivot-Tabellen mit Simba

Das Webfrontend von Mondrian besteht aus JPivot-Tabellen. Diese umfassen in einer tabellarischen Sicht die Datenwürfel, die in der Schema-Workbench erstellt wurden, und eine Leiste zur Durchführung von OLAP-Analysen. Darunter befindet sich ein OLAP-Navigator, mit dem sich die Dimensionen

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

24

Open Source Business Intelligence

Whitepaper

eines Cubes frei kombinieren und die anzuzeigenden Daten auswählen lassen. Nutzung Mit jPivot werden OLAP-Analysen durchgeführt, MDX-Anweisungen erzeugt und Daten in Excel oder als gedrucktes Dokument ausgegeben. 3.1.2.3

Aggregation Designer Um die Leistung von OLAP-Analysen zu steigern, wurde von Pentaho der Aggregation Designer entwickelt. Der Designer erstellt Tabellen, die der Datenbank den Aggregationsprozess ersparen. Aufbau Der Aggregation Designer ist ein separates Werkzeug mit einer einfachen Struktur. Drei Fenster bilden die Oberfläche. Die linke Sicht enthält die Dimensionen des ausgewählten Cubes mit den entsprechenden Levels. Ein Grafikfenster demonstriert die Performance des Ergebnisses. Nutzung Der Aggregation Designer lässt sich sehr leicht bedienen. Durch vorgefertigte Wizards werden Datenbankverbindungen und das bereits existierende Schema angelegt. Die zugehörigen Dimensionen werden angezeigt und die entsprechenden Levels können ausgewählt werden. Nach dem Speichern kann das aggregierte Schema im BI-Server veröffentlicht werden. Erfahrungen und Einstufungen Die Mondrian-Plattform setzt sich aus mehreren Einzeltools zusammen und erscheint daher auf den ersten Blick unübersichtlich und unstrukturiert. Eine große Erleichterung für Endanwender-Szenarios stellt das Simba-Plugin dar. Mit dem Plugin können Auswertungen aus Mondrian direkt in ExcelPivot-Tabellen importiert werden, sodass der Endanwender innerhalb seiner gewohnten Excel-Umgebung arbeiten und gleichzeitig schnelle Analysen durchführen kann.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

25

Open Source Business Intelligence

Whitepaper

Im SAP-Bereich eignet sich Mondrian beispielsweise für die Generierung von Cubes, die SAP-Daten beinhalten. Dafür werden zunächst die Daten aus dem SAP-System exportiert, um daraus Cubes zu bilden, auf denen dann die OLAPAnalyse ausgeführt wird – wird Simba verwendet, auch in Excel. 3.1.3 Pentaho WEKA Pentaho kooperiert im Bereich Data Mining seit 2006 mit dem WEKA-Projekt. Das Projekt wurde 1993 an der Universität von Waikato (Neuseeland) gestartet. WEKA steht unter der GPL und kann auch unabhängig vom Pentaho BI-Server eingesetzt werden. Das Tool umfasst drei Oberflächen: Explorer, Experimenter und Knowledge Flow. •

Explorer: Mit Hilfe des Explorers gibt der Anwender die Datenquelle an, aus der die benötigten Daten importiert werden. Gleichzeitig werden darüber Daten geändert und gefiltert, um anschließend die Algorithmen ausführen zu können.



Experimenter: Der Experimenter besitzt eine Oberfläche für das Anlegen und Testen von Lernansätzen in Form von Experimenten. Der Anwender legt eine Datei an, in der die Ergebnisse geschrieben werden, wählt die Algorithmen aus, die ausgeführt werden sollen, und gibt die Datenquelle an. Das Experiment wird durchgeführt, das Ergebnis in einem eigenen Fenster dargestellt.



Knowledge Flow: Als eine weitere Option des Explorers ermöglicht Knowledge Flow, Data-Mining Analysen als Datenflussdiagramme zu visualisieren.

3.1.4

Pentaho Report Designer Pentaho Reporting ist eine Weiterführung des Projekts JFreeReport, das unter dem Namen Classic Reporting Engine herausgegeben wird. JFreeReport ist eine freie Bibliothek von Java-Klassen zum Generieren von Berichten, lizensiert unter der LGPL. Das Projekt wurde im Jahre 2002 erstmals zum Download angeboten und 2006 in Pentaho integriert. Anhand von JFreeReport lassen sich XML-basierte Berichte erstellen und in verschiedene Formate wie csv, html oder pdf exportieren. Für die Erstellung von Berichten steht dem Anwender eine eigene Oberfläche angeboten: Der Pentaho Report Designer. Alternativ kann auch der mit etwas weniger Funktionen ausgestattete Report Design Wizard gewählt werden.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

26

Whitepaper

Open Source Business Intelligence

Pentaho erlaubt das Generieren von Berichten in verschiedenen Varianten: Zum einen mit Hilfe des Pentaho Report Designer als separatem Berichtsentwicklungstools, zum anderen innerhalb der BI-Plattform durch fertige Vorlagen (Templates). Der Pentaho Report Designer ermöglicht es, die generierten Berichte auf der BI-Plattform zu publizieren. Aufbau Eine Palette listet alle vorhandenen Berichtselemente des Report Designers auf. Die Komponenten der Palette können per Drag-and-Drop-Technik auf die Oberfläche platziert und bearbeitet werden. Die komplette Struktur des Berichtes wird in einer hierarchischen Gliederung wiedergegeben. Nutzung Der Anwender kann zwischen einer manuellen Berichterstellung und dem Report Design Wizard entscheiden. Mit dem Report Design Wizard wird auf einfache Weise ein Standardbericht erzeugt. Für mehr Flexibilität bei der Erstellung und Gestaltung des Berichts sollte man die Berichte jedoch manuell erstellen. Wie bei anderen Reporting-Tools auch, wird ein Bericht in einzelne Bereiche wie ”Page Header”, ”Report Header”, ”Item Band”, ”Report Footer” und ”Page Footer“ gegliedert”. Sobald Layout und Design des Berichts feststehen, hat der Anwender die Option, den Bericht zu speichern oder auf der BI-Plattform zu veröffentlichen. Erfahrungen und Bewertung Der Report Designer von Pentaho hat eine einfache Struktur, lässt sich sehr leicht bedienen und benötigt nur wenig Einarbeitungszeit. Er umfasst eine große

Auswahl

an

qualitativ

hochwertigen

Diagrammen,

sodass

ansprechende Berichte erstellt werden können. Als Datenquellen lassen sich auch SAP-Systeme und Excel-Dateien anbinden. Das Publizieren des generierten Berichts ist direkt auf der Report Designer-Oberfläche und Pentaho-BI-Plattform möglich. 3.1.5Pentaho Dashboard-Building Eine Oberfläche für die grafische Erstellung von Dashboards steht bei Pentaho nur in der kostenpflichtigen Enterprise Edition zur Verfügung.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

27

Open Source Business Intelligence

Whitepaper

Die Community Version enthält aber Bibliotheken des Projekts Community Dashboard Framework, mit denen manuell Dashboards generiert werden können (Abbildung 9).

Abbildung 9: Die Erstellung von Dashboards in der Community Version

Erfahrungen und Einstufungen Durch die manuelle Dashboard-Erstellung ist es für einen technisch weniger versierten Anwender schwierig, schnell und einfach Visualisierungen zu erzeugen. Notwendig ist Entwicklerwissen z.B. über die Funktionsweise von XML-Dateien und html- und Java Script-Kenntnisse. Auch das Community Dashboards Framework und seine Bibliotheken ändern wenig daran, weil die damit entwickelten Dashboards nicht ohne Programmierkenntnisse verändert werden können. 3.1.6

Pentaho Enterprise Edition Die Pentaho Enterprise Edition ist das kostenpflichtige Komplettpaket der Pentaho BI-Suite. Sie enthält alle Designer-Tools wie z.B. Aggregation Designer, Data Integration (Kettle), Report Designer und Schema-Workbench. Die

Community

Version

liefert

diese

Tools

nicht

innerhalb

eines

Gesamtpakets, sondern bietet sie einzeln zum Download an.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

28

Whitepaper

Open Source Business Intelligence

Vergleicht man die einzelnen Komponenten der beiden Versionen, sind kaum Unterschiede zwischen den Community Design-Tools und den Enterprise Edition Design-Tools festzustellen mit Ausnahme des Dashboard Designers (Abbildung 10).

Abbildung 10: Der Dashboard Designer der Pentaho Enterprise Edition

Mit dem Designer kann der Anwender anhand vorher gespeicherter Berichte Dashboards erstellen. Dafür können Filter gesetzt werden, um Abhängigkeiten zu erzeugen. Grafisch gesehen ist der Dashboard-Designer sehr übersichtlich strukturiert und enthält die wichtigsten Funktionen zur DashboardGenerierung. Erfahrungen und Einstufungen Die Pentaho Enterprise Edition hat aus Anwendersicht den Vorteil, dass sowohl die Design-Tools als auch die BI-Plattform auf einem Blick zur Verfügung stehen, weil sie nach der Installation über das Start-Menü aufgerufen werden können.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

29

Whitepaper

Open Source Business Intelligence

Aus Entwicklersicht ist das separate Herunterladen der Open Source-DesignTools und der BI-Plattform innerhalb der Community Version aber kein Nachteil gegenüber der Enterprise Edition. Die von der Community Version bereitgestellten Module weisen die gleichen Funktionalitäten wie die der Enterprise Version auf. Die wesentlichen Unterschiede sind der fehlenden Dashboard-Designer in der CommunityVersion und die Dienstleistungen der Enterprise Edition. Für Entwickler spielen

diese

Unterschiede

sicher

keine

Rolle.

Endanwender

ohne

Programmierkenntnisse aus der Managementebene bevorzugen aber eine leicht zu bedienende Oberfläche für die Darstellung ihrer Kennzahlen. Bei größeren BI-Projekten dürften außerdem die Support- und Service-Leistungen der Enterprise Edition eine sinnvolle Investition darstellen. 3.1.7 Fazit: Pentaho Die Pentaho Community Version bietet eine große Palette an Anwendungen für die verschiedenen Fragestellungen der Business Intelligence. Besonders positiv fallen Pentaho Data Integration (Kettle) und Pentaho Report Designer ins Auge. Kettle ist mit Hilfe von Plugins erweiterbar und damit sehr flexibel im Hinblick auf neue oder sich ändernde BI-Anforderungen. Der Report Designer überzeugt durch das Zusammenspiel mit der BI-Plattform: Berichte werden im Report Designer generiert und können anschließend auf der BIPlattform veröffentlicht werden. OLAP-Funktionalität stellt Mondrian auf der Grundlage der R-OLAPTechnologie bereit. Durch den Einsatz der Drittanbieter-Lösung Simba kann Mondrian in Excel importiert werden. Mit Blick auf den Anwenderkreis aus technikfernen Bereichen wie Controlling, Finanzen oder Marketing stellt das Excel-Frontend einen klaren Vorteil dar, weil diese Anwender OLAP-Analysen in ihrer gewohnten Arbeitsumgebung durchführen können. 3.2 JasperSoft BI-Suite JasperSoft wurde 2001 unter dem Namen Panscopic gegründet und spezialisierte sich zunächst auf den Bereich Reporting. Gleichzeitig entwickelte ein Programmierer namens Teodor Danciu die Open Source Software JasperReports. Er wurde daraufhin von Panscopic übernommen und der Firmenname in JasperSoft geändert. JasperSoft ist seither nicht nur im Reporting-Bereich tätig, sondern entwickelt auch Lösungen für andere

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

30

Whitepaper

Open Source Business Intelligence

Bereiche der Business Intelligence. Seit 2005 vertreibt JasperSoft auch kommerzielle Produkte. JasperSoft hat wie Pentaho eine Business Intelligence-Plattform im Angebot. Die Suite ist wie Pentaho modular aufgebaut: Für die verschiedenen BIBereiche gibt es einzelne Werkzeuge: •

JasperETL ist verantwortlich für den ETL-Prozess und enthält Talend Open Studio, eine auch eigenständig erhältliche Anwendung.



JasperAnalysis ist zuständig für OLAP-Analysen. Es ist identisch mit dem Pentaho-Modul Pentaho Analysis Services, weil es aus den gleichen Komponenten besteht: der Mondrian Schema-Workbench, der Mondrian Webanwendung und dem Aggregation Designer.



JasperReports umfasst die Entwicklungsumgebung iReport, die der Erstellung von Berichten dient.

Abbildung 11: Der modulare Aufbau der JasperSoft BI-Suite

3.2.1JasperSoft BI-Plattform Die JasperSoft BI-Plattform basiert wie Pentaho auf einem Server. Wie bei Pentaho handelt es sich um den Tomcat Server. Die grafische Oberfläche hat

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

31

Open Source Business Intelligence

Whitepaper

eine Baumstruktur und ist gegliedert nach Themengebieten wie OLAPAnalysen oder Reporting. Anders als bei Pentaho gibt es zwei verschiedene Anmeldemöglichkeiten: als User (mit Leserechten) oder als Administrator (Schreib- und Leserechte). Dafür existiert keine zusätzliche administration console wie bei Pentaho. 3.2.2

JasperETL (Talend Open Studio) JasperSoft setzt im ETL-Bereich das Talend Open Studio (TOS) ein. Dafür kooperiert JasperSoft mit dem französischen Anbieter Talend, der sich auf Datenintegration spezialisiert hat. Talend Open Studio wurde unter der GPLLizenz veröffentlicht. Aufbau Wie bei Pentaho Kettle können in JasperETL ETL-Prozesse per Drag-and-Drop auf einer grafischen Oberfläche erstellt werden. Der Unterschied zu Kettle ist, dass ein Codegenerator die grafisch erstellten Prozesse automatisch in Code (Java oder Perl) umwandelt. Auch Talend hat seinen Ursprung in der EclipseUmgebung. Hier können neue Jobs und die zugehörigen Komponenten angelegt und verwaltet werden. Der Paletten-View enthält eine große Anzahl an Konnektoren, die Verbindungen zu Datenbanken, ERP-Systemen oder zu einfachen Dateien (wie XML- oder Excel-Dateien) aufbauen können. Nutzung Abweichend zu Kettle umfasst der Ausdruck „Job" bei JasperETL beide Vorgänge „Transformation“ und „Job". Bei Kettle setzt sich ein Job aus mehreren Transformationen zusammen. Talend verbindet dagegen mehrere Jobs miteinander und unterscheidet nicht zwischen Job und Transformation. Der große Funktionsumfang von JasperETL erleichtert den Prozessablauf beim ETL. Durch die vielen Konnektoren kann JasperETL mit allen wichtigen Datenbanken eingesetzt werden. Zu SAP gibt es eine eigene Schnittstelle, den Java-Connector SAP JCo. Bei der Ausgabe von SAP-Daten in JasperETL werden diese allerdings durch Trennzeichen getrennt im Zielordner gespeichert. Das muss manuell wieder rückgängig gemacht werden.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

32

Open Source Business Intelligence

Whitepaper

Erfahrungen und Einstufungen Die Talend Open Studio-Entwicklungsumgebung ist auf den ersten Blick sehr unübersichtlich. Angesichts der vielen Elemente fühlt man sich schnell überfordert. Die Komponenten des Paletten-Views sind im Unterschied zu Kettle nicht nach Anwendungsbereichen, sondern funktional kategorisiert. Hier entscheidet allein der Anwender, was ihm lieber ist. Talend Open Studio verfügt über eine deutlich größere Anzahl an Konnektoren als Kettle. Durch den JCo-Connector ist die Anbindung an SAP möglich, der Datenzugriff erfolgt dabei

durch

BAPI-Aufrufe.

Interessant

für

Perl-Anwender

und

ein

Unterscheidungsmerkmal zu Pentaho und Palo: Im Open Studio können Codeanpassungen nicht nur in Java, sondern auch in Perl vorgenommen werden. 3.2.3

JasperAnalysis (Mondrian) JasperSoft benutzt im Bereich der OLAP-Analysen die gleichen Open Source Software-Tools, die auch Pentaho einsetzt. Es wird die Mondrian SchemaWorkbench angeboten und weitere Produkte wie der Aggregation Designer. Da die Funktionsweise gleich ist, wird für eine detaillierte Darstellung auf den entsprechenden Abschnitt bei Pentaho verwiesen.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

33

Open Source Business Intelligence

Whitepaper

3.2.4

JasperReports JasperReports ist wie JFreeReport eine Open Source Reporting-Bibliothek, die auf Java basiert und unter der GNU GPL lizenziert ist. Die Anwendung entstand 2001 entworfen und wird seitdem weiterentwickelt. Berichte werden in JasperReports mit dem speziellen Werkzeugs iReport erstellt.

3.2.4.1 iReport Das grafische Entwicklungstool iReport erzeugt die XML-Dateien für die Berichte. Erstmals 2002 herausgebracht, ist iReport unter der GPL veröffentlicht. Aufbau iReport ist in Java geschrieben und hat eine ähnliche Oberfläche wie der Pentaho Report Designer und der kommerzielle Berichts-Designer von Microsoft. Ein „Report Inspector” listet die einzelnen Elemente des zu erstellenden Berichts auf, z.B. die Datenbankverbindung oder die im Bericht verwendeten Tabellen oder Charts. Die Berichte sind wie bei Pentaho in Bereiche unterteilt:

„Page Header”, „Column Header”, „Detail”, „Column

Footer” und „Page Footer”. Nutzung Berichte werden in iReport auf der „Design”-Oberfläche erstellt. Gleichzeitig generiert das Backend automatisch einen XML-Code. Ein Bericht wird mit Hilfe mehrerer Prozesse kreiert: Zunächst wird eine ”.jrxml”-Datei erzeugt, der nächste Schritt erzeugt daraus eine ”.jasper”-Datei, woraufhin eine ”.jrprint”Datei entsteht. Jetzt kann der Bericht z.B. als „.html”- oder ”.pdf”-Datei geöffnet werden. Erfahrungen und Einstufungen Das Reporting Tool iReport bietet mehr Funktionen als der Pentaho Report Designer. Beispielsweise beinhaltet iReport einen Expression Editor, der Variablen, Parameter, Felder und andere Elemente umfasst. Diese Elemente ermöglichen eine flexible Gestaltung des Berichts. Außerdem hat iReport mehr Diagramme im Angebot als der Pentaho Report Designer.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

34

Open Source Business Intelligence

Whitepaper

Der Nachteil von iReport ist, dass das Publizieren eines Berichts nicht über die iReport-Umgebung erfolgt, sondern von der BI-Plattform von JasperSoft hochgeladen werden muss.

Abbildung 6: Das Berichtsdesign-Tool iReport

3.2.5

JasperSoft BI Suite Professional Edition Die kostenpflichtige Version der JasperSoft BI Suite nennt sich Professional Edition und bietet neben den Modulen der Community Version zusätzlich einen Dashboard-Designer an. Der Designer ist eine Webanwendung und zugänglich über den JasperServer. Der Dashboard-Designer bietet eine Reihe von Optionen zur flexiblen Gestaltung von Dashboards an. Beispielsweise lassen sich die einzelnen Dashboard-Fenster sowie auch die jeweiligen Filter beliebig platzieren. Daneben ist es möglich, die Größe der Berichte zu verändern und sie von einer Baumstruktur ausgehend per Drag-and-Drop zu positionieren. Erfahrungen und Einstufungen

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

35

Whitepaper

Open Source Business Intelligence

Die Professional Edition von JasperSoft wird nicht wie ihr Pentaho-Gegenstück als Gesamtpaket angeboten. Die einzelnen Design-Tools wie der Aggregation Designer, das ETL-Tool oder die Schema Workbench sind nicht Bestandteil der Plattform, sondern werden separat vermarktet. Lediglich der Report Designer iReport und der Webserver sind von vornherein Teil des Pakets. Die Design-Tools können entweder als Open Source-Variante oder als kostenpflichte

Professional

Edition

eingesetzt

werden.

Vorteil

der

Professional-Version ist wie bei Pentaho der Dashboard-Designer, der in der freien Variante von JasperSoft fehlt.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

Abbildung 7: Der Dashboard Designer in der JasperSoft Professional Edition

36

Open Source Business Intelligence

Whitepaper

3.2.6

Fazit: JasperSoft Im Gegensatz zu Pentaho ist die JasperSoft-BI-Suite nicht als Gesamtpaket konzipiert. Trotz der vorhandenen Plattform ist deutlich, dass die einzelnen Anwendungen für einen separaten Einsatz entwickelt wurden. Da die Tools funktional teils sehr stark sind, empfiehlt es sich, für bestimmte BIAnforderungen die entsprechende JasperSoft-Anwendung und nicht die gesamte Plattform einzusetzen. Positiv ins Auge fallen die vielen Plugins und Konnektoren für die ETL-Lösung JasperETL/Talend. Besonders der von einem Drittanbieter vertriebene SAPKonnektor ist für Anwender aus dem SAP-Bereich sehr interessant. Der Konnektor kann von Entwicklern ohne ein zusätzliches Plugin eingesetzt werden. Für nicht-technische Anwender ist die Nutzung allerdings nicht so einfach, weil es spezieller Modifikationen bedarf, um aus dem SAP-System Daten auslesen zu können. iReport und der Aggregation Designer sind vollfunktionale BI-Anwendungen. Allerdings können die erstellten Berichte bzw. Aggregationstabellen nicht direkt von der jeweiligen Anwendung auf der JasperSoft BI-Plattform publiziert werden. Dazu ist ein manueller Publiziervorgang erforderlich. Im OLAP-Bereich gibt es keinen großen Unterschied zu Pentaho, da JasperSoft ebenfalls Mondrian einsetzt. Mit Hilfe des Drittanbieters Simba kann dabei Excel als OLAP-Front-End verwendet werden, was dem nicht-technischen Anwenderkreis entgegenkommt.

3.3 Palo BI Suite Palo ist ein Produkt der Jedox AG und wird für Einzelbereiche der Business Intelligence wie Planung, Analyse und Berichterstellung eingesetzt. Palo arbeitet auf Basis von M-OLAP (multidimensionales OLAP; greift auf eine multidimensionale Datenbank zu) und hat daher den Vorteil, dass es sehr schnell arbeitet.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

37

Whitepaper

Open Source Business Intelligence

Wie Pentaho und JasperSoft kann Palo als Open Source Software, die Community Version, oder als kostenpflichtigen Enterprise Edition eingesetzt werden.

Die Palo BI Suite Community Version besteht aus den Komponenten •

Palo ETL Server



Palo OLAP Server



Palo Worksheet Server und



Palo Excel Add-In

Die Enterprise Edition enthält die Community-Elementen auf und bietet zusätzlich den Palo Supervisor Server an.

Abbildung 8: Die Palo BI Suite

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

38

Whitepaper

Open Source Business Intelligence

BI-Prozesse werden in Palo folgendermaßen durchgeführt: Der Palo ETL Server bereitet die Daten auf und importiert sie in Palo-Cubes. Alternativ können dafür auch Kettle oder Talend eingesetzt werden. Nach dem erfolgreichen Import der Daten können die Palo-Cubes analysiert werden: Entweder über ein Excel-Front-End oder im Palo Worksheet Server. 3.3.1 Palo OLAP Server Der Palo OLAP Server ist die Grundlage der Palo BI Suite. Auf ihn greifen die einzelnen Anwendungen zu. Sein Aufbau basiert auf der M-OLAP-Architektur; in der Enterprise Edition werden auch Multi-Prozessor-Architekturen unterstützt. Die Daten werden in Form von Cubes, Dimensionen und Hierarchien gespeichert, ihre Analyse erfolgt in Echtzeit. 3.3.2

Palo ETL Server Palo bietet einen speziellen ETL Server für den Datenaustauch zwischen Quellund Zielsystemen an. Damit ist nicht nur der Datenimport in Palo Cubes möglich, sondern auch in die gängigsten Zielsysteme aus verschiedenen Quellsystemen. Bei der Enterprise Edition können auch Daten aus SAPSystemen geladen werden.

Aufbau Der Palo ETL Server ist eine Java-Anwendung und wird als Webdienst zur Verfügung gestellt. Wie bei Kettle gibt es die Unterscheidung zwischen Jobs und Transformationen. Diese können unter einer Baumstruktur angelegt und definiert werden. Auch Verbindungen werden in der Baumstruktur festgelegt. Nutzung Anders als bei den ETL-Tools Kettle und Talend stellt der Palo ETL Server keine eigenen Konnektoren zu Fremdsystemen bereit. Eine Anbindung an andere Datenbanken oder Dateiformate ist jedoch möglich, in der Enterprise Edition kann zusätzlich SAP angebunden werden. Je nach Art des Quellsystems legt man eine Extraktion fest. Beispielsweise wird die Extraktion bei relationalen Datenbanken

anhand

von

SQL-Statements

durchgeführt.

Nach

dem

Extraktionsprozess wird mit Hilfe des Loading-Vorgangs die Zielquelle

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

39

Whitepaper

Open Source Business Intelligence

angegeben. Nach Abschluss der Phasen legt man innerhalb von „Jobs“ fest, wann das angelegte Projekt gestartet werden soll. Erfahrungen und Einstufungen Der Palo ETL Server unterstützt zwar auch eine Reihe von Drittsystemen, wenn man aber erst einmal mit ihm arbeitet, wird klar, dass er den Datenaustausch mit Palosystemen bevorzugt. Für den Endanwender ist die Anwendung nicht ganz einfach zu bedienen, es braucht dazu einer gewissen Einarbeitungszeit. Palo-Cubes können nicht nur in Palo selbst, sondern auch in Talend und Kettle erstellt werden. Dazu gibt es Konnektoren (Talend) bzw. ein eigenes PaloPlugin (Kettle).

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

40

Whitepaper

Open Source Business Intelligence

Abbildung 9: Der Palo ETL Server

3.3.3

Palo Worksheet-Server Der Palo Worksheet Server (Abbildung 17) basiert auf einer Webanwendung und dient zur Generierung und Visualisierung von Berichten oder Analysen und zur Bereitstellung von Formularen für Benutzereingaben. Daneben werden über ihn die Benutzerrechte gesteuert. Aufbau Der Palo Worksheet-Server besitzt eine Baumstruktur, so dass die einzelnen Module wie beispielsweise „Ressourcen“ oder „Berichtspeicher“ hierarchisch strukturiert sind. Zur Berichtsgenerierung stellt das Tool eine Art Excel-Umgebung über den Browser bereit. Die Berichte werden als Ressourcen angelegt und können zur weiteren Bearbeitung im Berichtsspeicher abgelegt werden.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

41

Whitepaper

Open Source Business Intelligence

Nutzung Der Palo Worksheet-Server vereinfacht die Erstellung von Reports enorm. Durch das Anlegen von neuen Arbeitsmappen können die Daten über den Webbrowser aufgerufen werden, um daraus Berichte zu erstellen. Positiv dabei ist, dass Sondergrafiken, die es in Excel nicht gibt (Dashboard-Vorlagen wie Tachometer etc.), eingebunden werden können. Der Worksheet-Server erlaubt außerdem, Benutzerrechte für Würfel, Berichte und einzelne Zellen innerhalb von Berichten einzurichten. So können einzelne Zellen für Eingaben freigegeben bzw. gesperrt werden. Erfahrungen und Einstufungen Der Worksheet-Server von Palo weist zwei entscheidende Vorteile im Bereich der Berichtgenerierung auf: Der Endanwender auf der Geschäftsseite kann mit der gewohnten Excel-Umgebung arbeiten, die über den Webbrowser bereitgestellt wird. Selbst, wenn er Excel nicht installiert hat, kann er die Berichte von verschiedenen Standorten aus abrufen.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

42

Whitepaper

Open Source Business Intelligence

Der zweite Vorteil ist die zentrale Benutzerverwaltung. Sie macht den Worksheet-Server für Einsatzszenarien in der Planungsebene sehr interessant. Indem einzelne Zellen freigegeben bzw. gesperrt werden können, wird die Gefahr falscher Einträge verhindert. So kann der Benutzer gezielt zur Bearbeitung bestimmter Zellen aufgefordert werden, besitzt aber nicht die Möglichkeit, für ihn gesperrte Zellen zu editieren. 3.3.4

Palo Excel Add-in Das Excel Add-in von Palo (Abbildung 18) bringt im Sinne der OLAPFunktionalitäten und der Planung einen großen Mehrwert. Der Anwender muss sich nicht an eine neue Anwendungsumgebung gewöhnen, sondern kann OLAP-Analysen in Excel selbst durchführen. Das umso mehr, als dass über das Add-in auch die grafische Berichterstellung erfolgt.

Abbildung 11: Das Palo Excel Add-in mit der Funktion PALO.DATAC()

Aufbau

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

43

Whitepaper

Open Source Business Intelligence

Das Add-in gleicht vom Aussehen her exakt Excel, besitzt aber einen zusätzlichen Menüpunkt mit dem Titel „Palo“, über den sich die PaloFunktionalitäten aufrufen lassen. Darüber wird auf vorher angelegte PaloWürfel zugegriffen. Ad-hoc-Berichte können per Drag-and-Drop erstellt werden. Nutzung Über die Excel-Oberfläche fügt man Ansichten ein. Dadurch können PaloWürfel selektiert und die entsprechenden Dimensionen mit den Werten angezeigt werden. Der Zugriff auf die Würfeldaten erfolgt über spezielle Funktionen, die Excel mit der Datenbank verknüpfen. Das Entwerfen von neuen Würfeln ist mit dem Add-in auf einfache Weise möglich. Dimensionen können angelegt werden, um daraus verschiedene Würfel zu konstruieren. Daneben lassen sich Daten nicht nur analysieren, sondern gegebenenfalls auch

zurückschreiben.

Palo

eignet

sich

dadurch

auch

gut

als

Planungswerkzeug. Erfahrungen und Einstufungen Anwendung

findet

das

Palo

Excel

Add-in

im

Controlling

und

Finanzplanungsbereich. Die Cube-Daten können je nach Wunsch detailliert im Excel-Front-End angezeigt oder mit den jeweiligen OLAP-Funktionen analysiert bzw. verändert werden. Die meisten Anwender favorisieren Excel als Front-End, weil sich dadurch unübersichtliche Datenmengen bequem anzeigen lassen. Großer Vorteil des Add-ins ist es, dass der Endanwender Modifikationen selbst durchführen kann und nicht die IT-Abteilung dazu heranziehen muss. 3.3.5

Palo Supervision Server Der Palo Supervision Server ist nur in der Palo Enterprise BI Suite enthalten und dient als Kontrollinstanz für die einzelnen Abläufe bezüglich der Palo Datenbank. Das betrifft beispielsweise den Prozess „Login eines Benutzers“, d.h. wann ist der Benutzer eingeloggt, welche Änderungen hat er vorgenommen, wann hat

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

44

Whitepaper

Open Source Business Intelligence

er sich abgemeldet. Das Tool arbeitet mit PHP Codes, die als Warnsysteme fungieren, wenn definierte Grenzwerte über- bzw. unterschritten werden. Der Benutzer kann in solchen Fällen per SMS oder E-Mail kontaktiert werden. Die Anwendungsgebiete für den Einsatz des Palo Supervision Server sind Bereiche, in denen Transparenz eine wichtige Rolle spielt, z.B. im Controlling bei der Analyse bestimmter Kennzahlen wie Gewinn, Umsatz oder Liquidität. 3.3.6

Fazit: Palo Palo ist ein Softwarepaket zur Analyse und Planung. Die Community Version umfasst mehrere Einzelanwendungen, die sowohl alleine als auch als Gesamtpaket eingesetzt werden können. Verglichen mit anderen Open Source BI-Tools besticht Palo durch die Möglichkeit, einzelne Zellen anpassen zu können. Palo eignet sich deshalb besonders für die Festlegung von Planzahlen. Ein weiterer Pluspunkt dabei ist, dass die Änderung von Datenwürfeln ohne die IT-Abteilung vorgenommen werden kann. Weitere Pluspunkte sind das Excel Add-in und der ETL-Server. Die Datenintegration kann bei Palo über beide Tools erfolgen. Im Vergleich zu den ETL-Werkzeugen der beiden anderen Suiten überzeugt der ETL-Server von Palo durch die Art der Datenflussmodellierung: Der Design-Prozess läuft bei Palo über eine selbst entwickelte Webanwendung. Allerdings wird die eigentlich schön strukturiert aufgebaute Anwendung bei großen Transformationen leider ein wenig unübersichtlich. Der ETL-Server besticht im Vergleich zu Kettle oder Talend mit einer guten Performance und bietet in der Enterprise Version einen Konnektor zur Integration von SAP-Daten an. Beide Anwendungen sind als sehr anwenderfreundlich einzustufen: Dank der Excel-Anbindung muss der Benutzer seine vertraute Anwendungsumgebung nicht verlassen, sondern greift einfach über Excel auf die Daten zu. Das erweitert den Anwenderkreis von Palo, weil damit auch die Fachabteilungen ohne viel Aufwand Analysen vornehmen können. Ein weiterer Vorteil ist, dass Palo dem Anwender einige Berechnungen während

des

Planungsprozesses

erspart.

Der

Anwender

gibt

die

Vorgehensweise zur Planzahlenberechnung an, etwa die prozentuale Aufteilung der Zahlen vom Vorjahr bezüglich der Monate. Palo listet nach derselben Anordnung die Planzahlen auf.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

45

Whitepaper

Open Source Business Intelligence

In Bezug auf diese Punkte kommt also Palo dem nicht-technischen Anwenderkreis mehr entgegen als Pentaho oder JasperSoft. Die Enterprise Edition von Palo stellt einen Supervision Server bereit, der als Kontrollinstanz fungiert und Aktionen wie An- und Abmelden eines Benutzers, Verändern einer Zelle, Speichern der Datenbank oder die Gruppenzugehörigkeit des Benutzers protokolliert. Darüber hinaus können Regeln wie das Unter- bzw. Überschreiten von Grenzwerten definiert werden, sodass der Supervision Server Warnungen in Form von SMS- oder E-MailBenachrichtigungen auslöst.

4 Gesamtbetrachtung Ziel des vorliegenden White Papers ist es, einen Überblick von drei Lösungen im Open Source Business Intelligence-Bereich zu geben. In diesem Kapitel werden die Erkenntnisse noch einmal zusammengefasst. Alle drei der vorgestellten Open Source Produkte sind modular aufgebaut und plattformunabhängig. Angeboten werden sie sowohl als Gesamtpakete als auch als Einzellösungen, die allein betrieben werden können. Die kostenpflichtigen Versionen von Pentaho, JasperSoft und Palo decken die einzelnen BI-Bereiche wie ETL-Prozesse, OLAP-Analysen, Berichterstellung und die Zusammenfassung von Kennzahlen in Dashboards ab. Bis auf die Dashboard-Funktionen trifft das auch auf die Community-Alternativen zu.

Es ist möglich, die einzelnen Anwendungen untereinander zu kombinieren. Das gibt dem Anwender größtmögliche Flexibilität bei der Lösung seines jeweiligen

BI-Problems.

Hier

zeigen

sich

klar

die

Vorteile

der

Herstellerunabhängigkeit und offenen Standards von Open Source-Software. Beispiel: Zum Laden eines Palo-Würfels kann entweder der Palo ETL-Server oder aber Talend bzw. Kettle eingesetzt werden. Der frei zugängliche Quellcode der drei Lösungen kann zudem geändert oder erweitert werden, wenn für unternehmens- oder problemspezifische Anforderungen die vorhandenen

Funktionen

nicht

ausreichen.

Das

trifft

auch

auf

Integrationsszenarien zu: Muss die Software an andere Anwendungen

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

46

Whitepaper

Open Source Business Intelligence

angebunden werden, können dank des offen liegenden Codes und der schon existierenden Konnektoren Schnittstellen erstellt werden. Da es sich zudem um Java-basierte Lösungen handelt, lassen sich die vorgestellten Werkzeuge um Plugins erweitern. Beispielsweise können zum Importieren von Daten aus ERP-Systemen Programmcodes entwickelt und implementiert werden. Vor der Durchführung eines BI-Projektes mit Open Source sind wie bei einer proprietären Software genaue Überlegungen nötig. Hilfreich kann dabei das Vier-Phasen-Modell sein. Das Vier-Phasen-Modell setzt sich aus den Stufen Konzeption, Datenarchitektur, technische Architektur und Implementierung (jeweils mit dem Fokus auf Backend- und Frontend-Aspekte) zusammen und bildet eine gute gedankliche Grundlage für die Umsetzung von Projekten. Ob sich die Investition in eine BI-Suite lohnt, lässt sich anhand der Frage nach dem Integrationsbedarf und der Unternehmensgröße beantworten. So kann es für ein kleines Unternehmen ausreichend sein, im Bereich der BI die einzelnen Community-Tools einzusetzen. Interessant wird der Einsatz von BIPlattformen in mittelständigen bis großen Firmen, weil diese Firmen aus mehreren Abteilungen und hunderten von Mitarbeitern bestehen. Hier entsteht

beim

Einsatz

einer

Open

Source-Lösung,

selbst

in

der

kostenpflichtigen Enterprise Version, immer noch ein deutlicher Kostenvorteil, der zur Anpassung und Konfiguration der Lösung verwendet werden kann. Trotzdem sollte Open Source-Software nicht allein aus Kostengründen eingesetzt werden. Die ausgewählte Lösung sollte zu den jeweiligen Anforderungen passen und sie zufriedenstellend erfüllen. Die untersuchten Open Source-Produkte sind in der Lage, die Anforderungen typischer Anwendungsszenarien der Business Intelligence zu erfüllen. Sie stellen bezüglich Leistungsumfang und Anwenderfreundlichkeit vollwertige BI-Produkte

dar

und

entscheiden

sich

in

den

wichtigsten

Anwendungsbereichen nur marginal voneinander. Die größten Unterschiede liegen im Bedienungskomfort der einzelnen Lösungen. So ist Pentaho sicherlich

das

überzeugendste

BI-Komplettpaket.

Sollen

nur

Einzelanwendungen für bestimmte BI-Bereiche eingesetzt werden, stehen JasperSoft und Palo dem bekannteren Konkurrenten aber in nichts nach.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

47

Whitepaper

Open Source Business Intelligence

Wenn bei der Einführung einer quelloffenen Business Intelligence-Lösung nicht der Fehler gemacht wird, auf angemessene Projektunterstützung und planung zu verzichten, nur weil es sich um Open Source handelt, sondern die gleichen Prioritäten, Ressourcen und die entsprechende „ManagementAttention“ wie bei einem Einsatz kommerzieller Lösungen eingesetzt werden, kann Open Source den gleichen Gewinn bringen wie proprietäre Software.

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

48

Whitepaper

Open Source Business Intelligence

5 Weitere Downloads und Kontakte Weitere Whitepaper zu verschiedenen Themengebieten sind als Download unter

http://www.it-novum.com/whitepaper-success-story/ erhältlich.

Stefan Müller Director Business Intelligence & Big Data it-novum Deutschland HAUPTSITZ FULDA Edelzeller Straße 44 36043 Fulda Deutschland Tel: +49 661 103-333 [email protected]

NIEDERLASSUNG BERLIN Siemensdamm 50 13629 Berlin it-novum Österreich Office Park 1, Top B02 1300 Wien-Flughafen Österreich Tel: +43 1 227 87-139 [email protected] www.it-novum.com

it-novum GmbH [email protected] Tel: +49 661 103-333 http://www.it-novum.com/nc/downloads.html?wm=wpdownload

49