BIPLOT Visualisierung von Datenpunkten in einem Koordinatensystem
Inhalt
Übersicht .................................................................................................................................................................................2 Allgemeine Beschreibung................................................................................................................................................. 2 Die Funktion: Falldarstellung nach Variablen ....................................................................................................... 2 Lizenz........................................................................................................................................................................................ 3 BIPLOT starten: Erste Schritte.......................................................................................................................................3 Systemvoraussetzungen ................................................................................................................................................... 3 Starten von BIPLOT............................................................................................................................................................ 4 Die Eingabedatei ................................................................................................................................................................. 4 Einlesen der Eingabedatei............................................................................................................................................... 4 Die Hauptfunktionen von BIPLOT................................................................................................................................4 Zwei Variablen visualisieren .......................................................................................................................................... 4 Filtervariable: ausgewählte Fälle einfärben ........................................................................................................... 5 Darstellung absoluter oder relativer Häufigkeiten.............................................................................................. 5 Achsenbeschriftungen ....................................................................................................................................................... 6 Anzeige der Häufigkeiten................................................................................................................................................. 6 Leeren Wertebereich ausblenden................................................................................................................................. 6 Export der Auswahl ............................................................................................................................................................ 6 Export der BIPLOTGrafik ............................................................................................................................................... 7 Wertebereich der Anzeige ............................................................................................................................................... 7 Verändern der Darstellung..............................................................................................................................................7 Liniendicke ............................................................................................................................................................................. 7 Radius....................................................................................................................................................................................... 8 Zoom ......................................................................................................................................................................................... 8 Anzeige auf dem Bildschrim/dem Beamer............................................................................................................... 8
Abbildung 1: Das Hauptfenster von BIPLOT
Stand: 21.07.09
1
Übersicht Allgemeine Beschreibung BIPLOT stellt Datenpunkte in einem zweidimensionalen Koordinatensystem dar. Die Position der Punkte ergibt sich aus zwei Variablen, von denen eine auf der X‐ und eine auf der Y‐Achse eines Koordinatensystems abgetragen werden. Zusätzlich stellt BIPLOT die Anzahl der Datenpunkte dar, die jeweils auf der gleichen Stelle des Koordinatensy‐ stems liegen. Darüber hinaus kann eine dritte Variable als Filter definiert werden, so dass Datenpunkte, die einem bestimmten, wählbaren Wert der dritten Variable entspre‐ chen, farblich hervorgehoben werden. Als Grundlage der Darstellung werden Daten aus SPSS, Excel o.ä. Programmen verwen‐ det, die als CSV‐Datei exportiert wurden. Das Programm BIPLOT wurde durch die Arbeitsgruppe Methoden und Evaluation (MAGMA, www.methoden‐evaluation.de) der Philipps‐Universität Marburg, Fachbereich Erziehungswissenschafte entwicklt und durch den Fachbereich Informatik realisiert. Die Funktion: Falldarstellung nach Variablen Jeder in der Eingabedatei enthaltene Fall wird in BIPLOTs Koordinatensystem eingetra‐ gen. Liegen mehrere Fälle an der exakt gleichen Position im Koordinatensystem, so wer‐ den alle Fälle ab dem zweiten durch konzentrische Kreise um die Position im Koordina‐ tensystem dargestellt. Jeder neue konzentrische Kreis erhält dabei einen größeren Durchmesser als der Vorhergehende:
Abbildung 2: Ausschnitt aus einem BIPLOT
Um die Übersichtlichkeit zu verbessern, werden die konzentrischen Kreise bei zuneh‐ mender Distanz zur Mitte mit zunehmender Helligkeit dargestellt. Stand: 21.07.09
2
In Abb. 2, einem Ausschnitt aus einem BIPLOT, befinden sich die meisten Fälle in der ersten Rubrik der X‐Achse. In der oberen rechten Ecke der Abbildung ist hingegen ledig‐ lich ein Fall verortet. Um eine weitere Dimension in die Analyse der Daten einzubeziehen, lassen sich alle Fäl‐ le, die in einer beliebigen weiteren Variablen, z.B. dem Geschlecht, einen identischen Wert aufweisen, einfärben:
Abbildung 3: BIPLOT mit aktivierter Filtervariable
In Abbildung 3 wurden alle Fälle, die weibliche Probanden repräsentieren, orange einge‐ färbt. Lizenz Das Programm BIPLOT darf frei verwendet werden. Bei der Verwendung einer durch BIPLOT generierten Grafik ist der Name des Programms sowie die Internetadresse www.methodenevaluation.de auf der Folie, in der Bildbeschreibung, als Fußnote oder an anderer gleichwertiger Stelle anzugeben. Darüber hinaus ist die Arbeitsgruppe MAGMA sehr daran interessiert, etwas über den Einsatz des Programms zu erfahren und bittet um eine kurze E‐Mail mit einer Beschreibung des Einsatzes von BIPLOT und, wenn mög‐ lich, einem Bildschirmfoto/einer exportierten Grafik. Bitte senden Sie diese Mail an in fo@methodenevaluation.de.
BIPLOT starten: Erste Schritte Systemvoraussetzungen BIPLOT ist in JAVA geschrieben und somit prinzipiell unter allen Betriebssystemen lauf‐ fähig, für die JAVA verfügbar ist. In viele moderne Betriebssysteme (etwa Windows, MAC Stand: 21.07.09
3
OS und Linux) ist JAVA bereits integriert, so dass keine vorbereitenden Arbeitsschritte notwendig sind. Ist JAVA nicht installiert, kann es über die Internetseite www.java.com kostenfrei bezogen werden. Starten von BIPLOT Zum Start von BIPLOT muss die Programmdatei mit einem Doppelklick aufgerufen wer‐ den. Startet das Programm daraufhin nicht, so kann es alternativ mit dem Befehl java –jar BIPLOT.jar über die Kommandozeile gestartet werden. Die Eingabedatei Die Eingabedatei, welche die zu visualisierenden Daten enthält, muss im CSV‐Format (durch Kommata oder Semikola getrennte Daten) vorliegen. Jede Zeile muss einen Fall und jede Spalte eine Variable enthalten. Die erste Zeile muss die Variablennamen enthal‐ ten. Daten, die in SPSS oder Excel vorliegen, können mit Hilfe der Exportfunktion ohne Wei‐ teres in diesem Format abgespeichert werden.
Abbildung 4: Ausschnitt aus einer Eingabedatei (hier: Ansicht in Excel)
Einlesen der Eingabedatei Um die vorbereitete CSV‐Datei in BIPLOT einzulesen, muss im Menü Datei der Menü‐ punkt Öffnen ausgewählt und dann wie gewohnt weiter verfahren werden.
Die Hauptfunktionen von BIPLOT Zwei Variablen visualisieren Nach dem Einlesen der Eingabedatei kann über die Drop‐Down‐Menüs im linken unte‐ ren Teil des Programmfensters ausgewählt werden, welche Variablen zur Visualisierung verwendet werden sollen.
Abbildung 5: DropDownMenüs zur Variablenauswahl
Stand: 21.07.09
4
Über das Menü xAchse wird bestimmt, welche Variable in der Horizontalen abgetragen wird. Dementsprechend wird über das Menü yAchse die Variable die in der Vertikalen darzustellende Variable ausgewählt. Durch einen Klick auf den Button OK werden die Daten anhand der ausgewählten Variablen dargestellt. Filtervariable: ausgewählte Fälle einfärben Eine weitere Variable kann in die Darstellung einbezogen werden, indem alle Fälle, die bei dieser dritten Variable den gleichen Wert aufweisen, in der gleichen Farbe darge‐ stellt werden. Zur Einfärbung muss zunächst im Menü Filter im mittleren unteren Teil des Programmfensters die Filtervariable ausgewählt werden. Abbildung 6: Menü zur Auswahl einer Filtervariablen
Nach der Auswahl der Filtervariablen kann über das Menü Wert eingestellt werden, welche Werte der Fallauswahl zu Grunde gelegt werden sollen. In diesem Menü sind alle Werte verfügbar, die in der Eingabedatei für die gewählte Variable enthalten sind1. Im Menü Farbe kann schließlich ausgewählt werden, in welcher Farbe die zuvor ausgewähl‐ ten Fälle eingefärbt werden sollen. Das Ergebnis der Filterung ist in Abbildung 3 darge‐ stellt. Darstellung absoluter oder relativer Häufigkeiten In der Standardeinstellung wird zur Darstellung der Fälle die Funktion Lineare Auswer tung genutzt, d.h. jeder im eingelesenen Datensatz enthaltene Fall wird durch einen Punkt bzw. Kreis repräsentiert (absolute Häufigkeiten). Über das Menü Ansicht kann die Darstellung auf Prozentuale Auswertung umgestellt werden. In dieser Einstellung wird die prozentuale Verteilung der Fälle dargestellt, d.h. 1 Punkt/Kreis entspricht dann (ge‐ rundet) 1% der Fälle (relative Häufigkeiten).
Abbildung 7: Ausschnitt aus der Visualisierung des gleichen Datensatzes, links mit absoluten Häufigkeiten (Lineare Auswertung), rechts mit relativen Häufigkeiten (Prozentuale Auswertung)
1 Eine Fallauswahl mit logischen Operatoren, etwa größer oder ungleich ist in der aktuel‐
len Programmversion nicht möglich. Stand: 21.07.09
5
Achsenbeschriftungen Um die Beschriftung der Achsen einzublenden, muss im Menü Ansicht der Menüpunkt Skalabeschriftung anzeigen ausgewählt werden. Die Beschriftungen werden der eingele‐ senen Datei entnommen und entsprechen den Werten der Variable. Anzeige der Häufigkeiten Über das Menü Ansicht kann mit Hilfe des Menüpunkts Häufigkeiten anzeigen eine Be‐ schriftung der Datenpunkte eingeblendet werden. Hier wird jeweils dargestellt, wie vie‐ le Fälle auf dem jeweiligen Punkt liegen.
Abbildung 8: Eingeblendete Häufigkeiten
Leeren Wertebereich ausblenden Im Menü Ansicht kann durch Auswahl des Punktes Leeren Wertebereich ausblenden die Anzeige auf die tatsächlich vorhandenen Fälle im Koordinatensystem zentriert werden. Die Bereiche der Matrix, in denen keine Fälle liegen, werden ausgeblendet. Die Fälle am linken und am unteren Rand des Wertebereichs wandern auf die y‐ bzw. die x‐Achse, die Fälle am rechten und am oberen Rand der Darstellung bilden die neue rechte bzw. obere Grenze der Darstellung. Export der Auswahl Für eine weitere Analyse der Daten ist es möglich, interessierende Teile des Koordina‐ tensystems wieder in eine CSV‐Datei zu exportieren, um sie in einem anderen Pro‐ gramm, etwa SPSS oder Systat, zu bearbeiten. Daten werden ausgewählt, indem bei gedrückter Umschalttaste (Großschreibung) in das Zentrum der auszuwählenden Kreisvisualisierung geklickt wird. Durch einen roten Kreis wird dargestellt, dass die entsprechenden Werte ausgewählt wurden. Die Auswahl gilt immer für alle Werte, die an der gleichen Stelle des Koordinatensystems liegen (Daten‐ gruppen), also all jene, die konzentrisch um den ausgewählten Punkt herum dargestellt werden. Bei gedrückter Umschalttaste können beliebig viele Datengruppen ausgewählt werden.
Abbildung 9: Zwei ausgewählte Datengruppen (rot markiert)
Stand: 21.07.09
6
Um die Auswahl von Datengruppen wieder aufzuheben, gibt es zwei Möglichkeiten: •
•
Um die Auswahl einer einzelnen Datengruppe gezielt rückgängig zu machen, muss mit gleichzeitig gedrückter alt‐Taste in das Zentrum der betreffenden Da‐ tengruppe (rote Markierung) geklickt werden. Um die gesamte Auswahl auf einmal aufzuheben, muss bei gedrückter ctrl‐Taste an eine beliebige Stelle in der Visualisierung geklickt werden.
Die so ausgewählten Daten werden über den Menüpunkt Auswahl als .csv speichern im Menü Datei aus BIPLOT exportiert und können unmittelbar weiterbearbeitet werden. Export der BIPLOT‐Grafik Über den Menüpunkt Als .png speichern im Menü Datei kann die Darstellung in eine PNG‐ Grafikdatei exportiert werden. Dieses Standarddateiformat kann problemlos in allen gängigen Programmen (z.B. Word, PowerPoint etc.) weiterverwendet und eingebunden werden. Die exportierte Grafik enthält immer Achsenbeschriftungen. Sowohl die Werte (Analog zur Funktion Skalabeschriftung anzeigen) als auch der Name der dargestellten Variable sind enthalten. Wertebereich der Anzeige Am unteren Bildschirmrand sind Informationen zum Wertebereich der aktuell darge‐ stellten Grafik eingeblendet. Die linke Ausgabe bezieht sich auf die x‐Achse (waage‐ recht), die rechte entsprechend auf die y‐Achse (senkrecht). Abbildung 10: Informationen zum Wertebereich der Grafik
Verändern der Darstellung Die Möglichkeiten zur Veränderung der Darstellung helfen dabei, eine möglichst über‐ sichtliche und informative Grafik zu erstellen. Folgende Optionen stehen dabei zur Ver‐ fügung: Liniendicke Mit Hilfe des Reglers Liniendicke (am unteren Fensterrand) kann die Dicke der Linien bzw. Punkte in der Visualisierung verändert werden. Je weiter der Regler nach rechts geschoben wird, desto dicker werden die Linien dargestellt und umgekehrt.
Abbildung 11: Die gleiche Darstellung mit unterschiedlicher Liniendicke
Stand: 21.07.09
7
Radius Der Regler Radius (rechts neben dem Regler Liniendicke) beeinflusst den Abstand zwi‐ schen den Kreisen. Wird der Regler nach rechts bewegt, so nimmt der Abstand zu (der Radius eines jeden Kreises wird linear vergrößert), in linker Richtung nimmt er ab.
Abbildung 12: Die gleiche Darstellung mit unterschiedlichen Radiuswerten
Zoom Um die gesamte BIPLOT‐Grafik größer oder kleiner anzuzeigen, kann der am unteren Fensterrand befindliche Regler Zoom verwendet werden. Wird er nach rechts bewegt, so wird die Darstellung vergrößert, wird er nach links bewegt, so wird sie verkleinert. Anzeige auf dem Bildschrim/dem Beamer Im Menü Ansicht kann über die Menüpunkte Anzeige auf dem Bildschirm und Anzeige auf dem Beamer auf fest hinterlegte Voreinstellungen zurückgegriffen werden. Die hinter‐ legten Einstellungen wurden für die Darstellung auf dem jeweiligen Ausgabegerät opti‐ miert (für die Anzeige auf dem Beamer wird etwa eine größere Linienstärke eingestellt). Auch nach dem Aufrufen einer Voreinstellung kann die Darstellung mit Hilfe der oben beschriebenen Regler weiter verändert werden.
Stand: 21.07.09
8