BIPLOT Visualisierung von Datenpunkten in einem Koordinatensystem

BIPLOT  Visualisierung von Datenpunkten in einem Koordinatensystem  Inhalt  Übersicht .................................................................
Author: Insa Fuhrmann
4 downloads 1 Views 406KB Size
BIPLOT  Visualisierung von Datenpunkten in einem Koordinatensystem 

Inhalt 

Übersicht .................................................................................................................................................................................2  Allgemeine Beschreibung................................................................................................................................................. 2  Die Funktion: Falldarstellung nach Variablen ....................................................................................................... 2  Lizenz........................................................................................................................................................................................ 3  BIPLOT starten: Erste Schritte.......................................................................................................................................3  Systemvoraussetzungen ................................................................................................................................................... 3  Starten von BIPLOT............................................................................................................................................................ 4  Die Eingabedatei ................................................................................................................................................................. 4  Einlesen der Eingabedatei............................................................................................................................................... 4  Die Hauptfunktionen von BIPLOT................................................................................................................................4  Zwei Variablen visualisieren .......................................................................................................................................... 4  Filtervariable: ausgewählte Fälle einfärben ........................................................................................................... 5  Darstellung absoluter oder relativer Häufigkeiten.............................................................................................. 5  Achsenbeschriftungen ....................................................................................................................................................... 6  Anzeige der Häufigkeiten................................................................................................................................................. 6  Leeren Wertebereich ausblenden................................................................................................................................. 6  Export der Auswahl ............................................................................................................................................................ 6  Export der BIPLOT­Grafik ............................................................................................................................................... 7  Wertebereich der Anzeige ............................................................................................................................................... 7  Verändern der Darstellung..............................................................................................................................................7  Liniendicke ............................................................................................................................................................................. 7  Radius....................................................................................................................................................................................... 8  Zoom ......................................................................................................................................................................................... 8  Anzeige auf dem Bildschrim/dem Beamer............................................................................................................... 8 

 

Abbildung 1: Das Hauptfenster von BIPLOT 

Stand: 21.07.09 



Übersicht  Allgemeine Beschreibung  BIPLOT  stellt  Datenpunkte  in  einem  zweidimensionalen  Koordinatensystem  dar.  Die  Position der Punkte ergibt sich aus zwei Variablen, von denen eine auf der X‐ und eine  auf der Y‐Achse eines Koordinatensystems abgetragen werden. Zusätzlich stellt BIPLOT  die Anzahl der Datenpunkte dar, die jeweils auf der gleichen Stelle des Koordinatensy‐ stems  liegen.  Darüber  hinaus  kann  eine  dritte  Variable  als  Filter  definiert  werden,  so  dass Datenpunkte, die einem bestimmten, wählbaren Wert der dritten Variable entspre‐ chen, farblich hervorgehoben werden.  Als Grundlage der Darstellung werden Daten aus SPSS, Excel o.ä. Programmen verwen‐ det, die als CSV‐Datei exportiert wurden.  Das  Programm  BIPLOT  wurde  durch  die  Arbeitsgruppe  Methoden  und  Evaluation  (MAGMA, www.methoden‐evaluation.de) der Philipps‐Universität Marburg, Fachbereich  Erziehungswissenschafte entwicklt und durch den Fachbereich Informatik realisiert.  Die Funktion: Falldarstellung nach Variablen  Jeder in der Eingabedatei enthaltene Fall wird in BIPLOTs Koordinatensystem eingetra‐ gen. Liegen mehrere Fälle an der exakt gleichen Position im Koordinatensystem, so wer‐ den alle Fälle ab dem zweiten durch konzentrische Kreise um die Position im Koordina‐ tensystem  dargestellt.  Jeder  neue  konzentrische  Kreis  erhält  dabei  einen  größeren  Durchmesser als der Vorhergehende: 

  Abbildung 2: Ausschnitt aus einem BIPLOT 

Um  die  Übersichtlichkeit  zu  verbessern,  werden  die  konzentrischen  Kreise  bei  zuneh‐ mender Distanz zur Mitte mit zunehmender Helligkeit dargestellt.  Stand: 21.07.09 



In  Abb.  2,  einem  Ausschnitt  aus  einem  BIPLOT,  befinden  sich  die  meisten  Fälle  in  der  ersten Rubrik der X‐Achse. In der oberen rechten Ecke der Abbildung ist hingegen ledig‐ lich ein Fall verortet.  Um eine weitere Dimension in die Analyse der Daten einzubeziehen, lassen sich alle Fäl‐ le,  die  in  einer  beliebigen  weiteren  Variablen,  z.B.  dem  Geschlecht,  einen  identischen  Wert aufweisen, einfärben: 

  Abbildung 3: BIPLOT mit aktivierter Filtervariable 

In Abbildung 3 wurden alle Fälle, die weibliche Probanden repräsentieren, orange einge‐ färbt.  Lizenz  Das  Programm  BIPLOT  darf  frei  verwendet  werden.  Bei  der  Verwendung  einer  durch  BIPLOT  generierten  Grafik  ist  der  Name  des  Programms  sowie  die  Internetadresse  www.methoden­evaluation.de auf der Folie, in der Bildbeschreibung, als Fußnote oder an  anderer gleichwertiger Stelle anzugeben. Darüber hinaus ist die Arbeitsgruppe MAGMA  sehr daran interessiert, etwas über den Einsatz des Programms zu erfahren und bittet  um eine kurze E‐Mail mit einer Beschreibung des Einsatzes von BIPLOT und, wenn mög‐ lich, einem Bildschirmfoto/einer exportierten Grafik. Bitte senden Sie diese Mail an in­ fo@methoden­evaluation.de. 

BIPLOT starten: Erste Schritte  Systemvoraussetzungen  BIPLOT ist in JAVA geschrieben und somit prinzipiell unter allen Betriebssystemen lauf‐ fähig, für die JAVA verfügbar ist. In viele moderne Betriebssysteme (etwa Windows, MAC  Stand: 21.07.09 



OS und Linux) ist JAVA bereits integriert, so dass keine vorbereitenden Arbeitsschritte  notwendig sind. Ist JAVA nicht installiert, kann es über die Internetseite www.java.com  kostenfrei bezogen werden.  Starten von BIPLOT  Zum Start von BIPLOT muss die Programmdatei mit einem Doppelklick aufgerufen wer‐ den.  Startet  das  Programm  daraufhin  nicht,  so  kann  es  alternativ  mit  dem  Befehl   java –jar BIPLOT.jar über die Kommandozeile gestartet werden.  Die Eingabedatei  Die  Eingabedatei,  welche  die  zu  visualisierenden  Daten  enthält,  muss  im  CSV‐Format  (durch Kommata oder Semikola getrennte Daten) vorliegen. Jede Zeile muss einen Fall  und jede Spalte eine Variable enthalten. Die erste Zeile muss die Variablennamen enthal‐ ten.  Daten, die in SPSS oder Excel vorliegen, können mit Hilfe der Exportfunktion ohne Wei‐ teres in diesem Format abgespeichert werden. 

  Abbildung 4: Ausschnitt aus einer Eingabedatei (hier: Ansicht in Excel) 

Einlesen der Eingabedatei  Um  die  vorbereitete  CSV‐Datei  in  BIPLOT  einzulesen,  muss  im  Menü  Datei  der  Menü‐ punkt Öffnen ausgewählt und dann wie gewohnt weiter verfahren werden. 

Die Hauptfunktionen von BIPLOT  Zwei Variablen visualisieren  Nach dem Einlesen der Eingabedatei kann über die Drop‐Down‐Menüs im linken unte‐ ren Teil des Programmfensters ausgewählt werden, welche Variablen zur Visualisierung  verwendet werden sollen.  

  Abbildung 5: Drop­Down­Menüs zur Variablenauswahl 

Stand: 21.07.09 



Über das Menü x­Achse wird bestimmt, welche Variable in der Horizontalen abgetragen  wird. Dementsprechend wird über das Menü y­Achse die Variable die in der Vertikalen  darzustellende  Variable  ausgewählt.  Durch  einen  Klick  auf  den  Button  OK  werden  die  Daten anhand der ausgewählten Variablen dargestellt.  Filtervariable: ausgewählte Fälle einfärben  Eine weitere Variable kann in die Darstellung einbezogen werden, indem alle Fälle, die  bei  dieser  dritten  Variable  den  gleichen  Wert  aufweisen,  in  der  gleichen  Farbe  darge‐ stellt  werden.  Zur  Einfärbung  muss  zunächst  im  Menü  Filter  im  mittleren  unteren  Teil  des Programmfensters die Filtervariable ausgewählt werden.    Abbildung 6: Menü zur Auswahl einer Filtervariablen 

Nach  der  Auswahl  der  Filtervariablen  kann  über  das  Menü  Wert  eingestellt  werden,  welche Werte der Fallauswahl zu Grunde gelegt werden sollen. In diesem Menü sind alle  Werte  verfügbar,  die in  der  Eingabedatei für  die gewählte Variable enthalten  sind1.  Im  Menü Farbe kann schließlich ausgewählt werden, in welcher Farbe die zuvor ausgewähl‐ ten Fälle eingefärbt werden sollen. Das Ergebnis der Filterung ist in Abbildung 3 darge‐ stellt.  Darstellung absoluter oder relativer Häufigkeiten  In der Standardeinstellung wird zur Darstellung der Fälle die Funktion Lineare Auswer­ tung  genutzt,  d.h.  jeder  im  eingelesenen  Datensatz  enthaltene  Fall  wird  durch  einen  Punkt bzw. Kreis repräsentiert (absolute Häufigkeiten). Über das Menü Ansicht kann die  Darstellung  auf  Prozentuale  Auswertung  umgestellt  werden.  In  dieser  Einstellung  wird  die prozentuale Verteilung der Fälle dargestellt, d.h. 1 Punkt/Kreis entspricht dann (ge‐ rundet) 1% der Fälle (relative Häufigkeiten). 

 

Abbildung  7:  Ausschnitt  aus  der  Visualisierung  des  gleichen  Datensatzes,  links  mit  absoluten  Häufigkeiten  (Lineare Auswertung), rechts mit relativen Häufigkeiten (Prozentuale Auswertung) 

                                                         1 Eine Fallauswahl mit logischen Operatoren, etwa größer oder ungleich ist in der aktuel‐

len Programmversion nicht möglich.  Stand: 21.07.09 



Achsenbeschriftungen  Um  die  Beschriftung  der  Achsen  einzublenden,  muss  im  Menü  Ansicht  der  Menüpunkt  Skalabeschriftung anzeigen ausgewählt werden. Die Beschriftungen werden der eingele‐ senen Datei entnommen und entsprechen den Werten der Variable.  Anzeige der Häufigkeiten  Über  das  Menü  Ansicht  kann  mit  Hilfe  des  Menüpunkts  Häufigkeiten  anzeigen  eine  Be‐ schriftung der Datenpunkte eingeblendet werden. Hier wird jeweils dargestellt, wie vie‐ le Fälle auf dem jeweiligen Punkt liegen. 

  Abbildung 8: Eingeblendete Häufigkeiten 

Leeren Wertebereich ausblenden  Im Menü Ansicht kann durch Auswahl des Punktes Leeren Wertebereich ausblenden die  Anzeige auf die tatsächlich vorhandenen Fälle im Koordinatensystem zentriert werden.  Die Bereiche der Matrix, in denen keine Fälle liegen, werden ausgeblendet. Die Fälle am  linken und am unteren Rand des Wertebereichs wandern auf die y‐ bzw. die x‐Achse, die  Fälle am rechten und am oberen Rand der Darstellung bilden die neue rechte bzw. obere  Grenze der Darstellung.  Export der Auswahl  Für eine weitere Analyse der Daten ist es möglich, interessierende Teile des Koordina‐ tensystems  wieder  in  eine  CSV‐Datei  zu  exportieren,  um  sie  in  einem  anderen  Pro‐ gramm, etwa SPSS oder Systat, zu bearbeiten.  Daten werden ausgewählt, indem bei gedrückter Umschalttaste (Großschreibung) in das  Zentrum der auszuwählenden Kreisvisualisierung geklickt wird. Durch einen roten Kreis  wird  dargestellt,  dass  die  entsprechenden  Werte  ausgewählt  wurden.  Die  Auswahl  gilt  immer für alle Werte, die an der gleichen Stelle des Koordinatensystems liegen (Daten‐ gruppen), also all jene, die konzentrisch um den ausgewählten Punkt herum dargestellt  werden. Bei gedrückter Umschalttaste können beliebig viele Datengruppen ausgewählt  werden. 

  Abbildung 9: Zwei ausgewählte Datengruppen (rot markiert) 

Stand: 21.07.09 



Um die Auswahl von Datengruppen wieder aufzuheben, gibt es zwei Möglichkeiten:  •



Um  die  Auswahl  einer  einzelnen  Datengruppe  gezielt  rückgängig  zu  machen,  muss  mit  gleichzeitig  gedrückter  alt‐Taste  in  das  Zentrum  der  betreffenden  Da‐ tengruppe (rote Markierung) geklickt werden.  Um die gesamte Auswahl auf einmal aufzuheben, muss bei gedrückter ctrl‐Taste  an eine beliebige Stelle in der Visualisierung geklickt werden. 

Die so ausgewählten Daten werden über den Menüpunkt  Auswahl als .csv speichern im  Menü Datei aus BIPLOT exportiert und können unmittelbar weiterbearbeitet werden.  Export der BIPLOT‐Grafik  Über den Menüpunkt Als .png speichern im Menü Datei kann die Darstellung in eine PNG‐ Grafikdatei  exportiert  werden.  Dieses  Standarddateiformat  kann  problemlos  in  allen  gängigen Programmen (z.B. Word, PowerPoint etc.) weiterverwendet und eingebunden  werden.  Die exportierte Grafik enthält immer Achsenbeschriftungen. Sowohl die Werte (Analog  zur Funktion Skalabeschriftung anzeigen) als auch der Name der dargestellten Variable  sind enthalten.  Wertebereich der Anzeige  Am  unteren  Bildschirmrand  sind  Informationen  zum  Wertebereich  der  aktuell  darge‐ stellten  Grafik  eingeblendet.  Die  linke  Ausgabe  bezieht  sich  auf  die  x‐Achse  (waage‐ recht), die rechte entsprechend auf die y‐Achse (senkrecht).    Abbildung 10: Informationen zum Wertebereich der Grafik 

Verändern der Darstellung  Die  Möglichkeiten  zur  Veränderung  der  Darstellung  helfen  dabei,  eine  möglichst  über‐ sichtliche und informative Grafik zu erstellen. Folgende Optionen stehen dabei zur Ver‐ fügung:  Liniendicke  Mit  Hilfe  des  Reglers  Liniendicke  (am  unteren  Fensterrand)  kann  die  Dicke  der  Linien  bzw.  Punkte  in  der  Visualisierung  verändert  werden.  Je  weiter  der  Regler  nach  rechts  geschoben wird, desto dicker werden die Linien dargestellt und umgekehrt. 

  Abbildung 11: Die gleiche Darstellung mit unterschiedlicher Liniendicke 

Stand: 21.07.09 



Radius  Der Regler Radius (rechts neben dem Regler Liniendicke) beeinflusst den Abstand zwi‐ schen den Kreisen. Wird der Regler nach rechts bewegt, so nimmt der Abstand zu (der  Radius eines jeden Kreises wird linear vergrößert), in linker Richtung nimmt er ab. 

  Abbildung 12: Die gleiche Darstellung mit unterschiedlichen Radiuswerten 

Zoom  Um  die  gesamte  BIPLOT‐Grafik  größer  oder  kleiner  anzuzeigen,  kann  der  am  unteren  Fensterrand befindliche Regler Zoom verwendet werden. Wird er nach rechts bewegt, so  wird die Darstellung vergrößert, wird er nach links bewegt, so wird sie verkleinert.  Anzeige auf dem Bildschrim/dem Beamer  Im Menü Ansicht kann über die Menüpunkte Anzeige auf dem Bildschirm und Anzeige auf  dem  Beamer  auf  fest  hinterlegte  Voreinstellungen  zurückgegriffen  werden.  Die  hinter‐ legten Einstellungen wurden für die Darstellung auf dem jeweiligen Ausgabegerät opti‐ miert (für die Anzeige auf dem Beamer wird etwa eine größere Linienstärke eingestellt).  Auch  nach  dem  Aufrufen  einer  Voreinstellung  kann  die  Darstellung  mit  Hilfe  der  oben  beschriebenen Regler weiter verändert werden. 

Stand: 21.07.09