fh – management, communication & it
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 1
SPSS • Überblick – – – – – –
Grundlagen (Testvoraussetzungen) Mittelwertvergleiche (t-Test,..) Nichtparametrische Tests Korrelationen Regressionsanalyse .....
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 2
SPSS • Überblick – – – – –
..... Varianzanalyse Diskrimanzanalyse Faktorenanalyse Clusteranalyse
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 3
SPSS • Statistische Grundbegriffe – Voraussetzungen für die Anwendung eines statistischen Tests • Welches Skalenniveau hat die betreffende Variable ? • Falle es sich um eine intervallskalierte Variable handelt: Liegt Normalverteilung der Werte vor ? • Handelt es sich bei den zu vergleichenden Stichproben um unabhängige oder abhängige Stichproben ?
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 4
SPSS • Skalenniveau: – Nominal: Das nominale Skalenniveau ist das „unterste“ in der Typologie, da keine Voraussetzungen über Beziehungen zwischen den Werten erforderlich sind. Jeder Wert definiert eine einzelne Kategorie und dient lediglich als Label oder Name der Kategorie. – Ordinal: Wenn eine Rangordnung zwischen den Kategorien nach irgend einem Kriterium möglich ist, liegt eine ordinales Skalenniveau vor. – Metrisch: (Intervall- oder Verhältnisskala) Zusätzlich zur Ordnung haben intervallskalierte Messungen die Eigenschaft aussagefähige Abstände zwischen den Werten. Verhältnis-Skalen haben alle Ordnungs- und Abstandseigenschaften einer Intervallskala.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 5
SPSS • Skalenniveau/Empirische Relevanz
Skalenniveau Nominal Ordinal Intervall Verhältnis
Empirische Relevanz Keine Ordnung der Zahlen Differenz der Zahlen Verhältnisse der Zahlen
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 6
SPSS • Beispiele fürs Skalenniveau – Geschlecht: • 1 = männlich • 2 = weiblich • • •
gleichwertig wie 1 = weiblich 2 = männlich – nominalen Variable mit zwei Ausprägungen = dichotome Variable – --> nur Häufigkeitsauswertung
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 7
SPSS • Beispiele fürs Skalenniveau – Familienstand: • 1 = ledig • 2 = verheiratet • 3 = verwitwet • 4 = geschieden – nominal
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 8
SPSS • Beispiele fürs Skalenniveau – Rauchgewohnheiten: • 1 = Nichtraucher • 2 = mäßiger Raucher • 3 = starker Raucher • 4 = sehr starker Raucher --> Ordnungsrelation – ordinalskalierte Variable (Mittelwerte, Median)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 9
SPSS • Beispiele fürs Skalenniveau – monatliches Nettoeinkommen: • 1 = bis 1500 Euro • 2 = 1501 – 2500 Euro • 3 = über 2500 Euro --> ordinalskalierte Variable
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 10
SPSS • Beispiele fürs Skalenniveau – Intelligenzquotient
Rangordnung + Bedeutung von Differenzen → intervallskalierte Variable (Differenz des Intervalls)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 11
SPSS • Beispiele fürs Skalenniveau – Alter --> höchste Stufe der Skalierung Man kann sagen Gustav (60) ist doppelt als Max (30) Es sind dies alle intervallskalierte Variablen, die einen absoluten Nullpunkt besitzen.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 12
SPSS • Spezielle Lagermaße: – Mittelwert: Mittelwert zur Kennzeichnung zentraler Tendenzen der Daten – Median: der Median oder Zentralwert ist der Wert, der die geordneten Daten genau halbiert, d.h. 50% der Daten liegen oberhalb und 50% liegen unterhalb des Median. – Modus: der Modus ist der Wert mit der größten Häufigkeit in einem Datensatz – Varianz/Standabweichung: Varianz und Standardabweichung ermitteln die (quadrierten) Abweichungen jedes Einzelwertes vom Mittelwert
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 13
SPSS • Normalverteilung: – Die Anwendung zahlreicher Verfahren setzt voraus, die intervallskalierte Variablen betreffen, dass deren Werte normalverteilt sind. – Die ist eine Verteilung, bei der sich die meisten Werte um den Mittelwert gruppieren, während die Häufigkeiten nach beiden Seiten hin gleichmäßig abfallen. – Grafische Darstellung: Normalverteilungskurve = Gaußsche Glockenkurve
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 14
SPSS • Abhängigkeit und Unabhängigkeit der Stichproben – Zwei Stichproben sind dann voneinander abhängig, wenn jedem Wert der einen Stichprobe auf sinnvolle und eindeutige Weise genau ein Wert der anderen Stichprobe zugeordnet werden kann. – Meist handelt es sich dabei um den Fall, dass eine Messung zu mehreren Zeitpunkten durchgeführt wurde; die Werte zu den verschiedenen Zeitpunkten führen dann zu abhängigen Stichproben.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 15
SPSS • Übersicht über gängige Mittelwerttests – Intervallskalierte, normalverteilte Variablen (Mittelwert vergleichen)
Anzahl der miteinander zu vergleichenden Stichproben
Abhängigkeit
Test
2
unabhängig
t-Test nach Student
2
abhängig
t-Test für abhängige Stichproben
>2
unabhängig
Einfache Varianzanalyse
>2
abhängig
Einfache Varianzanalyse mit Meßwiederholungen
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 16
SPSS • Übersicht über gängige Mittelwerttests – Ordinalskalierte oder nichtnormalverteilte intervallskalierte Variablen (nichtparametrische Tests)
Anzahl der miteinander zu vergleichenden Stichproben
Abhängigkeit
Test
2
unabhängig
U-Test nach Mann und Whitney
2
abhängig
Wilcoxon Test
>2
unabhängig
H-Test nach Kruskal und Wallis
>2
abhängig
Friedman-Test
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 17
SPSS • Die Irrtumswahrscheinlichkeit p – Hypothesenformulierung: • Hypothese 0 (Nullhypothese): Die beiden Stichproben entstammen der gleichen Grundgesamtheit (d.h. Der Mittelwertsunterschied ist zufällig zustandegekommen) • Hypothese 1 (Alternativhypothese): Die beiden Stichproben entstammen verschiedenen Grundgesamtheiten (d.h. der Mittelwertsunterschied ist nicht zufällig zustandegekommen)
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 18
SPSS • Die Irrtumswahrscheinlichkeit p – Die Prüfstatistik hat Verfahren entwickelt, die aus den gegebenen Stichprobenwerten bzw. den daraus resultierenden Kennwerten nach bestimmten Formeln sogenannte Prüfgrößen berechnet. – Diese Prüfgrößen folgen bestimmten theoretischen Verteilungen (t-Verteilung, F-Verteilung, x2-Verteilung u.a.), welche die Berechnung der sogenannten Irrtumswahrscheinlichkeit erlauben. Es ist dies die Wahrscheinlichkeit, sich zu irren, wenn man die Nullhypothese verwirft und die Alternativhypothese annimmt.
Constantin von Craushaar | fh-management, communication & it| Statistik – Angewandte Statistik
Folie 19
SPSS • Die Irrtumswahrscheinlichkeit p
Irrtumswahrscheinlichkeit
Bedeutung
Symbolisierung
P > 0,05
Nicht signifikant
Ns
P