Angewandte Statistik mit R

Reiner Hellbrück Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage B 374545 GABLER Inha...
Author: Meta Albert
1 downloads 0 Views 238KB Size
Reiner Hellbrück

Angewandte Statistik mit R Eine Einführung für Ökonomen und Sozialwissenschaftler 2., überarbeitete Auflage

B 374545

GABLER

Inhaltsverzeichnis Vorwort zur zweiten Auflage Tabellenverzeichnis 1 Einleitung 1.1 Gegenstand 1.2 Aufbau 2 Datenerhebung - ganz praktisch 2.1 Einleitung 2.2 Software 2.2.1 Moodle und LimeSurvey 2.2:2 Statistikpaket R 2.3 Erhebungsplan 2.3.1 Grundlagen 2.3.2 Beispiel 2.4 Ziehen einer Stichprobe 2.4.1 Grundlagen 2.4.2 Beispiel 2.5 Rohdaten auslesen 2.5.1 Grundlagen 2.5.2 Beispiel . .< ' 2.6 Daten in Statistikprogramm einlesen 2.6.1 Grundlagen 2.6.2 Beispiel 2.7 Plausibilitätsprüfung 2.7.1 Grundlagen 2.7.2 Beispiel 1 2.7.3 Einfache Datensätze 2.7.4 Beispiel 2 2.7.5 Komplexe Datensätze 2.7.6 Beispiel 3 2.8 Abschließende Bemerkungen 2.9 Kontrollfragen

v xvii 1 1 5 9 9 9 9 10 12 12 13 14 14 15 15 15 16 16 16 18 20 20 20 21 22 23 25 26 27

viii

INHALTSVERZEICHNIS 2.10 Aufgaben

29

3 Datenaufbereitung 31 3.1 Einleitung 31 3.2 Graphische Methoden 32 3.2.1 Grundlagen 32 3.2.2 Beispiele 34 3.3 Absolute Häufigkeitsverteilung 38 3.3.1 Grundlagen 38 3.3.2 Beispiel 1 \ .-.-.38 3.3.3 Maßzahlen 39 3.3.4 Beispiel 2 40 3.4 Relative Häufigkeitsverteilung 42 3.4.1 Grundlagen 42 3.4.2 Beispiel 1 43 3.4.3 Maßzahlen = 44 3.4.4 Beispiel 2 45 3.5 Verteilungsfunktion und Quantile 45 3.5.1 Verteilungsfunktion 45 3.5.2 Quantile 47 3.5.3 Verteilungsfunktion und Quantile 50 3.6 Histogramme .\ 52 3.6.1 Absolute Häufigkeit 52 3.6.2 Durchschnittliche Häufigkeitsdichte 53 3.7 Kontingenztabelle 56 3.7.1 Gemeinsame Verteilung 56 3.7.2 Randverteilungen 57 3.7.3 Bedingte Verteilung und statistische Unabhängigkeit . . . 58 3.8 Lorenz-Kurve 59 3.8.1 Grundlagen 59 3.8.2 Beispiel 60 3.8.3 Gini-Koeffizienten 63 3.9 Abschließende Bemerkungen 65 3.10 Kontrollfragen 66 3.11 Aufgaben 67 3.A Nützliches zu Maßzahlen* 70 3.B Logarithmische Skala* 70 4

Statistisches Testen 4.1 Einleitung 4.2 Binomialverteilung 4.2.1 ' Grundlagen 4.2.2 Beispiel 4.3 Test 4.3.1 Zweiseitige Fragestellung 4.3.2 Einseitige Fragestellung - Version 1

73 73 74 74 76 77 77 80

INHALTSVERZEICHNIS

4.4 4.5 4.6 4.A

ix

4.3.3 Einseitige Fragestellung - Version 2 4.3.4 Fehler 1. Art 4.3.5 Beispiel Abschließende Bemerkungen Kontrollfragen Aufgaben Wirkungsanalyse* 4.A.1 Grundlagen v 4.A.2 Test ••_•_•• 4.A.3 Beispiel 4.A.4 Abschließende Bemerkungen

5 Chi-Quadrat Tests 5.1 Einleitung 5.2 Unabhängigkeitstest 5.2.1 Grundlagen 5.2.2 Beispiel 5.3 Anpassungstest 5.3.1 Grundlagen 5.3.2 Beispiel 5.4 Homogenitätstest 5.4.1 Grundlagen 5.4.2 Beispiel 5.5 Abschließende Bemerkungen 5.6 Kontrollfragen 5.7 Aufgaben 6 Wahrscheinlichkeitsräume 6.1 Einleitung 6.2 Definitionsmenge 6.3 Wahrscheinlichkeitsraum der Grundgesamtheit 6.4 Wahrscheinlichkeitsraum der Stichprobe 6.5 Wichtige Zusammenhänge und Begriffe 6.5.1 Rechenregeln 6.5.2 Bedingte Wahrscheinlichkeit 6.5.3 Stochastische Unabhängigkeit 6.5.4 Multiplikationssatz 6.5.5 Satz von der totalen Wahrscheinlichkeit 6.5.6 Satz von Bayes 6.5.7 Diskreter Wahrscheinlichkeitsraum 6.6 Abschließende Bemerkungen 6.7 Kontrollfragen 6.8 Aufgaben

82 83 83 86 87 88 91 91 92 93 94



95 95 96 96 98 101 101 102 103 103 105 107 107 108 111 111 112 114 117 119 119 120 120 121 121 122 124 125 125 126

INHALTSVERZEICHNIS Abbildungen von Ergebnisräumen 7.1 Einleitung 7.2 Meßbarkeit und Zufallsvariable 7.2.1 Meßbarkeit 7.2.2 Zufallsvariablen 7.3 Verteilungsfunktion und Dichte 7.3.1 Verteilungsfunktion 7.3.2 Dichte 7.4 Maßzahlen 7.4.1 Erwartungswert ".""." 7.4.2 Kovarianz, Varianz und Standardabweichung 7.4.3 Standardisierung 7.5 Abschließende Bemerkungen 7.6 Kontrollfragen 7.7 Aufgaben

129 129 130 130 131 132 132 134 135 135 136 137 137 138 139

Einfache Korrelationsanalyse 8.1 Einleitung 8.2 Korrelation 8.2.1 Wahrscheinlichkeitstheorie 8.2.2 Empirische Korrelation (Bravais-Pearson) 8.2.3 Berechnung bei Wertepaaren 8.2.4 Beispiele 8.3 Tests bei kardinalen Merkmalen 8.3.1 Stetige normalverteilte Zufallsvariablen 8.3.2 Stetige nicht-normalverteilte Zufallsvariablen 8.4 Test bei ordinalen Merkmalen: Bell-Doksum Test 8.4.1 Test 8.4.2 Beispiel 8.5 Abschließende Bemerkungen 8.6 Kontrollfragen 8.7 Aufgaben 8.A Weitere Tests*

141 141 143 143 143 \ 144 145 147 147 152 158 158 159 163 164 164 166

Multivariate Korrelationsanalyse* 9.1 Einleitung 9.2 Vergleich zweier Korrelationen 9.2.1 Grundlagen 9.2.2 Beispiel 9.3 Partielle Korrelation 9.3.1 Grundlagen 9.3.2 Beispiel 1 9.3.3 Test 9.3.4 Beispiel 2 9.4 Zusammenhang zwischen mehreren Merkmalen 9.4.1 Grundlagen

169 169 170 170 171 172 172 173 173 174 174 174

INHALTSVERZEICHNIS

9.5

9.6

9.7

9.8

9.9 9.10 9.11

9.4.2 Beispiel Globaltest 9.5.1 Test 9.5.2 Beispiel Multiple Vergleiche 9.6.1 Test 9.6.2 Beispiel Multiple Korrelation 9.7.1 Grundlagen 9.7.2 Beispiel 1 9.7.3 Test 9.7.4 Beispiel 2 Kanonische Korrelation 9.8.1 Grundlagen 9.8.2 Beispiel 1 9.8.3 Test 9.8.4 Beispiel 2 Abschließende Bemerkungen Kontrollfragen Aufgaben

10 Daten- und Distanzmatrix 10.1 Einleitung 10.2 Distanzmatrizen 10.2.1 Definition und Eigenschaften 10.2.2 Skalierung 10.3 Kardinale Merkmale 10.3.1 Intervall- und Verhältnisskala 10.3.2 Manhattan-Distanz 10.4 Ordinale Merkmale '. 10.4.1 Grundlagen 10.4.2 Beispiel 10.5 Nominale Merkmale 10.5.1 Grundlagen 10.5.2 Beispiel 10.6 Binäre Merkmale 10.6.1 Grundlagen 10.6.2 Beispiel 10.7 Abschließende Bemerkungen 10.8 Kontrollfragen 10.9 Aufgaben

xi

\ .-.-.-

176 177 177 177 178 178 180 183 183 183 184 185 186 186 187 188 189 190 191 192 193 193 195 195 196 196 196 198 202 202 203 206 206 206 207 207 209 210 211 211

xii

INHALTSVERZEICHNIS

11 Clusteranalyse 215 11.1 Einleitung 215 11.2 Klassifikation 218 11.2.1 Klassifikationstypen 218 11.2.2 Konstruktionsverfahren 219 11.3 PAM 220 11.3.1 Grundlagen 220 11.3.2 Beispiel 1 220 11.3.3 Bestimmung der Medoiden* 224 11.3.4 Beispiel 2 \ .-.-.228 11.3.5 Isolierte Cluster 228 11.3.6 Beispiel 3 229 11.3.7 Überprüfung der Klassenbildung 230 11.3.8 Beispiel 4 232 11.3.9 Bestimmung der Klassenzahl 233 11.3.10 Beispiel 5 233 11.4 FANNY 233 11.4.1 Grundlagen 233 11.4.2 Beispiel 1 235 11.4.3 Partition und Überdeckung 236 11.4.4 Beispiel 2 ,237 11.4.5 Überprüfung der Klassenbildung und Klassenanzahl . . . 2 4 0 11.4.6 Beispiel 3 241 11.5 MONA 241 11.5.1 Grundlagen 241 11.5.2 Beispiel 1 242 11.5.3 Assoziationsmaß 244 11.5.4 Beispiel 2 245 11.5.5 Missings 248 11.5.6 Beispiel 3 248 11.6 Abschließende Bemerkungen 249 11.7 Kontrollfragen 250 11.8 Aufgaben 251 12 Einfache Regression 12.1 Einleitung 12.2 Einfaches klassisches Regressionsmodell 12.2.1 Grundlagen 12.2.2 Beispiel 12.3 Regressionsfunktion 12.3.1 Grundlagen 12.3.2 Beispiel

12.4 Prognose 12.4.1 Grundlagen 12.4.2 Beispiel 1 12.4.3 Problem

253 253 254 254 257 259 259 260

262 262 262 263

INHALTSVERZEICHNIS 12.4.4 Beispiel 2 12.5 Bestimmtheitsmaß 12.5.1 Grundlagen 12.5.2 Beispiel 12.6 Vollständiges Modell 12.7 Tests 12.7.1 Grundlagen 12.7.2 Beispiel 12.8 Abschließende Bemerkungen 12.9 Kontrollfragen \ .-.-.12.10Aufgaben 12.A Beweis der Streuungszerlegungsformel* 12.B Erwartungswerte der KQ-KoefRzienten* 12.C Standardisierung* 12.C.1 Erwartungswert 12.C.2 Varianz 12.D Partielle Korrelation* A Theoretische Verteilungen A.l Einleitung A.2 Diskrete Verteilungen A.2.1 Gleichverteilung* A.2.2 Bernoulli- und Binomialverteilung A.2.3 Hypergeometrische Verteilung* A.2.4 Poisson-Verteilung* A.2.5 Geometrische Verteilung* A.3 Stetige Verteilungen A.3.1 Rechteckverteilung A.3.2 Exponentialverteilung* A.3.3 Normalverteilung A.3.4 Chi-Quadrat-Verteilung A.3.5 t-Verteilung A.3.6 F-Verteilung B Matrizenrechnung B.l Einleitung B.2 Matrizen B.2.1 Definition B.2.2 Vektoren B.2.3 Typen B.3 Verknüpfungen B.3.1 Gleichheitsrelation B.3.2 Addition B.3.3 Skalare Multiplikation B.3.4 Produkt zweier Matrizen B.3.5 Multiplikation von Vektoren

xiii 263 265 265 267 269 270 270 272 274 275 276 278 279 280 280 280 282



:

285 285 286 286 287 288 289 291 293 293 295 296 301 302 305 309 309 310 310, 310 311 312 312 313 314 316 318

xiv

INHALTSVERZEICHNIS B.4 Unabhängigkeit, Rang, Determinante, Inverse B.4.1 Lineare Unabhängigkeit B.4.2 Rang B.4.3 Determinante B.4.4 Inverse B.5 Eigenwerte, Eigenvektoren und Spur B.5.1 Definitionen B.5.2 Rechenregel B.5.3 Beispiele

C Befehle in R C.l Einleitung C.2 Grundlagen C.3 Daten einlesen, Objekte speichern und laden C.4 Dateneigenschaften C.5 Manipulation eingelesener Datensätze C.6 Graphik C.7 Suchen und Finden C.8 Besonderheiten in Windows C.9 Fehlermeldungen Anmerkungen und Lösungen

319 319 319 320 322 325 325 325 325 327 327 328 330 332 334 335 336 339 339 . 342

Glossar

355

Literaturverzeichnis

359

Stichwortverzeichnis

361