Analyse von Kontingenztafeln

Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abh¨ angigkeit bzw. die Inhomogenit¨ at der Verteilungen kategori...
Author: Annegret Voss
1 downloads 3 Views 157KB Size
Analyse von Kontingenztafeln Mit Hilfe von Kontingenztafeln (Kreuztabellen) kann die Abh¨ angigkeit bzw. die Inhomogenit¨ at der Verteilungen kategorialer Merkmale beschrieben, analysiert und getestet werden. Die Einbeziehung zweier oder mehrerer evtl. nur nominalskalierter Merkmale in eine Analyse ist in den Sozialwissenschaften eine h¨ aufig auftretende Situation (z. B. Geschlecht, Art des Schulabschlusses, Parteienpra¨ferenz).

1

In vielen F¨allen – z. B. bei Sekund¨ aranalysen – liegen nicht die Rohdaten, sondern bereits H¨ aufigkeitstabellen vor. In SPSS ko¨nnen derartige Datensa ¨tze eingegeben und mit Hilfe von Gewichtungen analysiert werden. Vor der bi- oder multivariaten Analyse sind die beteiligten kategorialen Merkmale zun¨ achst einzeln – univariat – zu untersuchen.

2

Univariate Analyse kategorialer Daten Deskriptiv werden Tabellen (z.B. Ha ¨ufigkeitstabellen) und Grafiken (z.B. Balken- und Kreisdiagramme) eingesetzt. Als deskriptive Kenngro ¨ße fu ¨r den Zentralwert der Verteilung kommt der Modalwert in Betracht. Als deskriptives Maß fu ¨r die Variabilita ¨t einer kategorialen Verteilung wird beispielsweise die Devianz eingesetzt. Diese Kenngr¨oße bewertet die St¨ arke der Konzentration einer kategorialen Verteilung.

3

Sei X ein kategoriales Merkmal mit den k m¨oglichen Auspra¨gungen a1 , . . . , ak . Fu ¨r eine Stichprobe vom Umfang n bezeichne hj die absoluten und fj = hj /n die relativen H¨ aufigkeiten des Auftretens von aj . Dann heißt DX = −2

k X

ln(hj /n) · hj = −2

j=1

k X

ln(fj ) · hj

j=1

Devianz. Dabei bezeichnet ln(fj ) den natu ¨rlichen Logarithmus (ln(0) · 0 wird Null gesetzt! Nicht realisierte Auspra¨gungen liefern also keinen Beitrag!).

4

In die Berechnung der Devianz gehen also nur die H¨ aufigkeiten der Auspr¨ agungen und nicht die Auspr¨agungen selbst ein. Damit ist die Devianz ein Streuungsmaß, das bereits fu ¨r nominalskalierte Merkmale berechnet werden kann. Da die Devianz DX bei sonst gleicher Verteilung mit wachsendem Stichprobenumfang wa ¨chst, wird ha¨ufig die relative Devianz DX dX = n verwendet.

5

Beispiel: In einer Umfrage unter n = 100 StudentInnen wurden die dichotomen Merkmale Geschlecht G und Motivation M fu ¨r das Studium der Sozialwissenschaften erhoben. Dabei ergaben sich die Ha ¨ufigkeitsverteilungen: Motivation M

Geschlecht G aG j

hG j

fjG

aM j

hM j

fjM

weiblich

50

0.5

motiviert

100

1

ma¨nnlich

50

0.5

nicht motiviert

0

0

6

Fu ¨r die Devianz DG ergibt sich DG = −2

2 X

ln(fjG ) · hG j

j=1





= −2 ln(1/2) · 50 + ln(1/2) · 50 = 100 × 2 × ln(2) ≈ 138.6 und fu ¨r DM erhalten wir DM

= −2

2 X

ln(fjM ) · hM j

j=1

= −2(ln(1) · 100 + ln(0) · 0) = 0 7

Damit gilt fu ¨r die relative Devianz dG = 2 × ln(2) ≈ 1.386

und

dM = 0 .

Die Devianz ist in der Lage, die Fehlerwahrscheinlichkeit bei der Vorhersage einer kategorialen Variablen zu erfassen. Nimmt die Variable mit Sicherheit nur eine Auspra¨gung an, dann ist – bei Verwendung dieser Auspr¨ agung – eine Voraussage ohne jeden Fehler m¨ oglich. Die Devianz fu ¨r derartige – entartete – Verteilungen ist Null. Das Merkmal Motivation ist ein Beispiel dafu ¨r.

8

Die gr¨oßte Unsicherheit besteht bei der Vorhersage dann, wenn jede der m¨ oglichen Auspr¨ agungen die gleiche H¨aufigkeit (Wahrscheinlichkeit) besitzt (also keinerlei Konzentration vorliegt). In diesem Fall gilt dX = 2 × ln(k). Das Merkmal Geschlecht (k = 2) ist ein Beispiel fu ¨r diese Situation. Egal welche der beiden Auspra ¨gungen als Vorhersage verwendet wird, ergeben sich stets 50% Fehlprognosen.

9

Zur Bewertung und zum Vergleich von Anteilswerten (Wahrscheinlichkeiten) werden speziell im englischen Sprachraum Odds verwendet. Odds beschreiben die Chancen des Eintretens eines Ereignisses in Relation zu seinem Nichteintreten. Befinden sich in einer Population z.B. 80% StudentInnen, die sich fu ¨r Statistik interessieren, und 20%, die sich nicht fu ¨r Statistik interessieren, dann betragen die Odds (Chancen), zufa¨llig eine Studentin/einen Studenten aus dieser Population auszuw¨ahlen, die/der sich fu ¨r Statistik zu interessiert, 80 : 20 = 4 (vier zu eins).

10

Ein Wert der Odds von 1 bedeutet also eine Chance von 50:50 (eins zu eins). Werte der Odds gr¨ oßer als 1 bedeuten, dass die Chance des Eintretens gro¨ßer ist als die des Nichteintretens (z.B. 80:20). Werte der Odds kleiner als 1 bedeuten, dass die Chance des Eintretens kleiner ist als die des Nichteintretens (z.B. 40:60).

11

Als Basistechnik der schließenden Statistik kommt bei der Analyse nominalskalierter Daten der χ2 –Anpassungstest zum Einsatz. Er beschreibt und testet die Abweichung der empirischen Verteilung eines kategorialen Merkmals von einer hypothetisch unterstellten Verteilung. Die Testgr¨oße t=

k X (hj − npj )2

npj

j=1

des χ2 –Anpassungstest stellt fu ¨r eine vorliegende empirische Verteilung mit den beobachteten absoluten H¨aufigkeiten hj deren χ2 –Abstand zu der hypothetisch unterstellten Verteilung mit den Wahrscheinlichkeiten pj dar.

12

Hinweise: Da wir von kategorialen Merkmalen ausgehen, entf¨allt h¨aufig eine Klasseneinteilung; diese ist in natu ¨rlicher Weise durch die Kategorien gegeben. Evtl. ist eine Vergr¨ oberung notwendig bzw. sinnvoll, wenn viele m¨ ogliche Auspr¨ agungen vorliegen. In SPSS kann die hypothetisch unterstellte Verteilung mit Hilfe der Wahrscheinlichkeiten pj , der erwarteten absoluten Ha ¨ufigkeiten npj oder der entsprechenden Prozentsa¨tze vorgegeben werden. Bei kleineren Stichprobenumf¨angen sollte von der M¨oglichkeit der exakten Berechnung der ¨ Uberschreitungswahrscheinlichkeit Gebrauch gemacht werden.

13

Im Spezialfall eines dichotomen Merkmals sollte als Anpassungstest der Binomialtest verwendet werden. Dieser ist fu ¨r Merkmale mit nur zwei Auspra ¨gungen a¨quivalent zum entsprechenden χ2 –Anpassungstest, wenn jeweils die exakten ¨ Uberschreitungswahrscheinlichkeiten verwendet werden.

14

Nach Ablehnung der Nullhypothese beim χ2 –Anpassungstest interessiert h¨aufig die Frage, fu ¨r welche der m¨oglichen Auspra¨gungen des untersuchten kategorialen Merkmals signifikante Unterschiede zwischen den beobachteten und den hypothetisch unterstellten (erwarteten) absoluten Ha ¨ufigkeiten vorliegen. Dies kann durch Serien von post hoc Tests gekl¨art werden. Zum Einsatz kommen zwei eng verwandte Techniken: • die Konfigurationsfrequenzanalyse (KFA), die die Summanden der χ2 -Statistik einzeln untersucht und testet (vgl. z.B. Krauth/Lienert 1973) • Tests der standardisierten Residuen 15

Unter der Nullhypothese sind die Summanden der Testgro¨ße des χ2 –Anpassungstests asymptotisch χ2 –verteilt mit einem Freiheitsgrad. Fu onnen also ¨r die Entscheidungsfindung k¨ ¨ Uberschreitungswahrscheinlichkeiten, die gem¨aß dieser Verteilung berechnet wurden, oder entsprechende Quantile dieser Verteilung verwendet werden. Da in der Regel Serien von Tests – evtl. fu agungen des untersuchten ¨r alle Auspr¨ Merkmals – durchgefu ¨hrt werden, stellt sich bei diesem multiplen Testverfahren das Problem der Einhaltung eines vorgegebenen Signifikanzniveaus fu ¨r den Gesamttest (die gesamte Serie von Tests).

16

In der KFA werden dabei verschiedene konservative Strategien vorgeschlagen. Beispielsweise dividiert man das vorgegebene Signifikanzniveau α durch die Zahl der durchzufu ¨hrenden einzelnen Tests (Bonferroni–Korrektur) ¨ und vergleicht die Uberschreitungswahrscheinlichkeiten fu ¨r die einzelnen Tests jeweils mit diesem korrigierten Signifikanzniveau bzw. verwendet die Quantile mit diesem korrigierten Quantilsanteil.

17

Die standardisierten Residuen sind unter H0 asymptotisch normalverteilt. Mit Hilfe der Normalverteilung und entsprechend korrigierten Werten fu ¨r das Signifikanzniveau lassen sich zur KFA ¨ aquivalente Entscheidungsregeln formulieren.

18

Beispiel: In Statistik I untersuchten wir Daten u ¨ber benutzte Verkehrsmittel. Der χ2 –Anpassungstest fu ¨hrte bei einem Signifikanzniveau α = 0.05 zur Ablehnung der Nullhypothese Die Wahrscheinlichkeit fu ¨ r die Benutzung jedes der fu ¨ nf Verkehrsmittel ist pj = 1/5. Der Wert der χ2 –Statistik betr¨ agt 89.2, und die zugeh¨orige ¨ Uberschreitungswahrscheinlichkeit p ist praktisch Null. Dabei wurde fu ¨r die Berechnung der ¨ Uberschreitungswahrscheinlichkeit p die χ2 –Verteilung mit 5 − 1 = 4 Freiheitsgraden verwendet.

19

Fu ¨r die einzelnen Verkehrsmittel ergaben sich folgende absolute beobachtete (hj ) und erwartete (n · pj ) Ha¨ufigkeiten sowie Residuen (hj − n · pj ): hj

n · pj

Bahn

7

20

−13

Bus

9

20

−11

Flugzeug

29

20

9

PKW

53

20

33

Sonstige

2

20

−18

Summe:

100

100

0

Verkehrsmittel

20

hj − n · pj

Nach Ablehnung der (globalen) Nullhypothese sollen nun post hoc die Kategorien (Verkehrsmittel) lokalisiert werden, die einzeln signifikante Unterschiede zwischen der beobachteten und erwarteten H¨ aufigkeit aufweisen und damit die (globale) Ablehnung wesentlich verursachen. Wir setzen dazu die KFA ein, die in SPSS in diesem Zusammenhang nicht angeboten wird. Wir wollen fu ¨r den multiplen Test – also fu ¨r die Serie von Tests insgesamt – mit einem Signifikanzniveau α = 0.05 arbeiten. Da 5 einzelne Tests – fu ¨r jedes Verkehrsmittel – durchgefu ¨hrt werden sollen, ergibt sich mit der Bonferroni–Korrektur ein Signifikanzniveau α/5 = 0.01 fu ¨r jeden einzelnen Test der Serie. 21

Jeder Kategorie – hier jedem Verkehrsmittel – entspricht ein Summand (hj − n · pj )2 n · pj der Testgr¨oße t des χ2 –Anpassungstest. Unter der (globalen) Nullhypothese ist fu ¨r eine mathematische Stichprobe jede dieser Gr¨oßen asymptotisch χ2 –verteilt mit einem Freiheitsgrad. Wir k¨ onnen daher fu ¨r jede der 5 Kategorien die (lokale) Nullhypothese Es liegt kein signifikanter Unterschied zwischen der beobachteten und erwarteten H¨aufigkeit fu ¨ r diese Kategorie vor. mit Hilfe dieser Verteilung der Stichprobenfunktion testen. 22

Zur Entscheidungsfindung ben¨ otigen wir jeweils den Wert der Teststatistik, den wir dann mit dem 0.99–Quantil χ21,0.99 = 6.64 (entnommen aus einer entsprechenden Tafel, siehe Umdruck) der χ2 -Verteilung mit einem Freiheitsgrad vergleichen. Ist der Wert der Teststatistik gro¨ßer als 6.64, und ¨ damit seine Uberschreitungswahrscheinlichkeit kleiner als 0.01, lehnen wir die lokale Nullhypothese ab. Insgesamt ergibt sich das folgende Ergebnis:

23

Verkehrsmittel

(hj − n · pj )2 /npj

Abweichung signifikant

Bahn

8.45

ja

Bus

6.05

nein

Flugzeug

4.05

nein

54.45

ja

Sonstige

16.2

ja

Summe:

89.2

PKW

¨ Bei signifikanten Uberbesetzungen von Zellen spricht man in der KFA von Typen und bei signifikanten Unterbesetzungen von Antitypen. Das Merkmal PKW ist demnach ein Typ, und die Merkmale Bahn und Sonstige stellen Antitypen dar. 24