Klassifikation von Signifikanztests

Klassifikation von Signifikanztests • nach Verteilungsannahmen: – verteilungsabh¨angige = parametrische Tests – verteilungsunabh¨angige = nichtparam...

Author: Jesko Pfaff

22 downloads 1 Views 79KB Size

Report

Download PDF

Recommend Documents

Klassifikation von Azetabulumfrakturen

Klassifikation von Cyberbullying

Klassifikation von Daten Einleitung

Zur Klassifikation von Klassifikatoren

Automatische Klassifikation von Dokumenten. Kapitel 3: Automatische Klassifikation von Dokumenten. Klassifikationsproblem (Kategorisierung)

Klassifikation von Nizza Klassifikation von Nizza, 10. Auflage, Version 2014; Inkrafttreten mit

Statistische Tests (Signifikanztests)

A5 Automatische Klassifikation von Nomen nach Begriffstypen

WHO-Klassifikation zum Altern von Menschen

Wiener Klassifikation

Klassifikation von Sprachen zur Modellierung medizinischer Behandlungspfade

Mustergraphen: Klassifikation von multivariaten Zeitreihen auf Basis von Intervallsequenzen

3D-MicroMapping Crowdsourcing zur Klassifikation von 3D-Geodaten

Anlage. Inkrafttretensdatum. Text. Bundesrecht konsolidiert. Internationale Klassifikation von Waren

Versuchsanleitung zum Astrophysikalischen Praktikum Grobe Klassifikation von Sternspektren

Personendetektion und Klassifikation von Gehhilfsmitteln in Laserdaten. Jonathan Liebner

Verbesserung der histopathologischen Klassifikation von Nebennierentumoren durch genetische Differenzierung?

Klassifikation von Pflanzen anhand 3D-Laserscanner-Daten mittels maschineller Lernverfahren

Anhang Klassifikation der Wirtschaftszweige

Einteilung und Klassifikation maligner Tumoren

Die WHO-Klassifikation der intrakraniellen

Musterbeispiele Beschreibung und Klassifikation

ICF-CY Klassifikation

Paarweise Hierarchische Klassifikation

Klassifikation von Signifikanztests • nach Verteilungsannahmen: – verteilungsabh¨angige

= parametrische Tests

– verteilungsunabh¨angige = nichtparametrische Tests Bei parametrischen Tests werden im Modell Voraussetzungen u¨ber die Verteilung gemacht (z.B. NV) und Hypothesen u¨ber Parameter dieser Verteilung getestet. Bei nichtparametrischen Tests wird dagegen keine spezielle Verteilung vorausgesetzt (aber gegebenenfalls Voraussetzungen wie: ”stetige Verteilung”) – i.a. weniger m¨achtig, d.h. Unterschiede werden seltener aufgedeckt (H0 seltener abgelehnt) aber: – schw¨achere Voraussetzungen im Modell (bei Ablehnung Aussage u¨ber Population zuverl¨assiger) • nach der Anzahl der Stichproben: eine, zwei, k Stichprobe(n), Einstichprobenprobleme, . . . Einstichprobenprobleme: – der einfache t-Test – der Gauß-Test

1

• Art der Erhebung der Stichproben (abha¨ngig oder unabh¨angig): abh¨angige (gepaarte, verbundene) Stichprobe 2 (oder mehr) ZV X, Y u¨ber der Grundgesamtheit → n Versuche

ω → (X, Y )

(X1, . . . , Xn), (Y1, . . . , Yn) verbundene Stichproben An jedem Objekt werden mehrere Merkmale untersucht. Beispiele: – Blutdruck von Patienten vor und nach einer Behandlung mit einem Medikament – Einkommen einer Person in den Jahren 1996, 2000, 2002 – Bildung und Einkommen einer Person Unabha¨ngige Stichproben Zufallsvariablen X, Y u¨ber der Grundgesamtheit n1 + n2 Versuche;

X1, . . . , Xn1 , Y1, . . . , Yn2

(X1, . . . , Xn1 ), (Y1, . . . , Yn2 ) unabh¨angige Stichproben An jedem Objekt nur ein Merkmal untersucht. Beispiele: – Blutdruck von Patienten aus zwei unterschiedlich behandelten Gruppen mit unterschiedlichen Personen – Einkommen von M¨annern, Einkommen von Frauen

2

Einstichprobenprobleme Gauß-Test Der einfache t-Test Der Binomialtest (Einstichprobenproblem, nichtparametrisch) Anliegen: A ein zuf¨alliges Ereignis mit P (A) = p, p ∈ [0, 1], ¨ unbekannt. Uberpr u¨fung einer Hypothese u¨ber p anhand von n unabha¨ngigen Versuchen Die mathematische Stichprobe (X1, X2, . . . , Xn) beschreibt, in welchen der n Versuche das Ereignis A eingetreten ist (vgl. Bernoulli-Schema). ( 1 , falls A eingetreten X = 0 , falls A nicht eingetreten 1. Hypothesen: H0 : p = p0 HA : p 6= p0 (bei zweiseitiger Fragestellung) 2. Testgr¨oße: T =

n X

Xi = Hn(A)

i=1

T ∼ B(n; p)

binomialverteilt

3. H0 wird abgelehnt, wenn t < bα1 oder t > b1−α2 . bα1 , b1−α2 . . . Quantile der BV: B(n; p0) α = α1 + α2 . . . Signifikanzniveau. (In der Regel α1 = α2.) 3

Bemerkung zu großen n: Fu¨r große n sind die Quantile der BV ohne Computer kompliziert zu berechnen. gute Approximation durch die Normalverteilung; es gilt fu¨r Hn ∼ B(n; p) und große n (n > 30, n·p > 5, n·(1−p) > 5): Hn − n · p

T = p

n · p · (1 − p)

ist n¨aherungsweise N (0, 1)-verteilt, also fu¨r diese Testgr¨oße das entsprechende kritische Gebiet des Gauß–Tests benutzen Vereinbarung: Wir werden den Binomialtest immer so durchfu¨hren: 1. Hypothese:

H0 : p = p0

2. Testgr¨oße: H n − n · p0 T = p n · p0 · (1 − p0) 3. Ablehnung von H0, falls bei zweiseitiger Alternative HA :

p 6= p0

|t| > z1− α2

einseitiger Alternative HA :

p < p0

t < −z1−α

HA :

p > p0

t > z1−α

4

Beispiel: ”Losverk¨aufer” Hypothesen H0 : p = 0, 1 HA : p < 0, 1 (einseitige Fragestellung) Testgro¨ße:

(zwei Gewinnlose)

2 − 100 · 0, 1 8 t = √ = − = −2, 67 < −1, 64 = −z0,95 3 100 · 0, 1 · 0, 9 Ablehnung von H0. Im Lostopf sind signifikant zu wenige Gewinnlose. Weitere Diskussion dieses Beispiels → Internet

5

Zweistichprobenprobleme Der χ2-Homogenit¨atstest Anliegen: Vergleich der Verteilungen zweier unabh¨angiger Stichproben fu¨r (kategoriale) Daten, nichtparametrischer Test Die Variablen X und Y nehmen jede nur r diskrete Werte an. Die zuf¨alligen H¨aufigkeiten des Auftretens dieser Werte werden fu¨r beide Stichproben ermittelt und in folgende Tabelle eingetragen. Kategorie Stichprobe 1 (X) Stichprobe 2 (Y ) Σ 1

N11

N12

N1•

2

N21

N22

N2•

...

...

...

...

r P

Nr1

Nr2

Nr•

N•1

N•2

N•• = N

Hypothesen: H0 : pi1 = pi2, i = 1, . . . , r (Verteilungen sind identisch.) HA : pi1 6= pi2 fu¨r mindestens ein i Dabei ist: pi1 = P (X = xi), pi2 = P (Y = xi)

6

Testgr¨oße: µ T =

Nij 2 X r X j=1 i=1

Ni•N•j − n Ni•N•j n

¶2

H0 wird abgelehnt, wenn t > χ2r−1,1−α Bemerkungen: • Der konkrete Wert der Testgr¨oße ist der χ2–Wert fu¨r die Stichprobe. • Stichprobenumfang n insgesamt sollte mindestens 60 betragen. • Die erwarteten H¨aufigkeiten davon sollten > 5 sein.

7

Ni•N•j sollten > 1 und 80% n

Beispiel: ALLBUS, Einkommensquelle nach Geschlecht H0 bedeutet, die Einkommensquellen sind in beiden SP gleich verteilt, d.h. die %-Werte in jeder Zeile sind Sch¨atzungen fu¨r die gleiche Wahrscheinlichkeit.

Bemerkung: Interpretiert man die Zugeh¨origkeit zu einer der Stichproben (= Geschlecht) als ein beobachtetes Merkmal des Probanden, dann entspricht die obige Hypothese der Hypothese: ”Die Zufallsvariablen X (fu¨r Einkommensquelle) und Y (fu¨r Geschlecht) sind unabh¨angig.” Je nach Interpretation der Kontingenztafel testen wir also entweder, ob sich die verschiedenen Stichproben etwa gleich zusammensetzen (Homogenita¨t) oder, ob die Einkommensquelle vom Geschlecht abh¨angt (Unabh¨angigkeit).

8

Der doppelte t-Test, parametrisch ¨ Anliegen: Uberpr u¨fung von Hypothesen u¨ber die Gleichheit der Erwartungswerte zweier unabh¨angiger normalverteilter ZV bei unbekannten, aber gleichen Varianzen (Varianzhomogenita¨t), parametrischer Test Voraussetzungen: (X1, . . . , Xn), (Y1, . . . , Ym) unabh¨angige Stichproben 2 Xi ∼ N (µX , σX ),

i = 1, . . . , n

Yj ∼ N (µY , σY2 ),

j = 1, . . . , m

2 σX = σY2 unbekannt

Hypothesen: H0 : µX = µY

HA : µX 6= µY 1) µX < µY 2) µX > µY 3)

2. Testgr¨oße T =r

¯ − Y¯ X 2 (n − 1)SX + (m − 1)SY2 n+m−2

Ablehnung von H0, falls |t| > tn+m−2, 1− α2 bei 1) t < −tn+m−2,

1−α

bei 2)

t >

1−α

bei 3)

tn+m−2,

9

r ·

nm n+m

Beispiel: ALLBUS, monatliches Haushalts–Nettoeinkommen nach Geschlecht Vergleich der Erwartungswerte fu¨r die Zufallsvariablen X und Y , die das monatliche Haushaltsnettoeinkommen von Frauen bzw. M¨annern beschreiben. X und Y unabh¨angig, µX = EX, µY = EY X und Y seien normalverteilt, Varianzen sind unbekannt. α = 0, 05 Bemerkung: NV sicher keine gute Modellannahme, ¯ und Y¯ sind aber n¨aherungsweise normalverteilt (ZGWS). X H0 :

µX = µY

HA :

µX < µ Y T = r

¯ Y¯ X,

”Durchschnitts-HH-Nettoeinkommen gleich” ”M¨anner verdienen mehr” ¯ − Y¯ X 2 (n − 1)SX + (m − 1)SY2 n+m−2

r ·

nm n+m

. . . arithmetisches Mittel der SP

2 SX , SY2 . . . empirische Varianz der SP

n, m

. . . Stichprobenumfang der SP X1, . . . , Xn, Y1, . . . , Ym

10

T = r

¯ − Y¯ X 2 (n − 1)SX + (m − 1)SY2 n+m−2

r ·

nm n+m

Wenn H0 richtig ist, dann gilt: T ist t-verteilt mit n + m − 2 = 1349 Freiheitsgraden. fu¨r die konkrete Stichprobe:

t = r

2473, 08 − 2796, 34 749 · 1376, 2292 + 600 · 1359, 3362 750 + 601 − 2

r

750 · 601 750 + 601

= −4, 314 vergleiche mit: −t1349, 0.95 = −1.64 −4, 314 < −1.645 H0 wird abgelehnt und entschieden: ”Das Durchschnitts-HH-Nettoeinkommen von M¨annern ist signifikant h¨oher als das von Frauen.”

11

Diskussion des Beispiels: α tα 0.000003 -4.55

* ↓ dα 340.95

Ablehnung von H0 nein

0.0000086

-4.314

323

0.0005

-3.29

246.53

ja

0.01

-2.33

174.60

ja

0.025

-1.86

139.38

ja

0.05

-1.64

122.89

ja

*) dα . . . die Differenz der Mittelwerte, die (bei gleichem n, m, sX , sY !) genu¨gt, um H0 abzulehnen. Der Wert 0.0000086 heißt p-Wert oder Signifikanz. Stichprobenumf¨ange n, m: ¨ einleuchtend: gr¨oßere n und m erh¨ohen die Uberzeugungskraft einer beobachteten Abweichung (α = 0.05, α = 0.01) d0.05 1 003

d0.01 1425

100

317

451

1 000

100

142

10 000

32

45

100 000

10

14 Wo beginnt es unsinnig zu

1 000 000

3

5 werden? Fast alle Gehalts-

10 000 000

1

1,43 angaben im Datensatz sind auf

20 000 000

0,71

1,00 volle 100DM-Betr¨age gerundet!

n=m= 10

12