STATYSTYKA MATEMATYCZNA 1. Wykład wstępny 2. Teoria prawdopodobieństwa i elementy kombinatoryki 3. Zmienne losowe 4. Populacje i próby danych 5. Testowanie hipotez i estymacja parametrów
6. Test t 7. Test 2 8. Test F
9. Testy nieparametryczne 10. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja 11. Korelacja 12. Regresja liniowa i nieliniowa 13. Określenie jakości dopasowania równania regresji liniowej i nieliniowej 14. Analiza wariancji 15. Podsumowanie dotychczasowego materiału, wspólna analiza przykładów, dyskusja
WSTĘP
Test t
1. Zakres stosowalności 2. Dla pojedynczej próby
3. Dla dwu niezależnych prób 4. Dla dwu sparowanych prób 5. Test Duncana
Copyright ©2010, Joanna Szyda
ZAKRES STOSOWALNOŚCI TESTU T
1. Test parametryczny 2. Dane ciągłe 3. Wartości w próbie danych – rozkład normalny 4. Porównywane próby danych – podobne wariancje
Copyright ©2014, Joanna Szyda
POJEDYNCZA PRÓBA
TEST T – POJEDYNCZA PRÓBA PRÓBA DANYCH BMD
SEX
0.97
1
0.73
1
0.87
1
0.94
1
1.02
1
0.76
1
0.78
1
1.01
1
0.82
1
0.76
1
0.87
1
0.72
1
1. Badanie osteoporozy 2. Medical Research Council, Cambridge 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych
… 0.91
2
1.02
2
0.87
2 Copyright ©2010, Joanna Szyda
TEST T – POJEDYNCZA PRÓBA 1. Określenie hipotez H0 i H1 H0: średnia gęstość kości w populacji wynosi 1.0 g/cm2 H1: średnia gęstość kości w populacji różni się od 1.0 g/cm2 H0: = 1.0 H1: ≠ 1.0
2. Ustalenie poziomu istotności
MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego
Excel: przykład Copyright ©2014, Joanna Szyda
TEST T – POJEDYNCZA PRÓBA 4. Określenie rozkładu testu
x 1.0 x 1.0 t Sx S x2 N
~ tN 1
5. Obliczenie p-wartości p 0.0000000000
Excel: przykład
p=0.000000
6. Decyzja p < max
H0
H1
średnia gęstość kości w populacji różni się od 1.0 g/cm2
Copyright ©2010, Joanna Szyda
DWIE NIEZALEŻNE PRÓBY
TEST T – DWIE NIEZALEŻNE PRÓBY PRÓBA DANYCH BMD
SEX
0.97
1
0.73
1
0.87
1
0.94
1
1.02
1
0.76
1
0.78
1
1.01
1
0.82
1
0.76
1
0.87
1
0.72
1
1. Badanie osteoporozy 2. Medical Research Council, Cambridge 3. Gęstość kości [g/cm2] 40 zdrowych osób dorosłych 4. Wartości znane dla mężczyzn i kobiet
… 0.91
2
1.02
2
0.87
2 Copyright ©2010, Joanna Szyda
TEST T – DWIE NIEZALEŻNE PRÓBY 1. Określenie hipotez H0 i H1 H0: średnia gęstość kości kobiet jest taka sama jak mężczyzn H1: średnia gęstość kości kobiet jest różna niż mężczyzn H0: K = M H1: K ≠ M
2. Ustalenie poziomu istotności
MAX = 0.05 3. Wybór i obliczenie wartości testu statystycznego
Copyright ©2014, Joanna Szyda
BŁĘDY ZWIĄZANE Z TESTOWANIEM HIPOTEZ
3. Wybór i obliczenie wartości testu statystycznego
Excel: przykład
Copyright ©2014, Joanna Szyda
TEST T – DWIE NIEZALEŻNE PRÓBY 4. Określenie rozkładu testu
5. Obliczenie wartości t
p=0.0466
Excel: przykład
6. Decyzja p < max
H0
H1
średnia gęstość kości u mężczyzn jest inna niż u kobiet
Copyright ©2014, Joanna Szyda
DWIE SPAROWANE PRÓBY
TEST T – DWIE SPAROWANE PRÓBY PRÓBA DANYCH Low CCT
High CCT
20.0
14.3
13.9
13.8
18.3
15.8
21.1
33.4
20.1
20.3
24.4
19.9
20.2
14.3
11.6
11.4
28.8
25.1
18.5
24.1
1. Badanie ciśnienia w gałce ocznej 2. Ciśnienie w 2 gałkach tej samej osoby 3. Podział oczu pod względem grubości rogówki (Low CCT i high CCT)
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY 1. Określenie hipotez H0 i H1 H0: ciśnienie w gałce ocznej nie zależy od grubości rogówki H1: ciśnienie w gałce ocznej zależy od grubości rogówki H0: L = H H1: L ≠ H
2. Ustalenie poziomu istotności MAX = 0.05
3. Wybór i obliczenie wartości testu statystycznego N
t
D N N
D D i 1
2
,
D
x i 1
1i
x2 i
N
i
N 1
Excel: przykład
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY
3. Wybór i obliczenie wartości testu statystycznego N
D
t
x i 1
1i
x2 i
N D N N
D D i 1
2
i
4.5 0.45 10 0.45 10 0.25 288.21 10 1
N 1
Copyright ©2010, Joanna Szyda
TEST T – DWIE SPAROWANE PRÓBY 4. Określenie rozkładu testu t
D N
~ t N 1
N
2 D D i i 1
N 1
5. Obliczenie p-wartości Excel: przykład
p 0.8071
6. Decyzja p > max
H0
H1
ciśnienie w gałce ocznej nie zależy od grubości rogówki
Copyright ©2010, Joanna Szyda
KILKA PRÓB - TEST DUNCANA
TEST T – KILKA PRÓB, TEST DUNCANA PRÓBA DANYCH
1. Badanie frekwencji na zajęciach ze statystyki w USA 2. 4 grupy - atrakcyjność wykładowcy 3. Frekwencja na zajęciach w semestrze poziom atrakcyjności 0
1
2
4
15
20
10
30
10
13
24
22
12
10
29
29
10
22
12
20
...
...
...
...
średnia 11.13
17.88
20.25
24.38 Copyright ©2010, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA 1. Próby uszeregowane od najniższej do najwyższej średniej 2. Sekwencja kilku testów t dla niezależnych prób
3. Zmodyfikowany poziom błędu istotności MAX T* = 1 - (1 - T)n-1 0 1 2 3
* = 1 - (1 - 0.0036)2-1 = 0.0036 * = 1 - (1 - 0.0002)3-1 = 0.0004 Liczba 2-1 = 0.2722 4-1 = 0.0000029 = 1 - (1 - 0.2722) * = 1 - (1 * - 0.00000096) porównanych * = pojedynczego 1 - (1 - 0.0048)3-1 = 0.0097 średnich * =testu 1 - (1t - 0.0625)2-1 = 0.0625
H0: 0 = 1 = 2 = 3 H0: 0 = 1 = 2 H0: 1 = 2 = 3 H0: 2 = 3
H1: 0 ≠ 1 ≠ 2 ≠ 3 H1: 0 ≠ 1 ≠ 2 H1: 1 ≠ 2 ≠ 3 H1: 2 ≠ 3
Copyright ©2011, Joanna Szyda
TEST T – KILKA PRÓB, TEST DUNCANA
0 1
A
2
A
3
B B
1. Atrakcyjność wykładowcy wpływa na frekwencję 2. Frekwencja na zajęciach nie różni się istotnie (MAX=0.05) w grupach 1 i 2 oraz 2 i 3
Copyright ©2011, Joanna Szyda
0.76
1
0.87
1
0.72
1
…
0.91
2
1.02
2
0.87
2
TEST T
Copyright ©2011 Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
•
Heiteger et al. (2004) Brain 127: 575-590
•
Analizowana cecha: szybkość ruchu ręki
•
Dane mają rozkład normalny
•
2 grupy: - 30 osób po mikrourazie głowy - 30 osób bez mikrourazu osoby w obu grupach dopasowane pod względem wieku, liczby lat wykształcenia i płci
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
1. Pojedyncza próba 2. Dwie niezależne próby 3. Dwie sparowane próby 4. Test Duncana
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ? •
Mosimann et al. (2004) Brain 127: 431-438
•
Analizowano czas w jakim osoby z chorobą Alzheimera odczytują czas na zegarze
•
Po odczytaniu czasu na zegarze wskazówkowym prezentowanym na ekranie monitora osoba naciska klawisz
•
Dla osób zdrowych średni czas odczytu czasu na zegarze wynosi 2.31 sek.
•
Dane mają rozkład normalny
•
Próba danych: 24 osoby z chorobą Alzheimera Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
1. Pojedyncza próba 2. Dwie niezależne próby 3. Dwie sparowane próby 4. Test Duncana
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
•
Day (2007) Environmental Entomology 36: 1154-1158
•
Analizowano poziom inwazji pasożytów u pluskwiaka różnoskrzydłego (2 gatunki z rodzaju Lygus)
•
Z podziałem na stadia rozwojowe
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
1. Pojedyncza próba 2. Dwie niezależne próby 3. Dwie sparowane próby 4. Test Duncana
Copyright ©2010, Joanna Szyda
QUIZ – KTÓREJ WERSJI TESTU T UŻYĆ ?
Copyright ©2010, Joanna Szyda