Jedzenie w kawiarni KLASYCZNE PRZEBOJE

Jedzenie w kawiarni W pewnej kawiarni puszczano trojakiego rodzaju podkład muzyczny do posiłku – ballady rockowe, klasyczne przeboje lub muzykę tanecz...
5 downloads 0 Views 754KB Size
Jedzenie w kawiarni W pewnej kawiarni puszczano trojakiego rodzaju podkład muzyczny do posiłku – ballady rockowe, klasyczne przeboje lub muzykę taneczną. Badano czas przeznaczony przez losowo wybranych gości na spożycie zamówionych posiłków oraz ich cene, gdy w tle puszczano odpowiedni podkład muzyczny. Wyniki poszczególnyh obserwacji przedstawiają się następująco. BALLADY KLASYCZNE ROCKOWE PRZEBOJE CENA CZAS CECNA CZAS 41,95 20 22,6 30 32,52 31 23,5 33 18,97 26 25,67 33 24,18 34 27,37 28 8,88 38 30,73 28 29,76 29 18,34 29 16,17 39 25,17 28 16,87 27 19,09 24 42,15 25 32,17 30 20,92 27 21,89 31

MUZYKA TANECZNA CENA CZAS 30,86 17 32,25 19 32,16 20 32,52 25 37,16 27 29,15 21 47,24 27 35,78 19 23,26 23 41,51 25

1. Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki CENA CAS 3. Dokonaj opisu statystycznego badanych zmiennych – średnia, mediana, odch. standardowe, skośność, kurtoza – zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. 4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. a. Jakiej metody statystycznej należy użyć? b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy.

2. Oblicz ile złotych na minutę wydał każdy z badanych gości - WDYATEK 

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

1

Odpowiedzi 1. Przygotuj zbiór danych w SPSS i wprowadź uzyskane w badaniu wyniki W badaniu można wyróżnić cztery zmienne – pierwszą jest rodzaj (jak można wnioskować – również tempo) podkładu muzycznego (zmienna prawdopodobnie nominalna, choć w dalszej części – gdzie pytano o związek z „tempem” można wysunąć przypuszczenie, że zakładano jej charakter porządkowy), 1 – Ballady Rockowe, 2 – Klasyczne przeboje, 3 – Muzyka taneczna. Kolejna zmienna to CZAS konsumpcji (zmienna ilościowa) i CENA zamówionego posiłku (zmienna ilościowa). W zbiorze będzie zatem 30 wierszy – ponieważ jest 30 obserwacji (prawdopodobnie 30 gości, 30 zamówionych posiłków). Fragment zbioru danych zapisanego w pliku SPSS przedstawia się następująco:

Ryc. 1

CENA CAS 2. Oblicz ile złotych na minutę wydał każdy z badanych gości Aby wykonać to zadanie, należy jedynie wyliczyć nową zmienną – WYDATEK – która jest wynikiem dzielenia zmiennej CENA przez zmienną CZAS. Więc należy wybrać polecenie PRZEKSZTAŁCENIA → OBLICZ WARTOŚCI. WDYATEK 

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

2

Ryc. 2

I w otwartym oknie kreatora obliczania wartości nowej zmiennej należy wpisać nazwę nowej zmiennej do pola „Zmienna wynikowa” oraz funkcję obliczającą żądany iloraz poprzez wpisanie CENA/CZAS.

Ryc. 3

W edytorze danych pojawi się nowa zmienna WYDATEK, która wskaże, ile złotych w przeliczeniu na jedną minutę wizyty wydał każdy z gości w czasie posiłku. 3. Dokonaj opisu statystycznego badanych zmiennych – średnia, mediana, odch. standardowe, skośność, kurtoza – zinterpretuj uzyskane wskaźniki i scharakteryzuj rozkład wyników posługując się nakreślonym histogramem. Wykonanie tego zadania wymaga użycia jednej z opcji analizy rozkładu – np. procedury analizy częstości – ANALIZA → OPIS STATYSTYCZNY → CZĘSTOŚCI. Oddzielnie analizę tę należy przeprowadzić dla zmiennej nominalnej (tutaj MUZYKA) oraz zmiennych ilościowych (tutaj CENA, CZAS, WYDATEK). Dla zmiennej nominalnej analiza częstości posłuży jedynie do tego, aby wskazać, ile (i jaki to stanowiło odsetek całości próby) było obserwacji w towarzystwie muzyki rockowej, klasycznych przebojów i muzyki tanecznej. Interesować nas będą jedynie liczebności i procenty. Choć te ostatnie w małym stopniu, ponieważ primo zmienna jest zmienną niezależną – ją się kontroluje – a secundo, liczba obserwacji jest mała (znacznie poniżej 100) i dlatego procent jest miarą mało informatywną. Oczywiście dla zmiennych ilościowych warto wskazać szereg podstawowych statystyk wymienionych w poleceniu oraz oszacować normalność rozkładu poprzez histogram. Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

3

Ryc. 4

A więc dla oszacowania liczebności prób obserwacji w towarzystwie określonej muzyki należy w otwartym oknie kreatora analizy częstości wskazać wszystkie zmienne nominalne – tutaj MUZYKA – i w oknie WYKRESY zażądać wykresów kołowych.

Ryc. 5

W wyniku analizy po zaakceptowaniu wszystkich ustawień otrzymamy raport z podsumowaniem liczby obserwacji w poszczególnych grupach .W odniesieniu do zmiennej MUZYKA jest to raport nieszczególnie interesujący – w każdym warunku eksperymentalnym jest N=10 tyle samo obserwacji. PODKŁAD MUZYCZNY

Ważne

BALLADY ROCKOWE

Częstość 10

Procent 33,3

Procent ważnych 33,3

Procent skumulowany 33,3

KLASYCZNE PRZEBOJE

10

33,3

33,3

66,7

MUZYKA TANECZNA

10

33,3

33,3

100,0

Ogółem

30

100,0

100,0

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

4

Natomiast w odniesieniu do CENY, CZASU i WYDATKU – zmiennych ilościowych należy przeprowadzić tę samą procedurę analizy częstości, lecz przy wyborze WYKRESÓW należy wskazać histogram z kryzwą normalną, natomiast w polu STATYSTYKI należy wskazać średnią, medianę, odh. Standardowe, medianę, minimum i maksimum oraz skośność i kurtozę.

Ryc. 6

Po zaakceptowaniu ustawień otrzymamy raport z podsumowaniem statystyk opisowych oraz wykresami funkcji gęstości rozkładu normalnego dla liczebności obserwowanych i oczekiwanych w poszczególnych zmiennych. Goście spędzili na posiłku od 17 do 39 minut i w tym czasie wydali od 8,88 do 47,24 złotych. Przeciętnie gość spędził na posiłku M=27,10 minuty z odchyleniem standardowym SD=5,403 minuty i wydał w tym czasie M=28,02631 złotego z odchyleniem standardowym SD=8,86102 złotego. Przeciętny gość zatem na posiłek przeznacza od 19,16528 do 28,26złtegi i spożywa go w czasie od 21,697 do 27,00 minuty. Połowa gości na posiłek wydaje co najwyżej 28,2600 złotego i spożywa go w czasie nie dłuższym niż 27 minut.

1

Wydaje się oczywiste, że w normalnym raporcie wszystkie wartości byłyby ograniczone do dwóch miejsc po przecinku, ale dla ułatwienia Czytelnikowi odnalezienia wartości w tabeli podano je z dokładnością taką, jaką raportuje to SPSS. Karol Karasiewicz www.karasiewicz.az.pl 5 You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

Statystyki

N

Ważne Braki danych

CENA ZAMÓWIO NYCH PRODUKT ÓW 30

CZAS SPĘDZONY NA KONSUMPCJI 30

WYDATKI W PRZELICZENI U NA MINUTĘ KONSUMPCJI 30

0

0

0

Średnia

28,0263

27,10

1,1087

Mediana Odchylenie standardowe

28,2600 8,86102

27,00 5,403

1,0188 ,48299

,173

,173

,377

,427

,427

,427

Skośność Błąd standardowy skośności Kurtoza

-,194

-,082

-,838

Błąd standardowy kurtozy

,833

,833

,833

Minimum

8,88

17

,23

47,24

39

2,10

Maksimum

Na podstawie wskaźników skośności i kurtozy (mieszczących się w przedziale od-0,7 do 0,7) można powiedzieć, że oba rozkłady pomiarów – pomiar czasu i ceny spożytego posiłku – są rozkładami względnie symetrycznymi i mezokurtycznymi. Można zatem powiedzieć, że liczba gości, którzy zapłacili za posiłek mniej niż średnia jest zbliżona do liczby gości płacących więcej niż średnia i analogicznie w odniesieniu do czasu – liczba gości spędzających w kawiarni mniej czasu niż średnia jest zbliżona do liczby gości spędzających więcej czasu niż średnia. Zróżnicowanie wyników można uznać za przeciętne.

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

6

CENA ZAMÓWIONYCH PRODUKTÓW

Częstość

6

4

2

Średnia =28,0263 OdchStd. =8,86102 N =30

0 0,00

20,00

40,00

CENA ZAMÓWIONYCH PRODUKTÓW

Natomiast rozkład wyników pomiaru wydatku na posiłek w przeliczeniu na jedną minutę wizyty okazują się nieznacznie różnić od rozkładu normalnego – charakteryzują się dość wyraźną spłaszczeniem (Kurtoza=-0,838), co oznacza dość duże zróżnicowanie badanej próbki pod względem poziomu wydatków na posiłek w przeliczeniu na jedną minutę wizyty. I rzeczywiście w badanej próbie goście na posiłek wydali w przeliczeniu na jedną minutę od 0,23 złotego do 2,10 złotego. Przeciętnie gość wydał M=1,1087 złotego na minutę z odchyleniem standardowym SD=1, 0188 co oznacza, że typowy gość wydaje w przeliczeniu na jedną minutę od 0,0899 złotego 2,1275.

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

7

4. Zweryfikuj hipotezę, że im szybszy jest podkład muzyczny (ballady rockowe są najmniej szybkie, klasyczne przeboje są nieco szybsze, muzyka taneczna jest najszybsza) tym więcej czasu goście kawiarni spędzają na konsumpcji i tym więcej wydają pieniędzy. Tutaj jest dość trudna kwestia do rozstrzygnięcia związana z charakterem zmiennej MUZYKA (Tempo tła muzycznego). Z jednej strony logicznym się wydaje, że Ballady Rockowe, Klasyczne przeboje i Muzyka Taneczna należą do innych kategorii, a więc stanowią inną jakość - ergo tworzą zmienną nominalną. Jednakże instrukcja przekazana w hipotezie może sugerować, że zmienna jednak ma charakter porządkowy i należy ją traktować, jak wynik pewnego uporządkowania. Ten dylemat metodologiczny implikuje pewien problem natury statystycznej. Ponieważ, jeśli zmienną MUZYKA traktować jako zmienną nominalną, do oszacowania jej związku ze zmienną ilościową (tzn. CENA, CZAS i WYDATEK) można wykorzystać jednoczynnikową ANOVA. Jeśli natomiast zmienną tę traktować, jak zmienną porządkową – nasuwa się rozwiązanie poprzez analizę zależności metodą rho Spearmana. Bezpieczniejsze wydaje się skorzystanie z metody jednoczynnikowej ANOVA. Każdą zmienną porządkową można traktować, jak zmienną nominalną – obniżenie skali szacunkowej jest dopuszczalne, nigdy podwyższenie. A jednocześnie nie mamy podstaw, aby sądzić, że tempo podkładu muzycznego liniowo wiąże się z czasem spożycia, czy ceną zamówionego posiłku. a. Jakiej metody statystycznej należy użyć? Dla oszacowania związku między tempem muzyki, a czasem i ceną oraz wydatkiem w złotych na minutę należy przeprowadzić test jednoczynnikowej ANOVA. W tym celu należy kliknąć ANALIZA → PORÓWNYWANIE ŚREDNIECH → JEDNOCZYNNIKOWA ANOVA.

Ryc. 7

W otwartym oknie kreatora analizy należy zdefiniować zmienne zależne – są to zmienne ciągłe o rozkładzie normalnym (Tutaj CENA, CZAS i WYDATEK). Następnie zdefiniować czynnik, tzn. zmienną niezależną – jest to zmienna nominalna o więcej niż dwie kategoriach (tutaj jest to MUZYKA).

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

8

Ryc. 8

Następnie koniecznie należy zdefiniować żądanie odpowiednich statystyk i wykresów poprzez kliknięcie na przycisk OPCJE. Warto wybrać statystyki opisowe testy jednorodności wariancji oraz mocne testy równości średnich Browna-Forsythe i wykres średnich.

Ryc. 9

I wreszcie należy zdefiniować testy kontrastów lub testy post hoc dla oszacowania dokładnych różnic między porównywanymi warunkami. Wybierzmy jedne i drugie, choć w praktyce należy raczej zdecydować się na jedne z nich. Zacznijmy od testów post hoc. Służą one do oszacowania różnic między poszczególnymi parami grup. Najczęściej wykorzystywanymi testami post hoc to NIR (najmniej restrykcyjny, daje najwięcej istotnych statystycznie różnic), test Tukey’a (w wersji A jest to test dla grup równolicznych, w wersji B – dla grup nierównolicznych) lub test T2Tamhane’a. Często też, gdy prowadzone są eksperymenty z tzw. grupą kontrolną wykorzystywany jest test Dunnetta, który przeprowadza tylko porównania parami między grupą kontrolną (grupa ta musi być pierwsza lub ostatnia w definicji zmiennej niezależnej) a każdą inną grupą.

Ryc. 10

Oczywiście w rzeczywistym badaniu należy zdecydować się na jedno z rozwiązań, w tym opracowaniu przeprowadzone będą wszystkie testy dla pokazania różnicy między nimi. Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

9

I wreszcie testy kontrastów definiowane poprzez przycisk KONTRASTY. Jednakże zanim przejdziemy do technicznego problemu definiowania kontrastów, należy wspomnieć kilka słów o ich logice. Testy kontrastów to testy szczegółowej hipotezy alternatywnej. O ile jednoczynnikowa ANOVA (tzw. Omnibus F) pozwala oszacować istotność związku między zmienną niezależną i zależną, a testy post hoc pozwalają na oszacowanie istotności różnic między każdą parą średnich, to kontrasty pozwalają zdefiniować dokładnie interesujące różnice nie tylko między parami średnich, ale między średnią jednej grupy i średnią wszystkich pozostałych grup itd. Ponadto kontrasty pozwalają odpowiedzieć na pytanie, czy różnice między średnimi układają się w odpowiednim trendzie – liniowym, kwadratowym itd. Najważniejsze, aby pamiętać, że istnieją trzy proste reguły dotyczące definiowania współczynników kontrastów: Każda średnia (każda grupa) powinna otrzymać własny współczynnik (wagę) kontrastu Suma wszystkich współczynników kontrastów powinna wynosić 0 Jeśli dwie grupy otrzymują taki sam współczynnik kontrastu (np. 1 i 1) – ich średnie są uśredniane, jeśli przeciwny (np. -1 i 1) – są porównywane, jeśli współczynnik dla danej grupy wynosi 0 – jej średnia nie jest uwzględniana w porównaniach. Tak więc zdefiniujmy współczynniki kontrastów dla trzech hipotez, które (jak się wydaje) możemy założyć mając podstawową wiedzę odnośnie praw rządzących zachowaniami konsumenta: Wyniki uzyskane przy muzyce tanecznej różnią się od średniej uzyskanej przy balladach rockowych i klasycznych przebojach Istnieje istotny statystycznie liniowy trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn, że zależność ma charakter liniowy Istnieje istotny nieliniowy (kwadratowy) trend zależności między tempem muzyki i ceną oraz czasem i wydatkiem na posiłek. Tzn. że zależność ta jest krzywoliniowa – do pewnego momentu ma charakter rosnący, potem malejący. Zatem przejdźmy do technicznej strony definiowania kontrastów w SPSS. Dla zdefiniowania trendu, tzn. odpowiedzi na pytanie, czy zależność ma określony charakter liniowy lub nieliniowy wystarczy wskazać najwyższy interesujący nas wielomian – w naszym przykładzie jest to wielomian kwadratowy. Trzeba pamiętać, że dla oszacowania wielomianu k stopnia (np. drugiego, trzeciego itd.) potrzebnych jest k+1 grup. Zatem w naszym przykładzie, gdzie tempo muzyczne jest zdefiniowane na trzech poziomach mamy możliwość oszacowania jedynie wielomianu drugiego stopnia. SPSS domyślnie oszacuje również wielomiany niższego stopnia. W ten sposób „odpadną” nam dwa problemy: jak należy przypisać współczynniki kontrastów, aby trend okazał się liniowy, kwadratowy itd. i czy kontrasty te są ortogonalne (niezależne). Jednak dla celów dydaktycznych przedstawię, jak SPSS przypisuje wagi kontrastów dla trendu liniowego i kwadratowego w planie trzygrupowym: Ballady Klasyczne Muzyka Rockowe Przeboje Taneczna Trend Liniowy -1 0 1 Trend kwadratowy 1 -2 1 Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

10

Do tych dwóch trendów liniowego i kwadratowego my chcemy zdefiniować jeszcze trzeci kontrast o innym (niestandardowym) charakterze – tzn. -1 -1 2. Ten kontrast będzie weryfikował pierwszą ze stawianych hipotez, tzn. że wyniki uzyskane przy muzyce tanecznej (grupa trzecia) różnią się od uśrednionych wyników uzyskanych przy muzyce rockowej i klasycznych przebojach – obie grupy pierwsza i druga otrzymały tę samą wagę kontrastu. Stąd też po dopisaniu ustalonych współczynników kontrastu do kontrastów trendu liniowego i kwadratowego otrzymujemy następującą macierz współczynników kontrastów: Ballady Klasyczne Muzyka Rockowe Przeboje Taneczna Trend Liniowy -1 0 1 Trend kwadratowy 1 -2 1 Trend potęgowy -1 -1 2 Kontrasty te nie są ortogonalne (nie są niezależne), ponieważ suma iloczynów współczynników kontrastów (wynosi 5) nie jest równa zero. Można zatem powiedzieć, że wyniki porównania specjalnego, które zaplanowano nie są niezależne od porównań wynikających z trendu liniowego i kwadratowego – wynikają z nich. Mocno zalecane jest testowanie kontrastów ortogonalnych, ponieważ tylko wtedy można powiedzieć, jaki jest rzeczywisty poziom istotności każdej z szacowanych różnic. Przy testowaniu kontrastów nieortogonalnych pewna część istotności każdego z nih jest zależna od istotności pozostałych.

Trend Liniowy Trend kwadratowy Trend potęgowy Iloczyn wag Suma iloczynów

Ballady Klasyczne Muzyka Rockowe Przeboje Taneczna -1 0 1 1 -2 1 -1 -1 2 1 2 2 5 0 

Ryc. 11

Aby zatem zdefiniować ten niestandardowy kontrast musimy kolejno – według kolejności grup w zmiennej niezależnej (tutaj: 1 - Ballady Rockowe, 2 – Klasyczne Przeboje i 3 – Muzyka Taneczna) wprowadzić wagi kontrastów. Po wpisaniu jednego współczynnika (np. 1) należy przycisnąć klawisz DODAJ i wprowadzić kolejny współczynnik. Wprowadzone współczynniki będą pojawiały się na liście i jednocześnie poniżej SPSS kontrolnie będzie obliczał ich sumę tak, aby nie pomylić się przy samodzielnym liczeniu. Gdybyśmy chcieli zdefiniować więcej niż jeden kontrast – możemy po wpisaniu współczynników dla Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

11

wszystkich grup kliknąć przycisk NASTĘPNY i od nowa wprowadzać współczynniki dla następnych kontrastów. Gdyby sobie wyobrazić rozłożenie tych trzech wartości, jako wartości rzędnych (na osi Y) dla kolejnych trzech wartości z osi X, to w klasycznym układzie kwadratowym dałyby one obraz funkcji liniowej lub kwadratowej (patrz: Ryc. 12).

Ryc. 12

Co można również zaobserwować, zadany przez nas specjalny kontrast - -1 -1 2 – to odwrotny trend pierwiastkowy (tzw. trend potęgowy). b. Podaj odpowiednie statystyki i wskaźniki oraz ich interpretację dla potwierdzenia postawionej przez Ciebie tezy. Statystyki opisowe

N CENA ZAMÓWIONYCH PRODUKTÓW

CZAS SPĘDZONY NA KONSUMPCJI

WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI

BALLADY ROCKOWE

Średnia

Odchylenie standardowe

10

25,2370

11,14386

KLASYCZNE PRZEBOJE

10

24,6530

4,54726

MUZYKA TANECZNA

10

34,1890

6,68217

Ogółem

30

28,0263

8,86102

10

29,60

5,967

BALLADY ROCKOWE KLASYCZNE PRZEBOJE

10

29,40

2,675

MUZYKA TANECZNA

10

22,30

3,592

Ogółem BALLADY ROCKOWE

30

27,10

5,403

10

,9347

,56897

KLASYCZNE PRZEBOJE

10

,8424

,16102

MUZYKA TANECZNA

10

1,5490

,27227

Ogółem

30

1,1087

,48299

Wyniki przeprowadzonej analizy wskazują, że przeciętny czas konsumpcji przy muzyce rockowej (M=29,60) i klasycznych przebojach (M=29,40), czy przeciętny koszt Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

12

zamówionego posiłku (odpowiednio M=25,2370 dla muzyki rockowej i M=24,6530 dla klasycznych przebojów) nie różnią się w sposób znaczący. Natomiast różnica między ceną i czasem konsumpcji przy muzyce rockowej lub klasycznych przebojach, a analogicznymi wynikami uzyskanymi przy muzyce tanecznej wydaje się wyraźnie większa. Przeciętnie gość w towarzystwie muzyki tanecznej spędził na konsumpcji M=22,30 minut i w tym czasie wydał M=34,1890 złotych na posiłek. Co wydaje się istotne, to fakt, że w grupie gości spędzających czas w towarzystwie muzyki klasycznej ujawniło się znacznie większe zróżnicowanie wyników niż w pozostałych grupach gości (na co wskazuje dużo większe odchylenie standardowe) w obrębie wszystkich analizowanych zmiennych. Test jednorodności wariancji Test Levene'a

df1

df2

Istotność

CENA ZAMÓWIONYCH PRODUKTÓW

4,399

2

27

,022

CZAS SPĘDZONY NA KONSUMPCJI

3,559

2

27

,042

WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI

4,430

2

27

,022

Obawę o to, że istnieją istotne różnice między wariancjami wyników w trzech porównywanych grupach potwierdza test Levene’a dla weryfikacji hipotezy o jednorodności (homogeniczności) porównywanych grup. Test ten okazał się statystycznie istotny w obrębie wszystkich analizowanych zmiennych. Oznacza to znaczące zaburzenie założenia o jednorodności wariancji we wszystkich porównywanych w procedurze jednoczynnikowej ANOVA grup. Co zatem można z tym zrobić, jak poradzić sobie z tym wynikiem? Rozwiązania są co najmniej dwa – po pierwsze wydaje się, że ta większa wariancja w jednej grupie może wiązać się z występowaniem w danych jakiejś pojedynczej obserwacji odstającej, po drugie można założyć (jeśli jest to teoretycznie uzasadnione), że większa wariancja wyników w tej grupie jest uzasadniona i prowadzić dalej porównania z założeniem braku równości wariancji. Jak znaleźć ową obserwację odstającą? Wystarczy przeprowadzić analizę rozkładu częstości (patrz: Ryc. 4 i Ryc. 6 w punkcie 2) oddzielnie w każdej z porównywanych grup. Wymaga to jednak wskazania SPSSowi żądania, aby przeprowadził tę analizę oddzielnie w każdej z grup, można to zrobić klikając w DANE → PODZIEL NA PODZBIORY.

Ryc. 13

Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

13

Następnie w otwartym oknie edytora podziału danych na podzbiory należy wskazać metodę – najlepiej„Porównaj grupy” – i wskazać zmienną wyróżniającą te grupy przenosząc MUZYKA do pola „Grupy wyróżnione na podstawie”.

Ryc. 14

Gdy teraz przeprowadzimy analizę rozkładu częstości wyniki analizy będą przedstawione oddzielnie w każdej z grup. Zwłaszcza interesujące są histogramy rozkładu zmiennych, ponieważ one wydaje się najłatwiej pokazują istnienie obserwacji odstających lub wariancję wyników. Można na nich zauważyć, że w pierwszej grupie gości restauracji nie ma znaczących obserwacji odstających, a jeśli nawet są, to znajdują się na obu krańcach rozkładu i łącznie stanowią 30% liczebności tej grupy… Sugeruje to raczej, że rzeczywiście wariancja wyników w grupie pierwszej gości spożywających posiłek w towarzystwie muzyki rockowej jest większa. Stąd też w dalszym postępowaniu przyjmiemy to założenie.

Ryc. 15

Wróćmy zatem do wyników jednoczynnikowej ANOVA. Przyjęcie założenia o zróżnicowaniu wariancji wyników powoduje, że nie należy interpretować wyników testu Omnibus F jednoczynnikowej ANOVA, ponieważ nie jest spełnione leżące u ich podstaw założenie, że wariancje w grupach są jednorodne. Jednak dla celów dydaktycznych przyjrzyjmy się tej tabeli. Wyniki przeprowadzonej analizy są podzielone na kilka wierszy w związku z zaplanowaniem testu istotności trendu liniowego i kwadratowego w założonych danych. W pierwszym wierszu nazwanym „Połączone” znajdują się wyniki oszacowania ogólnego modelu. Innymi słowy – w wierszu „Połączone” są oszacowania poziomu istotności dla hipotezy zerowej mówiącej o równości wszystkich średnich. W przypadku, gdyby nie założono żadnych kontrastów dla trendu, tylko ta hipoteza byłaby testowana i wskaźniki istotności dla składnika połączonego byłyby wyliczone. W wierszu „Składnik liniowy – kontrast” i „Składnik kwadratowy – kontrast” znajdują się oszacowania istotności dla założenia o istnieniu liniowej i kwadratowej zależności między zmienną niezależną i zależną. Ponownie należy przypomnieć – testy te są prawdopodobnie w pewnym stopniu nieprecyzyjne (niedokładnie oszacowane) ze względu na niespełnienie warunku Karol Karasiewicz www.karasiewicz.az.pl You created this PDF from an application that is not licensed to print to novaPDF printer (http://www.novapdf.com)

14

jednorodności wariancji w grupach. Jednak są tutaj analizowane wyłącznie dla celów dydaktycznych (poglądowych). Jednoczynnikowa ANOVA

F CENA ZAMÓWIONYCH PRODUKTÓW

Między grupami

(Połączone) Składnik liniowy

Kontrast Odchylenie

Składnik kwadratowy

Kontrast

Istotność

4,522

,020

6,343

,018

2,702

,112

2,702

,112

9,320

,001

14,362

,001

4,277

,048

4,277

,048

10,445

,000

13,357

,001

7,534

,011

7,534

,011

Wewnątrz grup Ogółem CZAS SPĘDZONY NA KONSUMPCJI

Między grupami

(Połączone) Składnik liniowy

Kontrast Odchylenie

Składnik kwadratowy

Kontrast

Wewnątrz grup Ogółem WYDATKI W PRZELICZENIU NA MINUTĘ KONSUMPCJI

Między grupami

(Połączone) Składnik liniowy

Kontrast Odchylenie

Składnik kwadratowy

Kontrast

Wewnątrz grup Ogółem

Można zauważyć, że testy hipotez o równości średnich w porównywanych grupach odnośnie do wszystkich zmiennych okazują się statystycznie istotne, tzn. wskazują dają podstawę do przyjęcia, że średni czas konsumpcji (F(2;27)=9,320; p=0,001), średnia cena zakupu (F(2;27)=4,522; p=0,020) i średnia wydana w przeliczeniu na jedną minutę kwota (F(2;27)=10,445; p