Analyse von Zeitreihen

Analyse von Zeitreihen ¾ Begriffe der Zeitreihe ¾ Komponenten einer Zeitreihe ¾ ¾ - Trend - Periodische Schwankungen - Restschwankungen Be...
Author: Julian Kästner
41 downloads 2 Views 245KB Size
Analyse von Zeitreihen ¾

Begriffe der Zeitreihe

¾

Komponenten einer Zeitreihe

¾

¾

-

Trend

-

Periodische Schwankungen

-

Restschwankungen

Bestimmung der Trendkomponente -

Methode der kleinsten Quadrate (MKQ)

-

Methode der gleitenden Durchschnitte

Exponentielle Glättung

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

1 Zeitreihen I

Bibliografie ¾

Prof. Dr. Kück; Statistik, Vorlesungsskript, Abschnitt 10.1 und 10.2

¾

Bleymüller/Gehlert; Statistische Formeln, Tabellen und Programme. Verlag Vahlen

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

2 Zeitreihen I

1

Zeitreihe Bei einer Zeitreihe handelt es sich um eine Reihe von Werten (y1, y2, . . . , yn) eines Merkmals (Y), die zu verschiedenen Zeitpunkten (bei Bestandsmassen) oder verschiedenen Zeiträumen (bei Bewegungsmassen) (t=1, 2, . . . , n) erhoben werden. In der Zeitreihenanalyse wird die Entwicklung des Merkmals Y nur in Abhängigkeit der Zeit betrachtet. Das bedeutet, dass die Zeit als Verursacher der Entwicklung aufgefasst wird. Verursacher der Entwicklung sind aber i. d. R. viele andere Sachmerkmale. Die Eingrenzung auf die Zeit in der Zeitreihenanalyse ist daher eine grobe Vereinfachung. Die Zeit fungiert als Repräsentant aller sachlichen Einflussfaktoren. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

3 Zeitreihen I

Beispiele von Zeitreihen Merkmale der Bevölkerung sowie Merkmale der Wirtschaft sind sich historisch entwickelnde Größen, deren Entwicklungen Aufschluss über gesellschafts-, wirtschaftsund sozialpolitische Phänomene geben. Ihre Merkmalswerte im Zeitverlauf bilden Zeitreihen. ¾ Bevölkerungsbestand der BRD am Jahresende ¾ Durchschnittliche Haushaltgröße in MV für mehrere Jahre im April (Mikrozensus) ¾ Jährliche Zahl der Geburten in der BRD ¾ Monatlicher Umsatz im produzierenden Gewerbe ¾ Monatliche Arbeitslosenquote im Arbeitsamtsbezirk Nord Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

4 Zeitreihen I

2

1. Problemkreis bei der Untersuchung von Zeitreihen ¾ Untersuchung der zeitlichen Entwicklung von Beständen; die Bestandsfortschreibung wird über die Zu- und Abgangsmassen vorgenommen. (Vgl. dazu Ausführungen zu Bestandsmassen in der Präsentation Grundbegriffe I, Folie 25 ff) Beispiel: •Bestandsfortschreibung der Bevölkerung über Geburten, Sterbefälle, Zuzüge und Fortzüge. •Bestandsfortschreibung von Lagerbeständen nach Artikeln über Warenein- und Warenausgang. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

5 Zeitreihen I

2. Problemkreis bei der Untersuchung von Zeitreihen ¾ Untersuchung von Gesetzmäßigkeiten in der zeitlichen Entwicklung eines Merkmals, die in ihrer kategorialen Bestimmung über den gesamten betrachteten Zeitraum hinweg als gleichartig angesehen werden können. ¾ Bestimmung dieser Gesetzmäßigkeiten (Zeitreihenmodell) und ihre Anwendung für die Vorausschätzung der zukünftigen Entwicklung (Prognosemodell). Beispiel: •Entwicklung der Erwerbstätigenzahl in Deutschland von 1989 bis 2001 und Prognose für das Jahr 2002 •Umsatzentwicklung eines Wirtschaftszweiges von 1989 bist 2001 und Prognose für die Jahre 2002 und 2003 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

6 Zeitreihen I

3

Grafische Darstellung einer Zeitreihe ¾ Die grafische Darstellung erfolgt in einem Koordinatensystem, in welchem auf der Abszisse die Zeit und auf der Ordinate die Merkmalsgröße abgetragen wird. Für diesen Zweck ist das Liniendiagramm zu bevorzugen, die Darstellung kann jedoch auch mit einer anderen Diagrammart erfolgen. ¾ Sie sollte immer der erste Schritt bei der Untersuchung von Gesetzmäßigkeiten einer Zeitreihe sein. ¾ Sie ist die einfachste und anschaulichste Form der Zeitreihenanalyse. ¾ Wenn der Wertebereich der Merkmalswerte sehr groß ist, kann es zweckmäßig sein, eine logarithmische Skala für die Ordinatenachse anzuwenden. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

7 Zeitreihen I

Beispiel: Liniendiagramm für die Entwicklung der Zahl der Lebendgeborenen Jahr

Y

33695

1993

9432

1981

31695

1994

8934

1982

31860

1995

9878

1983

30794

1996

11088

1984

30108

1997

12046

1985

30581

1998

12246

1986

29803

1999

12589

2000

13319

1987

30608

1988

28495

1989

26403

1990

23503

1991

13635

1992

10875

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

Entw icklung der Zahl der Lebendgeborenen in MV 35000 30000 25000 20000 15000 10000 5000 0 19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00

Y

1980

Lebendgeborene

Jahr

SPSS-Diagramm

Y: Anzahl der Lebendgeborenen in MV 8 Zeitreihen I

4

Beispiel: Säulendiagramm für die Entwicklung der Zahl der Lebendgeborenen Jahr

Y

Jahr

Y

Entw icklung der Zahl der Lebendgeborenen in MV

33695

1993

9432

1981

31695

1994

8934

1982

31860

1995

9878

1983

30794

1996

11088

1984

30108

1997

12046

30581

1998

12246

29803

1999

12589

2000

13319

1987

30608

1988

28495

1989

26403

1990

23503

1991

13635

1992

10875

35000 30000 25000 20000 15000 10000 5000 0

19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00

1985 1986

Lebendgeborene

1980

SPSS-Diagramm

Y: Anzahl der Lebendgeborenen in MV

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

9 Zeitreihen I

Beispiel: Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) Jahr

BRD

DDR

Jahr

BRD

DDR

Jahr

BRD

DDR

1960

2,37

2,35

1971

1,92

2,13

1982

1,41

1,86

1961

2,45

2,42

1972

1,72

1,79

1983

1,33

1,79

1962

2,44

2,42

1973

1,54

1,58

1984

1,29

1,74

1963

2,52

2,47

1974

1,51

1,54

1985

1,28

1,74

1964

2,55

2,48

1975

1,45

1,54

1986

1,35

1,70

1965

2,51

2,48

1976

1,46

1,64

1987

1,36

1,73

1966

2,54

2,43

1977

1,40

1,85

1988

1,42

1,67 1,58

1967

2,49

2,34

1978

1,38

1,90

1989

1,39

1968

2,39

2,30

1979

1,38

1,90

1990

1,48

1,52

1969

2,21

2,24

1980

1,45

1,94

1991

1,42

0,98

1970

1,99

2,19

1981

1,44

1,86

1992

1,40

0,83

Quelle: Neu, Axel, Frankfurt am Main 1996 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

10 Zeitreihen I

5

Beispiel: Liniendiagramm für die Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) 3

Geburtenziffern

2,5 2 BRD

1,5

DDR

1 0,5

19 6 19 0 62 19 6 19 4 66 19 6 19 8 70 19 7 19 2 7 19 4 76 19 7 19 8 80 19 8 19 2 84 19 8 19 6 88 19 9 19 0 92

0

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

SPSS-Diagramm 11

Zeitreihen I

Beispiel: Säulendiagramm für die Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) 3,00

Geburtenziffern

2,50 2,00 BRD

1,50

DDR

1,00 0,50

19 6 19 0 6 19 2 6 19 4 66 19 6 19 8 70 19 7 19 2 74 19 7 19 6 78 19 8 19 0 8 19 2 84 19 8 19 6 8 19 8 9 19 0 92

0,00

SPSS-Diagramm Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

12 Zeitreihen I

6

Beispiel: Symplex-Bild für zwei Zeitreihen

Entnommen aus Schulze, Beschreibende Statistik, Oldenbourg Verlag, Quelle: Sachverständigenrat, Jahresgutachten 1995/1996

Hilfslinien der Verhältnisse 2:1 und 1:1

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

13 Zeitreihen I

Beispiel: Logarithmische Achseneinteilung

Der rasche Anstieg der Krankenkosten und das unterschiedliche Niveau der Ausgabengruppen verlangen für die Darstellung der Entwicklung über einen längeren Zeitraum den logarithmischen Maßstab auf der Merkmalsachse: Hier: Aufwendungen der gesetzlichen Krankenversicherung nach Leistungsarten Quelle: Jahresgutachten 1992/1993

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

14 Zeitreihen I

7

Beispiel: Liniendiagramm für die Entwicklung des BSP (Quartalswerte) Y: Bruttosozialprodukt eines Landes in Milliarden EURO Jahr 1

Jahr 2

Jahr 3 Entwicklung des BSP eines Landes

3,58

6,80

8,70

Quartal 2

7,15

11,90

13,80

Quartal 3

10,50

15,05

16,70

Quartal 4

14,95

16,65

18,35

20,00 BSP in Mrd. EURO

Quartal 1

15,00 10,00 5,00 0,00 1

2

3

4

5

6

7

8

9

10

11

12

Zeit (in Quartalen)

SPSS-Diagramm

Das Merkmal zeigt regelmäßige Schwankungen um die linear zunehmende Tendenz. Die Periodik p = 4 ist deutlich erkennbar. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

15 Zeitreihen I

Komponenten einer Zeitreihe Bei der Beschreibung des Verlaufs einer Zeitreihe geht man davon aus, dass sich die zeitlich geordneten Werte der Datenreihe auf bestimmte Komponenten zurückführen lassen. Diese werden eingeteilt nach: Bewegungskomponenten von Zeitreihen Systematische Komponenten Trend (T)

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

Restkomponenten (R)

Periodische Schwankungen (S)

16 Zeitreihen I

8

Komponenten einer Zeitreihe - Trend (T): Teil der Zeitreihe (Y), welcher Ausdruck der langfristigen Entwicklungstendenz des betrachteten Merkmals ist; - Periodische Schwankungen (S): Teil der Zeitreihe (Y), welcher Ausdruck regelmäßig auftretender konjunktureller und saisonaler Bewegungen ist; - Restschwankung (R): Teil der Zeitreihe (Y), welcher Ausdruck irregulärer Schwankungen in der Entwicklungstendenz des betrachteten Merkmals ist. Trend und periodische Schwankungen sind die systematischen Komponenten der Zeitreihe, die Restschwankung ist von zufälliger Natur. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

17 Zeitreihen I

Komponenten einer Zeitreihe

35000 30000 25000 20000 15000 10000 5000 0

Beispiel mit einmaligem „Bruch“

19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00

Lebendgeborene

Entw icklung der Zahl der Lebendgeborenen in MV

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

18 Zeitreihen I

9

Komponenten einer Zeitreihe Entwicklung des BSP eines Landes

BSP in Mrd. EURO

20,00

Beispiel mit Regelmäßig wiederkehrenden „Brüchen“

15,00 10,00 5,00 0,00 1

2

3

4

5

6

7

8

9

10

11

12

Zeit (in Quartalen)

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

19 Zeitreihen I

Grundmodelle der Komponentenverknüpfung • Additive Überlagerung: • Multiplikative Überlagerung:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Y=T+S+R, Y=T·S·R

¾Additive Überlagerung liegt vor, wenn die Schwankungsbreite aller Perioden absolut etwa gleich bleibt (Schlauch).

Zeit (in Quartalen)

1

2

3

4

5

6

7

8

9

10

11

¾Multiplikative Überlagerung liegt vor, wenn die Schwankungsbreite aller Perioden relativ etwa gleich bleibt (Trichter).

Zeit

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

20 Zeitreihen I

10

Methoden zur Bestimmung der Trendkomponente einer Zeitreihe ¾ Die Methode der gleitenden Durchschnitte ¾ Die Methode der kleinsten Quadrate (Kurvenanpassung)

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

21 Zeitreihen I

Bestimmung der Trendkomponente mittels gleitender Durchschnitte ¾ Man berechnet aus jeweils g aufeinanderfolgenden Zeitreihenwerten das arithmetisches Mittel und ordnet diesen Mittelwert dem mittleren der bei der Durchschnittsbildung berücksichtigten Zeitpunkte bzw. Zeitintervalle zu. ¾ Durch Mittelung aufeinanderfolgender Werte der Zeitreihe lassen sich die periodische Schwankungen und die Irregularitäten der Zeitreihe eliminieren. Damit isoliert man den Trend als zentrale Tendenz der Entwicklung. ¾ Die Anzahl g gibt die Ordnung des gleitenden Durchschnitts an. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

22 Zeitreihen I

11

Berechnungsformel der gleitenden Durchschnitte Die Berechnungsformeln der gleitenden Durchschnitte unterscheiden sich danach, ob g gerade oder ungerade ist. Für ungerade g mit g=2k+1: Für gerade g mit g=2k:

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

1 ~ yt = g

k

∑y

j =− k

1⎛y ~ y t = ⎜⎜ t − k + g⎝ 2

t+ j

k −1

∑y

j = − k +1

t+ j

+

yt + k 2

⎞ ⎟ ⎟ ⎠

23 Zeitreihen I

Kriterien zur Auswahl von g bei der Berechnung gleitender Durchschnitte Die Auswahl der Ordnung g der Glättung hängt davon ab, ob die Zeitreihe periodische Schwankungen aufweist oder nicht. ¾ Für Zeitreihen ohne periodische Schwankungen wird zumeist eine ungerade Ordnung gewählt. Je größer g ist, um so stärker wird der Glättungseffekt, aber es steigt auch der Werteverlust am Beginn und Ende der Reihe. ¾ Für Zeitreihen mit periodischen Schwankungen wird die Ordnung g der Glättung so groß wie die Periodik p der Zeitreihe gewählt. Man ist hier in der Wahl der Ordnung nicht mehr frei. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

24 Zeitreihen I

12

Beispiel: Berechnung gleitender Durchschnitte 3. Ordnung Monat

Wert

1

1,122

3er Durchschnitt

2

1,143

1,129

1,13

3

1,121

1,134

1,12

4

1,139

1,131

1,11

5

1,133

1,131

1,1

6

1,121

1,116

1,09

7

1,094

1,106

1,08

8

1,104

1,101

1,15 1,14

9

1,104

1,110

10

1,121

1,104

11

1,086

1,097

12

1,084

Zeitreihe Durchschnitte

0

1

2

3

4

5

6

7

8

9

10 11 12 13

1,129 = (1,122 + 1,143 + 1,121) / 3 1,134 = (1,143 + 1,121 + 1,139) / 3 1,131 = (1,121 + 1,139 + 1,133) / 3

...

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

25

Zeitreihen I

Beispiel: Berechnung gleitender Durchschnitte 5. Ordnung Monat

Wert

1

1,122

5er Durchschnitt

2

1,143

3

1,121

1,132

1,12

Zeitreihe

4

1,139

1,131

1,11

Durchschnitte

1,15 1,14 1,13

5

1,133

1,122

1,1

6

1,121

1,118

1,09

7

1,094

1,111

1,08

8

1,104

1,109

9

1,104

1,102

10

1,121

1,100

11

1,086

12

1,084

1

2

3

4

5

6

7

8

9

10 11 12 13

1,132 = (1,122 + 1,143 + 1,121 + 1,139 + 1,133) / 5 1,131 = (1,143 + 1,121 + 1,139 + 1,133 + 1,121) / 5 1,122 = (1,121 + 1,139 + 1,133 + 1,121 + 1,094) / 5

...

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

0

26

Zeitreihen I

13

Vergleich der gleitenden Durchschnitte 1,15

1,15

1,14

1,14

1,13

1,13

1,12

1,12

1,11

1,11

1,1

1,1

1,09

1,09

1,08

1,08 0

1

2

3

4

5

6

7

8

9

10

11

12

13

0

1

2

3

4

5

6

7

8

9

10

11

12

Glättung 3. Ordnung:

Glättung 5. Ordnung:

Der Werteverlust beträgt zwei Punkte.

Der Werteverlust beträgt vier Punkte.

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

13

27 Zeitreihen I

Vergleich der gleitenden Durchschnitte Bekanntes Beispiel: Kursverlauf von Aktien, hier DAIMLERCHRYSLER, Abfrage 15.06.2005. Weshalb gibt es keine fehlenden Punkte? Chart Intraday

1 Woche

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

1 Monat

6 Monate

1 Jahr

2 Jahre

3 Jahre

5 Jahre

28 Zeitreihen I

14

Beispiel: Berechnung gleitender Durchschnitte einer Zeitreihe mit periodischen Schwankungen Y: Bruttosozialprodukt eines Landes in Milliarden EURO je Quartal für 3 Jahre Jahr 2

Entwicklung des BSP eines Landes

Jahr 3

Quartal 1

3,58

6,80

8,70

Quartal 2

7,15

11,90

13,80

Quartal 3

10,50

15,05

16,70

Quartal 4

14,95

16,65

18,35

20,00 BSP in Mrd. EURO

Jahr 1

15,00 10,00 5,00 0,00

Periodik p = 4

1

2

3

Glättungsordnung g = 4

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

4

5

6

7

8

9

10

11

12

Zeit (in Quartalen)

29 Zeitreihen I

Beispiel: Berechnung gleitender Durchschnitte 4. Ordnung BSP

Gleitender Durchschnitt 4. Ordnung

1

3,20

2

7,15

3

10,50

4

14,95

10,44

5

6,80

11,61

6

11,90

12,39

7

15,05

12,84

8

16,65

13,31

9,40

9

8,70

13,76

10

13,80

14,18

11

16,70

12

18,35

Zeitreihe des BSP

15,00 10,00

Gleitende Duchschnitte 4. Ordnung

5,00 0,00 1 2 3 4 5 6 7 8 9 10 11 12 Zeit (in Quartalen)

SPSS-Diagramm 9 , 40 =

1 3, 20 6 ,80 ⋅( + 7 ,15 + 10 ,50 + 14 ,95 + ) 4 2 2

10 , 44 =

1 7 ,15 11 ,90 ⋅( + 10 ,50 + 14 ,95 + 6 ,80 + ) 4 2 2

Zeitreihen I

...

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

Entwicklung des BSP eines Landes 20,00 BSP in Mrd. EURO

Quartal

30

15

Vorteile und Nachteile der Methode der gleitenden Durchschnitte Vorteile:

Nachteil:

¾ Rechnerisch sehr einfach

¾Liefert keine mathematische Funktion

¾ Richtungsänderungen oder Krümmungen der Zeitreihe werden mitbeachtet.

¾„Verkürzung“ der Zeitreihe

Um diese Nachteile der Methode der gleitenden Durchschnitte aufzuheben, kann man die Methode der kleinsten Quadrate für die Analyse der Zeitreihe einsetzen.

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

31 Zeitreihen I

Bestimmung der Trendkomponente -Methode der kleinsten QuadrateUm den Trend einer Zeitreihen durch eine allgemeine Funktionsgleichung beschreiben zu können, kann die Methode der kleinsten Quadrate wie bei der Regressionsanalyse angewendet werden. Man geht von den Wertepaaren (t, yt) der Zeitreihe mit (t=1, 2, . . . , n) aus und verwendet das allgemeine Regressionsmodell für die Abbildung der Entwicklungstendenz.

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

32 Zeitreihen I

16

Lineare und quasilineare Ansätze für den Trend Einfacher linearer Ansatz:

T t = b1 + b 2 ⋅ t

Logarithmischer Ansatz:

T t = b 1 + b 2 ⋅ ln t

Exponentialansatz:

ln T t = b 1 + b 2 ⋅ t

Potenzansatz:

ln T t = b1 + b 2 ⋅ ln t

Hyperbolischer Ansatz: Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

T t = b1 + b2 ⋅

1 t

33

Zeitreihen I

Typischer linearer Zeitverlauf Mekrmalsausprägungen

¾ Es ist ein linearer Verlauf erkennbar.

1

2

3

4

5

6

Zeit

7

8

9

10

¾ Die Merkmalsgröße verändert sich über die Zeit absolut gleich bleibend, jedoch relativ abnehmend.

SPSS-Diagramm

Tt = b1 + b2 ⋅ t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

34 Zeitreihen I

17

Typischer exponentieller Zeitverlauf Merkmalausprägungen

¾ Es ist ein exponentieller Verlauf erkennbar.

1

2

3

4

5

6

7

8

9

¾ Die Merkmalsgröße verändert sich über die Zeit absolut zunehmend, jedoch relativ gleichbleibend.

10

Zeit

SPSS-Diagramm

Tt = e b

1

ln Tt = b1 + b2 ⋅ t

+ b2 ⋅t

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

35 Zeitreihen I

Typischer logistischer Zeitverlauf M e rk m a l s a u s p rä g u n g e n

¾ Die Merkmalsgröße verändert sich über die Zeit absolut zunehmend.

1

2

3

4

5

6

7

8

9

10

Zeit

¾ Die Zuwachsrate nimmt ab und die Merkmalsgröße strebt einer Sättigungsgrenze zu.

SPSS-Diagramm

Tt =

d 1 + exp( b1 + b2t )

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

mit b2 > 0 und d > 0 als Sättigungsgrenze 36 Zeitreihen I

18

Berechnung der Koeffizienten für die einfache lineare Trendfunktion (T) Tt = b1 + b2 ⋅ t n

b2 =

(t

n∑

b1 =

⋅ y t )−

t =1

n



t =1

⎛ n∑ t2 − ⎜ t =1 ⎝ n

n

n

t =1

t =1

n

t ⋅ ∑ yt t =1 2

n



t =1

n

⎞ t⎟ ⎠

t =1

t =1

⎛ ⎞ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

t

2

− t

2

=

s ty s t2

n

∑ t 2 ∑ y t − ∑ t ⋅ ∑ (t ⋅ y t ) n

y ⋅t − y ⋅t

=

n

2

= y − b2 ⋅ t

37 Zeitreihen I

Parameterschätzung nach MKQ

Tt = b 1 + b 2 ⋅ t Yt = b 1 + b 2 ⋅ x i

Trendfunktion

s ty b2 = 2 st

Regressionsfunktion

b2 =

s xy s 2x

Formelsammlung Regression! Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

38 Zeitreihen I

19

Beispiel: Lineare Trendfunktion für die Zahl der Studierenden t

yt

1989

1

12933

1990

2

13160

1991

3

13657

1992

4

13802

1993

5

14738

1994

6

16950

1995

7

18394

Entwicklung der Zahl der Studierenden 19000 Zahl der Studierenden

Jahr

18000 17000 16000 15000 14000 13000 12000 1988

1989

1990

1991

1992

1993

1994

1995

1996

SPSS-Diagramm

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

39 Zeitreihen I

Beispiel: Bestimmung der linearen Trendfunktion für die Zahl der Studierenden n

Y: Anzahl der Studierenden b2 = Jahr

t

yt



t.yt

1989

1

12933

1

12933

1990

2

13160

4

26320

1991

3

13657

9

40971

1992

4

13802

16

55208

1993

5

14738

25

73690

1994

6

16950

36

101700

1995

7

18394

49

128758

Summe

28

103634

140

439580

Mittelwert

4

14804,86

20

62797,14

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

=

n

n

t =1

t =1 2

n∑ (t ⋅ yt ) − ∑ t ⋅ ∑ yt t =1

⎛ n ⎞ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠ n

7 ⋅ 62797,14 − 28 ⋅103634 = 894,43 7 ⋅140 − 282

b1 = y − b2 ⋅ t = 14804,86 − 894,43 ⋅ 4

T = 11227 ,14 + 894 , 43 ⋅ t t 40

Zeitreihen I

20

Beispiel: Bestimmung einer exponentiellen Trendfunktion für die Zahl der Studierenden Jahr

t

yt

ln yt



1989

1

12933

9,47

1

9,47

1990

2

13160

9,48

4

18,97

1991

3

13657

9,52

9

28,57

1992

4

13802

9,53

16

38,13

1993

5

14738

9,60

25

47,99

1994

6

16950

9,74

36

58,43

1995

7

18394

9,82

49

68,74

Summe

28

103634

67,16

140

270,2 9

Mittelwe rt

4

14804,8 6

9,59

20

38,61

b2 =

=

n

n∑ (t ⋅ ln yt ) − ∑ t ⋅ ∑ ln yt t =1

t =1

t =1 2

⎞ ⎛ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠ n

n

7 ⋅ 270,29 − 28 ⋅ 67,16 = 0,06 7 ⋅140 − 282

b1 = ln y −b2 ⋅ t = 9,59− 0,06⋅ 4 = 9,36

lnTt = 9,36+ 0,06⋅ t

Y: Anzahl der Studierenden Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

n

n

t. ln yt

T t = e 9 , 36 + 0 , 06 ⋅ t

41

Zeitreihen I

Beispiel: Exponentielle Trendfunktion für die Zahl der Studierenden t

yt

1

12933

12321,5

Tt

1990

2

13160

13064,4

1991

3

13657

13852,0

1992

4

13802

14687,0

1993

5

14738

15572,4

1994

6

16950

16511,2

1995

7

18394

17506,6

Tt = e 9 , 36+ 0 , 06⋅t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

Entwicklung der Zahl der Studierenden 19000 Zahl der Studierenden

Jahr 1989

18000 17000 16000 15000 14000 13000 12000 1988

1989

1990

1991

1992

1993

1994

1995

1996

ln Tt = 9,36 + 0,06 ⋅ t 42 Zeitreihen I

21

Methode der exponentiellen Glättung ¾ In einer Periode t ergibt sich der Prognosewert für die Periode t+1 als gewogenes arithmetisches Mittel aus dem Beobachtungs- und Prognosewert für die Periode t. Als Gewichte werden α und (1- α) mit 0 < α < 1 genutzt. Der Wert α wird dabei als Glättungsparameter bezeichnet. ¾ Sie hat als Prognoseverfahren für Zeitreihen, die keinen ausgeprägten Trend und keine ausgeprägte Schwankung aufweisen, praktische Bedeutung erlangt. ¾ Der einfache Ansatz des exponentiellen Glättens ist die exponentielle Glättung erster Ordnung:

yˆ t +1 = α ⋅ y t + (1 − α ) yˆ t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

43 Zeitreihen I

Exponentielle Glättung für eine Zeitreihe mit n Beobachtungen yˆ n +1 = α ⋅ yn + (1 − α ) yˆ n

Empirische Reihe yt mit t = 1, 2, …,n

yˆ n +1 = α ⋅ y n + (1 − α ) ⋅ (α ⋅ y n −1 + (1 − α ) ⋅ yˆ n −1 ) = α ⋅ y n + α (1 − α ) y n −1 + (1 − α ) 2 yˆ n −1 = α ⋅ y n + α (1 − α ) y n −1 + (1 − α ) 2 (α ⋅ y n − 2 + (1 − α ) ⋅ yˆ n − 2 ) = α ⋅ y n + α (1 − α ) y n −1 + α (1 − α ) 2 y n − 2 + (1 − α ) 3 yˆ n − 2 ... n −1

= ∑ α (1 − α ) i y n −i + (1 − α ) n yˆ1

i =0 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

44 Zeitreihen I

22

Beispiel: Exponentielle Glättung (α = 0,8) Y: monatlicher Benzinpreis Mona t

Preis

Exponentielle Glättung y-Dach (α=0,8)

1

1,122

1,122

1,13

2

1,143

1,122

1,12

3

1,121

1,139

4

1,139

1,125

1,1

5

1,133

1,136

1,09

6

1,121

1,134

1,08

7

1,094

1,124

1,15

Preis

1,14

Zeitreihe Glättung (0,8)

1,11

0

1

2

3

4

5

6

7

8

9

10

11 12

13 14

Monat

8

1,104

1,100

9

1,104

1,103

10

1,121

1,104

11

1,086

1,118

12

1,084

1,092

SPSS-Diagramm

yˆ1 = y1 = 1,122

1,086

yˆ 3 = 0,8 ⋅1,143 + (1 − 0,8)1,122 = 1,139 45

...

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

yˆ 2 = 0,8 ⋅1,122 + (1 − 0,8)1,122 = 1,122

Zeitreihen I

Auswirkung des Glättungsparameter α yˆ n + 1 = α ⋅ y n + (1 − α ) yˆ n Die Formel zeigt, dass der aktuelle Beobachtungswert yn umso stärker berücksichtigt wird, je größer α gewählt wird. Der aktuelle Prognosenwert yn-Dach, in welchem sich die ganze Vergangenheit der Zeitreihe niederschlägt, wird dagegen umso stärker berücksichtigt, je kleiner α gewählt wird. Kleiner Wert α

großer Wert α

schwach

stark

stark

schwach

Glättungseffekte

groß

klein

Reagibilität der Prognose

klein

groß

Effekte Berücksichtigung aktueller Wert Berücksichtigung der Vergangenheitswerte

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

46 Zeitreihen I

23

Beispiel: Effekt des Glättungsfaktors bei der exponentiellen Glättung 1,15 1,14

Preis

1,13 Zeitreihe

1,12

Glättung (0,8) 1,11

Glättung (0,1)

1,1 1,09 1,08 0

1

2

3

4

5

6

7

8

9

Monat

Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik

10

11

12

13

14

SPSS-Diagramm 47

Zeitreihen I

24