Analyse von Zeitreihen ¾
Begriffe der Zeitreihe
¾
Komponenten einer Zeitreihe
¾
¾
-
Trend
-
Periodische Schwankungen
-
Restschwankungen
Bestimmung der Trendkomponente -
Methode der kleinsten Quadrate (MKQ)
-
Methode der gleitenden Durchschnitte
Exponentielle Glättung
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
1 Zeitreihen I
Bibliografie ¾
Prof. Dr. Kück; Statistik, Vorlesungsskript, Abschnitt 10.1 und 10.2
¾
Bleymüller/Gehlert; Statistische Formeln, Tabellen und Programme. Verlag Vahlen
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
2 Zeitreihen I
1
Zeitreihe Bei einer Zeitreihe handelt es sich um eine Reihe von Werten (y1, y2, . . . , yn) eines Merkmals (Y), die zu verschiedenen Zeitpunkten (bei Bestandsmassen) oder verschiedenen Zeiträumen (bei Bewegungsmassen) (t=1, 2, . . . , n) erhoben werden. In der Zeitreihenanalyse wird die Entwicklung des Merkmals Y nur in Abhängigkeit der Zeit betrachtet. Das bedeutet, dass die Zeit als Verursacher der Entwicklung aufgefasst wird. Verursacher der Entwicklung sind aber i. d. R. viele andere Sachmerkmale. Die Eingrenzung auf die Zeit in der Zeitreihenanalyse ist daher eine grobe Vereinfachung. Die Zeit fungiert als Repräsentant aller sachlichen Einflussfaktoren. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
3 Zeitreihen I
Beispiele von Zeitreihen Merkmale der Bevölkerung sowie Merkmale der Wirtschaft sind sich historisch entwickelnde Größen, deren Entwicklungen Aufschluss über gesellschafts-, wirtschaftsund sozialpolitische Phänomene geben. Ihre Merkmalswerte im Zeitverlauf bilden Zeitreihen. ¾ Bevölkerungsbestand der BRD am Jahresende ¾ Durchschnittliche Haushaltgröße in MV für mehrere Jahre im April (Mikrozensus) ¾ Jährliche Zahl der Geburten in der BRD ¾ Monatlicher Umsatz im produzierenden Gewerbe ¾ Monatliche Arbeitslosenquote im Arbeitsamtsbezirk Nord Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
4 Zeitreihen I
2
1. Problemkreis bei der Untersuchung von Zeitreihen ¾ Untersuchung der zeitlichen Entwicklung von Beständen; die Bestandsfortschreibung wird über die Zu- und Abgangsmassen vorgenommen. (Vgl. dazu Ausführungen zu Bestandsmassen in der Präsentation Grundbegriffe I, Folie 25 ff) Beispiel: •Bestandsfortschreibung der Bevölkerung über Geburten, Sterbefälle, Zuzüge und Fortzüge. •Bestandsfortschreibung von Lagerbeständen nach Artikeln über Warenein- und Warenausgang. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
5 Zeitreihen I
2. Problemkreis bei der Untersuchung von Zeitreihen ¾ Untersuchung von Gesetzmäßigkeiten in der zeitlichen Entwicklung eines Merkmals, die in ihrer kategorialen Bestimmung über den gesamten betrachteten Zeitraum hinweg als gleichartig angesehen werden können. ¾ Bestimmung dieser Gesetzmäßigkeiten (Zeitreihenmodell) und ihre Anwendung für die Vorausschätzung der zukünftigen Entwicklung (Prognosemodell). Beispiel: •Entwicklung der Erwerbstätigenzahl in Deutschland von 1989 bis 2001 und Prognose für das Jahr 2002 •Umsatzentwicklung eines Wirtschaftszweiges von 1989 bist 2001 und Prognose für die Jahre 2002 und 2003 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
6 Zeitreihen I
3
Grafische Darstellung einer Zeitreihe ¾ Die grafische Darstellung erfolgt in einem Koordinatensystem, in welchem auf der Abszisse die Zeit und auf der Ordinate die Merkmalsgröße abgetragen wird. Für diesen Zweck ist das Liniendiagramm zu bevorzugen, die Darstellung kann jedoch auch mit einer anderen Diagrammart erfolgen. ¾ Sie sollte immer der erste Schritt bei der Untersuchung von Gesetzmäßigkeiten einer Zeitreihe sein. ¾ Sie ist die einfachste und anschaulichste Form der Zeitreihenanalyse. ¾ Wenn der Wertebereich der Merkmalswerte sehr groß ist, kann es zweckmäßig sein, eine logarithmische Skala für die Ordinatenachse anzuwenden. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
7 Zeitreihen I
Beispiel: Liniendiagramm für die Entwicklung der Zahl der Lebendgeborenen Jahr
Y
33695
1993
9432
1981
31695
1994
8934
1982
31860
1995
9878
1983
30794
1996
11088
1984
30108
1997
12046
1985
30581
1998
12246
1986
29803
1999
12589
2000
13319
1987
30608
1988
28495
1989
26403
1990
23503
1991
13635
1992
10875
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
Entw icklung der Zahl der Lebendgeborenen in MV 35000 30000 25000 20000 15000 10000 5000 0 19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00
Y
1980
Lebendgeborene
Jahr
SPSS-Diagramm
Y: Anzahl der Lebendgeborenen in MV 8 Zeitreihen I
4
Beispiel: Säulendiagramm für die Entwicklung der Zahl der Lebendgeborenen Jahr
Y
Jahr
Y
Entw icklung der Zahl der Lebendgeborenen in MV
33695
1993
9432
1981
31695
1994
8934
1982
31860
1995
9878
1983
30794
1996
11088
1984
30108
1997
12046
30581
1998
12246
29803
1999
12589
2000
13319
1987
30608
1988
28495
1989
26403
1990
23503
1991
13635
1992
10875
35000 30000 25000 20000 15000 10000 5000 0
19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00
1985 1986
Lebendgeborene
1980
SPSS-Diagramm
Y: Anzahl der Lebendgeborenen in MV
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
9 Zeitreihen I
Beispiel: Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) Jahr
BRD
DDR
Jahr
BRD
DDR
Jahr
BRD
DDR
1960
2,37
2,35
1971
1,92
2,13
1982
1,41
1,86
1961
2,45
2,42
1972
1,72
1,79
1983
1,33
1,79
1962
2,44
2,42
1973
1,54
1,58
1984
1,29
1,74
1963
2,52
2,47
1974
1,51
1,54
1985
1,28
1,74
1964
2,55
2,48
1975
1,45
1,54
1986
1,35
1,70
1965
2,51
2,48
1976
1,46
1,64
1987
1,36
1,73
1966
2,54
2,43
1977
1,40
1,85
1988
1,42
1,67 1,58
1967
2,49
2,34
1978
1,38
1,90
1989
1,39
1968
2,39
2,30
1979
1,38
1,90
1990
1,48
1,52
1969
2,21
2,24
1980
1,45
1,94
1991
1,42
0,98
1970
1,99
2,19
1981
1,44
1,86
1992
1,40
0,83
Quelle: Neu, Axel, Frankfurt am Main 1996 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
10 Zeitreihen I
5
Beispiel: Liniendiagramm für die Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) 3
Geburtenziffern
2,5 2 BRD
1,5
DDR
1 0,5
19 6 19 0 62 19 6 19 4 66 19 6 19 8 70 19 7 19 2 7 19 4 76 19 7 19 8 80 19 8 19 2 84 19 8 19 6 88 19 9 19 0 92
0
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
SPSS-Diagramm 11
Zeitreihen I
Beispiel: Säulendiagramm für die Entwicklung der zusammengefassten Geburtenziffern (BRD, DDR) 3,00
Geburtenziffern
2,50 2,00 BRD
1,50
DDR
1,00 0,50
19 6 19 0 6 19 2 6 19 4 66 19 6 19 8 70 19 7 19 2 74 19 7 19 6 78 19 8 19 0 8 19 2 84 19 8 19 6 8 19 8 9 19 0 92
0,00
SPSS-Diagramm Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
12 Zeitreihen I
6
Beispiel: Symplex-Bild für zwei Zeitreihen
Entnommen aus Schulze, Beschreibende Statistik, Oldenbourg Verlag, Quelle: Sachverständigenrat, Jahresgutachten 1995/1996
Hilfslinien der Verhältnisse 2:1 und 1:1
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
13 Zeitreihen I
Beispiel: Logarithmische Achseneinteilung
Der rasche Anstieg der Krankenkosten und das unterschiedliche Niveau der Ausgabengruppen verlangen für die Darstellung der Entwicklung über einen längeren Zeitraum den logarithmischen Maßstab auf der Merkmalsachse: Hier: Aufwendungen der gesetzlichen Krankenversicherung nach Leistungsarten Quelle: Jahresgutachten 1992/1993
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
14 Zeitreihen I
7
Beispiel: Liniendiagramm für die Entwicklung des BSP (Quartalswerte) Y: Bruttosozialprodukt eines Landes in Milliarden EURO Jahr 1
Jahr 2
Jahr 3 Entwicklung des BSP eines Landes
3,58
6,80
8,70
Quartal 2
7,15
11,90
13,80
Quartal 3
10,50
15,05
16,70
Quartal 4
14,95
16,65
18,35
20,00 BSP in Mrd. EURO
Quartal 1
15,00 10,00 5,00 0,00 1
2
3
4
5
6
7
8
9
10
11
12
Zeit (in Quartalen)
SPSS-Diagramm
Das Merkmal zeigt regelmäßige Schwankungen um die linear zunehmende Tendenz. Die Periodik p = 4 ist deutlich erkennbar. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
15 Zeitreihen I
Komponenten einer Zeitreihe Bei der Beschreibung des Verlaufs einer Zeitreihe geht man davon aus, dass sich die zeitlich geordneten Werte der Datenreihe auf bestimmte Komponenten zurückführen lassen. Diese werden eingeteilt nach: Bewegungskomponenten von Zeitreihen Systematische Komponenten Trend (T)
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
Restkomponenten (R)
Periodische Schwankungen (S)
16 Zeitreihen I
8
Komponenten einer Zeitreihe - Trend (T): Teil der Zeitreihe (Y), welcher Ausdruck der langfristigen Entwicklungstendenz des betrachteten Merkmals ist; - Periodische Schwankungen (S): Teil der Zeitreihe (Y), welcher Ausdruck regelmäßig auftretender konjunktureller und saisonaler Bewegungen ist; - Restschwankung (R): Teil der Zeitreihe (Y), welcher Ausdruck irregulärer Schwankungen in der Entwicklungstendenz des betrachteten Merkmals ist. Trend und periodische Schwankungen sind die systematischen Komponenten der Zeitreihe, die Restschwankung ist von zufälliger Natur. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
17 Zeitreihen I
Komponenten einer Zeitreihe
35000 30000 25000 20000 15000 10000 5000 0
Beispiel mit einmaligem „Bruch“
19 80 19 82 19 84 19 86 19 88 19 90 19 92 19 94 19 96 19 98 20 00
Lebendgeborene
Entw icklung der Zahl der Lebendgeborenen in MV
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
18 Zeitreihen I
9
Komponenten einer Zeitreihe Entwicklung des BSP eines Landes
BSP in Mrd. EURO
20,00
Beispiel mit Regelmäßig wiederkehrenden „Brüchen“
15,00 10,00 5,00 0,00 1
2
3
4
5
6
7
8
9
10
11
12
Zeit (in Quartalen)
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
19 Zeitreihen I
Grundmodelle der Komponentenverknüpfung • Additive Überlagerung: • Multiplikative Überlagerung:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
Y=T+S+R, Y=T·S·R
¾Additive Überlagerung liegt vor, wenn die Schwankungsbreite aller Perioden absolut etwa gleich bleibt (Schlauch).
Zeit (in Quartalen)
1
2
3
4
5
6
7
8
9
10
11
¾Multiplikative Überlagerung liegt vor, wenn die Schwankungsbreite aller Perioden relativ etwa gleich bleibt (Trichter).
Zeit
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
20 Zeitreihen I
10
Methoden zur Bestimmung der Trendkomponente einer Zeitreihe ¾ Die Methode der gleitenden Durchschnitte ¾ Die Methode der kleinsten Quadrate (Kurvenanpassung)
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
21 Zeitreihen I
Bestimmung der Trendkomponente mittels gleitender Durchschnitte ¾ Man berechnet aus jeweils g aufeinanderfolgenden Zeitreihenwerten das arithmetisches Mittel und ordnet diesen Mittelwert dem mittleren der bei der Durchschnittsbildung berücksichtigten Zeitpunkte bzw. Zeitintervalle zu. ¾ Durch Mittelung aufeinanderfolgender Werte der Zeitreihe lassen sich die periodische Schwankungen und die Irregularitäten der Zeitreihe eliminieren. Damit isoliert man den Trend als zentrale Tendenz der Entwicklung. ¾ Die Anzahl g gibt die Ordnung des gleitenden Durchschnitts an. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
22 Zeitreihen I
11
Berechnungsformel der gleitenden Durchschnitte Die Berechnungsformeln der gleitenden Durchschnitte unterscheiden sich danach, ob g gerade oder ungerade ist. Für ungerade g mit g=2k+1: Für gerade g mit g=2k:
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
1 ~ yt = g
k
∑y
j =− k
1⎛y ~ y t = ⎜⎜ t − k + g⎝ 2
t+ j
k −1
∑y
j = − k +1
t+ j
+
yt + k 2
⎞ ⎟ ⎟ ⎠
23 Zeitreihen I
Kriterien zur Auswahl von g bei der Berechnung gleitender Durchschnitte Die Auswahl der Ordnung g der Glättung hängt davon ab, ob die Zeitreihe periodische Schwankungen aufweist oder nicht. ¾ Für Zeitreihen ohne periodische Schwankungen wird zumeist eine ungerade Ordnung gewählt. Je größer g ist, um so stärker wird der Glättungseffekt, aber es steigt auch der Werteverlust am Beginn und Ende der Reihe. ¾ Für Zeitreihen mit periodischen Schwankungen wird die Ordnung g der Glättung so groß wie die Periodik p der Zeitreihe gewählt. Man ist hier in der Wahl der Ordnung nicht mehr frei. Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
24 Zeitreihen I
12
Beispiel: Berechnung gleitender Durchschnitte 3. Ordnung Monat
Wert
1
1,122
3er Durchschnitt
2
1,143
1,129
1,13
3
1,121
1,134
1,12
4
1,139
1,131
1,11
5
1,133
1,131
1,1
6
1,121
1,116
1,09
7
1,094
1,106
1,08
8
1,104
1,101
1,15 1,14
9
1,104
1,110
10
1,121
1,104
11
1,086
1,097
12
1,084
Zeitreihe Durchschnitte
0
1
2
3
4
5
6
7
8
9
10 11 12 13
1,129 = (1,122 + 1,143 + 1,121) / 3 1,134 = (1,143 + 1,121 + 1,139) / 3 1,131 = (1,121 + 1,139 + 1,133) / 3
...
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
25
Zeitreihen I
Beispiel: Berechnung gleitender Durchschnitte 5. Ordnung Monat
Wert
1
1,122
5er Durchschnitt
2
1,143
3
1,121
1,132
1,12
Zeitreihe
4
1,139
1,131
1,11
Durchschnitte
1,15 1,14 1,13
5
1,133
1,122
1,1
6
1,121
1,118
1,09
7
1,094
1,111
1,08
8
1,104
1,109
9
1,104
1,102
10
1,121
1,100
11
1,086
12
1,084
1
2
3
4
5
6
7
8
9
10 11 12 13
1,132 = (1,122 + 1,143 + 1,121 + 1,139 + 1,133) / 5 1,131 = (1,143 + 1,121 + 1,139 + 1,133 + 1,121) / 5 1,122 = (1,121 + 1,139 + 1,133 + 1,121 + 1,094) / 5
...
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
0
26
Zeitreihen I
13
Vergleich der gleitenden Durchschnitte 1,15
1,15
1,14
1,14
1,13
1,13
1,12
1,12
1,11
1,11
1,1
1,1
1,09
1,09
1,08
1,08 0
1
2
3
4
5
6
7
8
9
10
11
12
13
0
1
2
3
4
5
6
7
8
9
10
11
12
Glättung 3. Ordnung:
Glättung 5. Ordnung:
Der Werteverlust beträgt zwei Punkte.
Der Werteverlust beträgt vier Punkte.
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
13
27 Zeitreihen I
Vergleich der gleitenden Durchschnitte Bekanntes Beispiel: Kursverlauf von Aktien, hier DAIMLERCHRYSLER, Abfrage 15.06.2005. Weshalb gibt es keine fehlenden Punkte? Chart Intraday
1 Woche
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
1 Monat
6 Monate
1 Jahr
2 Jahre
3 Jahre
5 Jahre
28 Zeitreihen I
14
Beispiel: Berechnung gleitender Durchschnitte einer Zeitreihe mit periodischen Schwankungen Y: Bruttosozialprodukt eines Landes in Milliarden EURO je Quartal für 3 Jahre Jahr 2
Entwicklung des BSP eines Landes
Jahr 3
Quartal 1
3,58
6,80
8,70
Quartal 2
7,15
11,90
13,80
Quartal 3
10,50
15,05
16,70
Quartal 4
14,95
16,65
18,35
20,00 BSP in Mrd. EURO
Jahr 1
15,00 10,00 5,00 0,00
Periodik p = 4
1
2
3
Glättungsordnung g = 4
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
4
5
6
7
8
9
10
11
12
Zeit (in Quartalen)
29 Zeitreihen I
Beispiel: Berechnung gleitender Durchschnitte 4. Ordnung BSP
Gleitender Durchschnitt 4. Ordnung
1
3,20
2
7,15
3
10,50
4
14,95
10,44
5
6,80
11,61
6
11,90
12,39
7
15,05
12,84
8
16,65
13,31
9,40
9
8,70
13,76
10
13,80
14,18
11
16,70
12
18,35
Zeitreihe des BSP
15,00 10,00
Gleitende Duchschnitte 4. Ordnung
5,00 0,00 1 2 3 4 5 6 7 8 9 10 11 12 Zeit (in Quartalen)
SPSS-Diagramm 9 , 40 =
1 3, 20 6 ,80 ⋅( + 7 ,15 + 10 ,50 + 14 ,95 + ) 4 2 2
10 , 44 =
1 7 ,15 11 ,90 ⋅( + 10 ,50 + 14 ,95 + 6 ,80 + ) 4 2 2
Zeitreihen I
...
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
Entwicklung des BSP eines Landes 20,00 BSP in Mrd. EURO
Quartal
30
15
Vorteile und Nachteile der Methode der gleitenden Durchschnitte Vorteile:
Nachteil:
¾ Rechnerisch sehr einfach
¾Liefert keine mathematische Funktion
¾ Richtungsänderungen oder Krümmungen der Zeitreihe werden mitbeachtet.
¾„Verkürzung“ der Zeitreihe
Um diese Nachteile der Methode der gleitenden Durchschnitte aufzuheben, kann man die Methode der kleinsten Quadrate für die Analyse der Zeitreihe einsetzen.
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
31 Zeitreihen I
Bestimmung der Trendkomponente -Methode der kleinsten QuadrateUm den Trend einer Zeitreihen durch eine allgemeine Funktionsgleichung beschreiben zu können, kann die Methode der kleinsten Quadrate wie bei der Regressionsanalyse angewendet werden. Man geht von den Wertepaaren (t, yt) der Zeitreihe mit (t=1, 2, . . . , n) aus und verwendet das allgemeine Regressionsmodell für die Abbildung der Entwicklungstendenz.
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
32 Zeitreihen I
16
Lineare und quasilineare Ansätze für den Trend Einfacher linearer Ansatz:
T t = b1 + b 2 ⋅ t
Logarithmischer Ansatz:
T t = b 1 + b 2 ⋅ ln t
Exponentialansatz:
ln T t = b 1 + b 2 ⋅ t
Potenzansatz:
ln T t = b1 + b 2 ⋅ ln t
Hyperbolischer Ansatz: Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
T t = b1 + b2 ⋅
1 t
33
Zeitreihen I
Typischer linearer Zeitverlauf Mekrmalsausprägungen
¾ Es ist ein linearer Verlauf erkennbar.
1
2
3
4
5
6
Zeit
7
8
9
10
¾ Die Merkmalsgröße verändert sich über die Zeit absolut gleich bleibend, jedoch relativ abnehmend.
SPSS-Diagramm
Tt = b1 + b2 ⋅ t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
34 Zeitreihen I
17
Typischer exponentieller Zeitverlauf Merkmalausprägungen
¾ Es ist ein exponentieller Verlauf erkennbar.
1
2
3
4
5
6
7
8
9
¾ Die Merkmalsgröße verändert sich über die Zeit absolut zunehmend, jedoch relativ gleichbleibend.
10
Zeit
SPSS-Diagramm
Tt = e b
1
ln Tt = b1 + b2 ⋅ t
+ b2 ⋅t
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
35 Zeitreihen I
Typischer logistischer Zeitverlauf M e rk m a l s a u s p rä g u n g e n
¾ Die Merkmalsgröße verändert sich über die Zeit absolut zunehmend.
1
2
3
4
5
6
7
8
9
10
Zeit
¾ Die Zuwachsrate nimmt ab und die Merkmalsgröße strebt einer Sättigungsgrenze zu.
SPSS-Diagramm
Tt =
d 1 + exp( b1 + b2t )
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
mit b2 > 0 und d > 0 als Sättigungsgrenze 36 Zeitreihen I
18
Berechnung der Koeffizienten für die einfache lineare Trendfunktion (T) Tt = b1 + b2 ⋅ t n
b2 =
(t
n∑
b1 =
⋅ y t )−
t =1
n
∑
t =1
⎛ n∑ t2 − ⎜ t =1 ⎝ n
n
n
t =1
t =1
n
t ⋅ ∑ yt t =1 2
n
∑
t =1
n
⎞ t⎟ ⎠
t =1
t =1
⎛ ⎞ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
t
2
− t
2
=
s ty s t2
n
∑ t 2 ∑ y t − ∑ t ⋅ ∑ (t ⋅ y t ) n
y ⋅t − y ⋅t
=
n
2
= y − b2 ⋅ t
37 Zeitreihen I
Parameterschätzung nach MKQ
Tt = b 1 + b 2 ⋅ t Yt = b 1 + b 2 ⋅ x i
Trendfunktion
s ty b2 = 2 st
Regressionsfunktion
b2 =
s xy s 2x
Formelsammlung Regression! Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
38 Zeitreihen I
19
Beispiel: Lineare Trendfunktion für die Zahl der Studierenden t
yt
1989
1
12933
1990
2
13160
1991
3
13657
1992
4
13802
1993
5
14738
1994
6
16950
1995
7
18394
Entwicklung der Zahl der Studierenden 19000 Zahl der Studierenden
Jahr
18000 17000 16000 15000 14000 13000 12000 1988
1989
1990
1991
1992
1993
1994
1995
1996
SPSS-Diagramm
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
39 Zeitreihen I
Beispiel: Bestimmung der linearen Trendfunktion für die Zahl der Studierenden n
Y: Anzahl der Studierenden b2 = Jahr
t
yt
t²
t.yt
1989
1
12933
1
12933
1990
2
13160
4
26320
1991
3
13657
9
40971
1992
4
13802
16
55208
1993
5
14738
25
73690
1994
6
16950
36
101700
1995
7
18394
49
128758
Summe
28
103634
140
439580
Mittelwert
4
14804,86
20
62797,14
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
=
n
n
t =1
t =1 2
n∑ (t ⋅ yt ) − ∑ t ⋅ ∑ yt t =1
⎛ n ⎞ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠ n
7 ⋅ 62797,14 − 28 ⋅103634 = 894,43 7 ⋅140 − 282
b1 = y − b2 ⋅ t = 14804,86 − 894,43 ⋅ 4
T = 11227 ,14 + 894 , 43 ⋅ t t 40
Zeitreihen I
20
Beispiel: Bestimmung einer exponentiellen Trendfunktion für die Zahl der Studierenden Jahr
t
yt
ln yt
t²
1989
1
12933
9,47
1
9,47
1990
2
13160
9,48
4
18,97
1991
3
13657
9,52
9
28,57
1992
4
13802
9,53
16
38,13
1993
5
14738
9,60
25
47,99
1994
6
16950
9,74
36
58,43
1995
7
18394
9,82
49
68,74
Summe
28
103634
67,16
140
270,2 9
Mittelwe rt
4
14804,8 6
9,59
20
38,61
b2 =
=
n
n∑ (t ⋅ ln yt ) − ∑ t ⋅ ∑ ln yt t =1
t =1
t =1 2
⎞ ⎛ n∑ t 2 − ⎜ ∑ t ⎟ t =1 ⎝ t =1 ⎠ n
n
7 ⋅ 270,29 − 28 ⋅ 67,16 = 0,06 7 ⋅140 − 282
b1 = ln y −b2 ⋅ t = 9,59− 0,06⋅ 4 = 9,36
lnTt = 9,36+ 0,06⋅ t
Y: Anzahl der Studierenden Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
n
n
t. ln yt
T t = e 9 , 36 + 0 , 06 ⋅ t
41
Zeitreihen I
Beispiel: Exponentielle Trendfunktion für die Zahl der Studierenden t
yt
1
12933
12321,5
Tt
1990
2
13160
13064,4
1991
3
13657
13852,0
1992
4
13802
14687,0
1993
5
14738
15572,4
1994
6
16950
16511,2
1995
7
18394
17506,6
Tt = e 9 , 36+ 0 , 06⋅t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
Entwicklung der Zahl der Studierenden 19000 Zahl der Studierenden
Jahr 1989
18000 17000 16000 15000 14000 13000 12000 1988
1989
1990
1991
1992
1993
1994
1995
1996
ln Tt = 9,36 + 0,06 ⋅ t 42 Zeitreihen I
21
Methode der exponentiellen Glättung ¾ In einer Periode t ergibt sich der Prognosewert für die Periode t+1 als gewogenes arithmetisches Mittel aus dem Beobachtungs- und Prognosewert für die Periode t. Als Gewichte werden α und (1- α) mit 0 < α < 1 genutzt. Der Wert α wird dabei als Glättungsparameter bezeichnet. ¾ Sie hat als Prognoseverfahren für Zeitreihen, die keinen ausgeprägten Trend und keine ausgeprägte Schwankung aufweisen, praktische Bedeutung erlangt. ¾ Der einfache Ansatz des exponentiellen Glättens ist die exponentielle Glättung erster Ordnung:
yˆ t +1 = α ⋅ y t + (1 − α ) yˆ t Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
43 Zeitreihen I
Exponentielle Glättung für eine Zeitreihe mit n Beobachtungen yˆ n +1 = α ⋅ yn + (1 − α ) yˆ n
Empirische Reihe yt mit t = 1, 2, …,n
yˆ n +1 = α ⋅ y n + (1 − α ) ⋅ (α ⋅ y n −1 + (1 − α ) ⋅ yˆ n −1 ) = α ⋅ y n + α (1 − α ) y n −1 + (1 − α ) 2 yˆ n −1 = α ⋅ y n + α (1 − α ) y n −1 + (1 − α ) 2 (α ⋅ y n − 2 + (1 − α ) ⋅ yˆ n − 2 ) = α ⋅ y n + α (1 − α ) y n −1 + α (1 − α ) 2 y n − 2 + (1 − α ) 3 yˆ n − 2 ... n −1
= ∑ α (1 − α ) i y n −i + (1 − α ) n yˆ1
i =0 Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
44 Zeitreihen I
22
Beispiel: Exponentielle Glättung (α = 0,8) Y: monatlicher Benzinpreis Mona t
Preis
Exponentielle Glättung y-Dach (α=0,8)
1
1,122
1,122
1,13
2
1,143
1,122
1,12
3
1,121
1,139
4
1,139
1,125
1,1
5
1,133
1,136
1,09
6
1,121
1,134
1,08
7
1,094
1,124
1,15
Preis
1,14
Zeitreihe Glättung (0,8)
1,11
0
1
2
3
4
5
6
7
8
9
10
11 12
13 14
Monat
8
1,104
1,100
9
1,104
1,103
10
1,121
1,104
11
1,086
1,118
12
1,084
1,092
SPSS-Diagramm
yˆ1 = y1 = 1,122
1,086
yˆ 3 = 0,8 ⋅1,143 + (1 − 0,8)1,122 = 1,139 45
...
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
yˆ 2 = 0,8 ⋅1,122 + (1 − 0,8)1,122 = 1,122
Zeitreihen I
Auswirkung des Glättungsparameter α yˆ n + 1 = α ⋅ y n + (1 − α ) yˆ n Die Formel zeigt, dass der aktuelle Beobachtungswert yn umso stärker berücksichtigt wird, je größer α gewählt wird. Der aktuelle Prognosenwert yn-Dach, in welchem sich die ganze Vergangenheit der Zeitreihe niederschlägt, wird dagegen umso stärker berücksichtigt, je kleiner α gewählt wird. Kleiner Wert α
großer Wert α
schwach
stark
stark
schwach
Glättungseffekte
groß
klein
Reagibilität der Prognose
klein
groß
Effekte Berücksichtigung aktueller Wert Berücksichtigung der Vergangenheitswerte
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
46 Zeitreihen I
23
Beispiel: Effekt des Glättungsfaktors bei der exponentiellen Glättung 1,15 1,14
Preis
1,13 Zeitreihe
1,12
Glättung (0,8) 1,11
Glättung (0,1)
1,1 1,09 1,08 0
1
2
3
4
5
6
7
8
9
Monat
Prof. Kück / Dr. Ricabal Delgado Lehrstuhl Statistik
10
11
12
13
14
SPSS-Diagramm 47
Zeitreihen I
24