Fachhochschule Stralsund. Forschungsbericht

Fachhochschule Stralsund Forschungsbericht Analyse und Kurzfristprognose von Zeitreihen für Energie- und Rohstoffmärkte mit Hilfe stochastischer nic...
Author: Frank Otto
36 downloads 1 Views 4MB Size
Fachhochschule Stralsund

Forschungsbericht

Analyse und Kurzfristprognose von Zeitreihen für Energie- und Rohstoffmärkte mit Hilfe stochastischer nichtlinearer Mehrgleichungsmodelle

Prof. Dr. Wolfgang Götze

II

Die Grafiken und Tabellen des Berichts sind urheberechtlich geschützt und dürfen nur zum Zweck der Ausbildung an der Fachhochschule Stralsund verwendet werden.

III

Abstract Der vorliegende Bericht ist im Verlauf eines Forschungsfreisemesters an der Fachhochschule Stralsund entstanden. Er stützt sich auf eine Literaturrecherche zu empirischen Untersuchungen an Zeitreihen aus dem Bereich des Energie- und Rohstoffhandels in den USA und setzt sich vor allem mit den methodischen Ansätzen verschiedener Autoren auseinander. Im ersten Teil des Berichts wird eine Methodik zur Modellierung autoregressiver Prozesse mit GARCH-Residuen vorgestellt, die vor allem für sehr volatile Stunden- und Tagesreihen auf den Energiemärkten geeignet und in dieser Form bisher nicht publiziert worden ist. Im zweiten Teil des Berichts wird eine Methodik zur Spezifikation von Zeitreihen-StrukturModellen präsentiert und an Monatsreihen aus dem Rohstoff- und Energiebereich erprobt. Die prognostischen Eigenschaften der verschiedenen nichtlinearen Mehrgleichungsmodelle werden durch Experimente mit Einschritt-Vorhersagen am aktuellen Rand untermauert und mit den Ergebnissen aus der Literatur verglichen. Die empirischen Untersuchungen stützen sich auf 61 Zeitreihen mit 88.464 Beobachtungen, darunter 18 Stundenreihen, 11 Tagesreihen und 32 Monatsreihen. Besonderer Wert wird auf die Erläuterung von Fachbegriffen aus der US-Energie-Statistik gelegt. Über den Energieund Rohstoffbereich hinaus werden auch einige volatile Zeitreihen der internationalen Finanzmärkte und der Labornutzung im Fachbereich Wirtschaft modelliert. Für die verwendeten Programmpakete EViews 5.0, ITSM 2000 und GivWin/STAMP 6.0 werden einführende Beispiele und ein Überblick zum jeweiligen methodischen Leistungsumfang gegeben. Die Stärken und Schwächen der drei Softwareprodukte sind einander gegenüber gestellt. Der Bericht ist so strukturiert, dass er begleitend für eine Lehrveranstaltung Quantitative Methoden im Rahmen des Master Studiengangs „Business Informatics“ eingesetzt werden kann. Stralsund, März 2005 Eine Aktualisierung der Literaturquellen und eine Verfeinerung der GARCH-Spezifikation mit Hilfe des BDS-Tests sind inzwischen hinzugekommen. Darüber hinaus wurden modellseitige Erweiterungen mit Hilfe von Dummy-Variablen für Tageszeiten und Tagesspitzen eingeführt und die Verbesserung der Prognosegüte dokumentiert. Stralsund, Juni 2006 Im Anhang des überarbeiteten Berichts sind Übungsaufgaben für das PC-Labor, Zusatzprogramme für EViews und technische Erweiterungen von EViews 6 gegenüber EViews 5 enthalten. Stralsund, Januar 2007 Einige formale Korrekturen sind vorgenommen worden. Stralsund, März 2011

IV

Gliederung Teil 1: 1. 2. 3. 4. 5. 6. 7. 8. 9.

Überblick zur Literatur ............................................................................................. Theoretische Grundlagen .......................................................................................... Stufen der Modellspezifikation ................................................................................. Erläuterung der untersuchten Datenbestände ........................................................... Demonstration eines Beispiels .................................................................................. Interpretation der empirischen Ergebnisse ............................................................... Zur Prognosegüte ausgewählter Zweigleichungsmodelle mit GARCH-Struktur..... Einführung in das Paket EViews 5.0 ........................................................................ Paketvergleich von EViews 5.0 mit ITSM 2000 ......................................................

Teil 2: 10. 11. 12. 13. 14. 15. 16. 17.

Methodik zur Spezifikation autoregressiver Modelle mit GARCH-Residuen 1 3 9 12 18 32 60 63 69

Methodik zur Spezifikation von Zeitreihen-Struktur-Modellen

Theoretische Grundlagen .......................................................................................... 81 Stufen der Modellspezifikation ................................................................................. 87 Erläuterung der untersuchten Datenbestände ........................................................... 88 Demonstration eines Beispiels .................................................................................. 89 Interpretation der empirischen Ergebnisse ............................................................... 99 Zur Prognosegüte von Strukturgleichungsmodellen................................................. 111 Einführung in das Programmpaket STAMP 6 .......................................................... 113 Paketvergleich von STAMP 6.0/GivWin mit EViews 5.0 ....................................... 119

Literaturverzeichnis und Datenquellen ............................................................................... 123 Sonstige Quellen und Abkürzungen .................................................................................... 125 Bilderverzeichnis ................................................................................................................. 127 Tabellenverzeichnis ............................................................................................................. 129 Deutsch-Englische Begriffsabgrenzung .............................................................................. 131 Anlagen Übungsaufgaben für das PC-Labor ..................................................................................... 134 Funktionaler Zuwachs von EViews 6 gegenüber EViews 5 ............................................... 135 Programmerweiterung für EViews (ab Version 5.0) .......................................................... 136 Ergänzende Quellen ............................................................................................................ 141

Kapitel 1

1.

1

Überblick zur Literatur

GARCH-Modelle haben sich in den letzten Jahren vor allem bei der Modellierung von Finanzmarktdaten bewährt (siehe Clements [2004]). Der Grund dafür bestand darin, dass Zeitreihen von Aktienkursen, Wechselkursen etc. als Random Walk aufgefasst werden können (vgl. Schlittgen [1995] S. 93 ff.). Da die Varianz eines Random Walks zeitvariabel (volatil) ist, ergeben sich zeitabhängige Prognoseintervalle für die Einschritt- und die Mehrschrittprognose (siehe Götze [2000], S. 183 ff.). Um die Risikodynamik beschreiben zu können, wurde zur Gleichung für den Erwartungswert (Punktprognose) eine weitere Gleichung für die Varianz (Intervallprognose) hinzu gefügt (vgl. Brockwell u. A. [2002], S. 349 ff.). Im Zusammenhang mit der Deregulierung der Energiemärkte in Amerika und Europa sind in den letzten Jahren Strombörsen und unabhängige Systemdienste (ISO: Independent System Operator) entstanden (siehe NYISO [2003], OMEL [2003], CAISO [2004], PJM [2004], NEISO [2005])1. In diesem Zusammenhang entstand ein Bedarf an effizienten Techniken zur Vorhersage von Stunden- und Tagespreisen für regionale Energieangebote. In verschiedenen Studien wurden •

ARIMA-Modelle (siehe Contreras u. A. [2002]),



AR-Modelle mit GARCH-Residuen (Garcia u. A. [2003] ),



Dynamische Regressionsmodelle mit GARCH-Residuen (siehe Nogales u. A. [2002], Guirguis u. A. [2004])

auf ihre Prognosetauglichkeit für Elektroenergiepreise untersucht. Parallel dazu sind auch alternative Ansätze, wie z. B. ARFIMA-Modelle, Kalman-Filter, Kointegrationsmodelle, Input-Output-Modelle oder neuronale Netze, in die Diskussion einbezogen worden (vgl. Carnero u. A. [2003], Hinz [2003], Serletis u. A. [2004], MateoGonzales u. A.[2005], Rodriguez u. A. [2004]). Eine Literaturrecherche zeigte, dass vor allem die Spezifikation von Regressionsmodellen mit GARCH-Residuen zu überzeugenden Anwendungsergebnissen führt, aber methodisch noch nicht so ausgereift ist, wie z. B. die klassische Box-Jenkins-Technik für ARIMA-Modelle (vgl. Götze [2000], S. 192 ff.). Es fiel vor allem auf, dass •

eher selten mit überprüfbaren statistischen Hypothesen gearbeitet,



dem Prinzip der sparsamen Parametrisierung zu wenig Aufmerksamkeit geschenkt,



der mittlere quadratische Vorhersagefehler der Punktprognose bei der Evaluierung überbetont wird.

Das begann mit dem Beitrag von Contreras u. A. [2002] und setzte sich bei Garcia [2003] fort. Letzterer stellte eine eher pragmatische Modellanpassung für GARCH-Prozesse vor, die weitgehend auf eine statistische Modellüberprüfung verzichtet. Im Gegensatz dazu gab Guirguis [2004] verschiedene Testverfahren und Gütekriterien zur Spezifikation bivariater GARCH-Modelle an, konnte aber noch keine in sich geschlossene Methodik vorweisen. Die folgende empirische Untersuchung soll dazu beitragen, die methodische Lücke zu schließen. Die Anwendungsbeispiele stammen aus dem Bereich des Business und umfassen in besonderem Maße Stundenprognosen für Elektroenergiepreise in Kalifornien, New York, New 1

NYISO und CAISO sind die unabhängigen Systemdienste der US Bundesstaaten New York bzw. Kalifornien. PJM ist eine regionale Stromverbund Organisation von 13 US Bundesstaaten. Die New England ISO umfasst 6 US Bundesstaaten im Nordosten der USA. OMEL ist eine spanische Stromhandelsorganisation.

2

Kapitel 1

England und Spanien, aber auch einige Tagesprognosen für wichtige Finanzmarktdaten. Darüber hinaus wurden Monatsdaten für den Elektroenergieverbrauch in Kalifornien untersucht. Dabei sollte festgestellt werden, inwieweit sich GARCH-Modelle auch auf Monatsdaten anwenden lassen. Analysiert wurden auch ausgewählte Rohstoffpreise, die nachweislich Einfluss auf die Energiepreise haben. Abgerundet wurde die Untersuchung mit einigen Zeitreihen aus dem Laborbetrieb im Fachbereich Wirtschaft. Eine Auswahl von Verlaufsmustern der untersuchten Zeitreihen enthält die folgende Tabelle. Tabelle 1.1

Beispiele für Zeitreihen mit zeitvariabler Varianz 12

900 800

10

700 8

600 500

6

400 4

300 200

2

100 0

0

1000 2000 3000 4000 5000 6000 7000 8000

1000 2000 3000 4000 5000 6000 7000

CENTPROKWH

GOLD

2.4

700

2.0

600 500

1.6

400

1.2 300

0.8

200

0.4

100 0

0.0 50

100

150

200

76 78 80 82 84 86 88 90 92 94 96 98 00 02

250

GAS_1

E1

13.2

120

12.8 100

12.4 12.0

80

11.6 60

11.2 10.8

40

10.4 20

10.0 9.6

0 90 91 92 93 94 95 96 97 98 99 00 01 02 R11

25

50

75 POOL

100

Kapitel 2

3

2. Theoretische Grundlagen 2.1 Einführung von ARCH- und GARCH-Prozessen Sei {Xt} eine geometrische Irrfahrt, d.h. ein identisch unabhängig verteilter Zufallsprozess Xt = µt + εt , wobei E(Xt) = µt und E(εtXt) = 0. Wird die Irrfahrt durch eine zusätzliche Gleichung für eine zeitvariable Varianz σ2t ergänzt, dann entsteht ein sogenannter ARCH (autoregressive conditional heteroscedasticity) Modellprozess. Beispiel 2.1 ARCH(1)-Modell für {εt}

σ 2t = ω + α ⋅ ε 2t −1 , wobei ω > 0 , α ≥ 0 und Var ([εtXt) = σ t 2 . Es wird meist εt ∼ N.V. (0, σt2) voraus gesetzt. Die logarithmierte, bedingte LikelihoodFunktion für normalverteilte Residuen {εt} lautet

(

)

ε 2t n −1 1 n 1 n 2 lnL (ω, α) = − ⋅ ln 2π − ∑ ln ω + α ⋅ ε t −1 − ∑ 2 2 t =2 2 t =2 ω + α ⋅ ε 2t −1 b

und ist bis auf die logarithmierten Dichten von εt , die ohnehin nicht bekannt und zudem für große n vernachlässigbar sind, mit der unbedingten Log-Likelihood-Funktion identisch. Eine konsistente ML-Schätzung ist unter den drei Bedingungen

(1)

ε E t  σt

(2)

 ε2  E t2  = 1 , σ   t

(3)

  ε2  E ln α ⋅ 2t   < 0   σ  t   

  = 0 , 

möglich. Die dritte Bedingung sichert sogar strenge Stationarität für die standardisierte Residuenfolge εt/σt .

4

Kapitel 2

Die Verallgemeinerung auf ein GARCH (generalised autoregressive conditional heteroscedasticity) Modell besteht darin, dass in die Volatilitätsgleichung zeitverzögerte Varianzen einbezogen werden. Auf diese Weise ist oft es möglich, die Anzahl der zu schätzenden Parameter zu reduzieren

Beispiel 2.2

GARCH(1, 1)-Modell für {εt} mit sparsamer Parametrisierung

σ 2t = ω + α ⋅ ε 2t −1 + β ⋅ σ 2t −1 , wobei ω > 0, α ≥ 0, β ≥ 0 und Var (εtXt) = σ t 2. Die logarithmierte, bedingte LikelihoodFunktion für normalverteilte Residuen {εt} lautet

lnLb (ω, α) = −

( )

n −1 1 n 1 n ε2 ⋅ ln 2π − ∑ ln σ 2t − ∑ t2 2 2 t =2 2 t =2 σ t

und ist bis auf die logarithmierten Dichten von εt , die ohnehin nicht bekannt und zudem für große n vernachlässigbar sind, mit der unbedingten Log-Likelihood-Funktion identisch. Nachteilig wirkt sich bei gewöhnlichen GARCH-Modellen aus, dass eine unterschiedliche Wirkung des Vorzeichens auf die Volatilität nicht berücksichtigt werden kann. Schlechte Nachrichten haben folglich bei Betragsgleichheit dieselbe Auswirkung wie gute Nachrichten. Deshalb sind verschiedene Ansätze entwickelt worden, um gewöhnliche GARCH-Modelle zu verfeinern.

2.2 Erweiterung der gewöhnlichen ARCH- und GACH-Modellprozesse Eine Möglichkeit zur Berücksichtigung des Vorzeichens der Innovationen εt besteht darin, die Quadrate aus der Varianzgleichung heraus zu nehmen.

Beispiel 2.3 EGARCH (exponential GARCH) Modell

( )

( )

ln σ 2t = ω + ln σ 2t −1 + θ ⋅ (Z t −1 ) + γ ( Z t −1 ) , wobei

Zt =

εt σt

identisch verteilt ist mit dem Erwartungswert 0 und der Varianz 1. Der Parameter θ beschreibt den Vorzeicheneffekt und der Parameter γ den Größeneffekt von Schocks auf die Volatilität (Varianzdynamik). Zum Schätzen wird die MA(∞)-Darstellung in ein ARMA(p, q)-Struktur überführt

Φ(B) ln σ 2t = ω + Θ(B) g(Z t ) , wobei p die Ordnung des Operatorpolynoms Φ(B) und q die Ordnung des Operatorpolynoms Θ(B) ist.

Kapitel 2

5

Eine weitere Möglichkeit, den Einfluss positiver und negativer Innovation auf die Varianz zu modellieren, besteht darin, eine Indikatorfunktion I(t) einzuführen, die zwei oder mehrere verschiedene Modellvarianten generiert:

Beispiel 2.4 TGARCH(1, 1)

σ 2t = ω + α ⋅ ε 2t −1 + β ⋅ σ 2t −1 + γ ⋅ ε 2t −1 ⋅ I( t ) , wobei I(t) = 1 für εt < 0 und I(t) = 0 sonst. Die Abkürzung TGARCH wird für Schwellwert GARCH-Modelle verwendet. Das T bezieht sich auf Threshold (engl. Schwelle). Eine Verallgemeinerung auf beliebige Potenzen der Standardabweichung führt auf das sogenannte PGARCH-Modell (Power ARCH).

Beispiel 2.5 PGARCH(1, 1)

σ δt = ω + α ⋅ ( ε t −1 − γ ⋅ ε t −1 ) + β ⋅ σ δt −1 , δ

wobei δ > 0, γ ≤ 1. Für δ = 2 und γ = 0 entsteht das GARCH(1, 1)-Modell. Für δ = 1 ergibt sich ein Modell für die Standardabweichung. Mit γ ≠ 0 lassen sich asymmetrische Effekte erfassen. Ein GARCH-Modell mit zeitvariabler Mittelwertfunktion mt ist das sogenannte CGARCH(component GARCH) Modell. Es dient zur Modellierung einer langfristigen Volatilitätsdynamik.

Beispiel 2.6 CGARCH(1, 1)

(

) ( ) − ω) + φ ⋅ (ε − σ ) ,

σ 2t − m t = ω + α ⋅ ε 2t −1 − ω + β ⋅ σ 2t −1 − ω m t = ω + ρ ⋅ (m t −1

2 t −1

2 t −1

wobei 0,99 ≤ ρ ≤ 1 die Konvergenzgeschwindigkeit von {mt} gegen ω bestimmt. Oft werden GARCH-Modelle verwendet, um die Residuen eines Regressionsmodells mit stochastischen Regressoren zu untersuchen, die jeweils zeitverzögert in den Ansatz eingehen.

Beispiel 2.7 Autoregression mit einer zusätzlichen, zeitverzögert wirkenden Einflussgröße und mit GARCH(1, 1)-Residuen

X t = d 0 + d1 ⋅ X t −1 + c1 ⋅ Yt −1 + ε t σ 2t = ω + α ⋅ ε 2t −1 + β ⋅ σ 2t −1 . Eine spezielle Erweiterung der Irrfahrtgleichung ist das GARCH-M (GARCH in Mean)Modell.

6

Kapitel 2

Beispiel 2.8 GARCH-M(1, 1) mit Standardabweichung

X t = d 0 + d1 ⋅ X t −1 + λ ⋅ σ t + ε t σ 2t = ω + α ⋅ ε 2t −1 + β ⋅ σ 2t −1 . Mitunter wird anstelle der Standardabweichung auch die logarithmierte Varianz in die Regressionsgleichung eingesetzt.

2.3 Bestimmung der Lag-Struktur in einem GARCH(p, q)-Modell Verallgemeinert auf beliebige Lags in den quadrierten Residuen bzw. den Varianzen ergibt sich als GARCH(p, q)-Modell q

(

)

p

(

)

σ 2t = ω + ∑ α i ⋅ ε 2t −i + ∑ β j ⋅ σ 2t − j , i =1

j=1

wobei ω > 0, αi ≥ 0, βj ≥ 0 und Var (εtXt) = σ t 2. Es gilt folgender Satz: Sei {εt} ein stationärer GARCH(p, q)-Prozess mit endlichen Momenten vierter Ordnung, d.h. E(ε4t) = c < ∞, dann folgt {ε2t} einem ARMA(m, p) Prozess mit m = max(p, q).

Der Beweis wird für den Spezialfall ARCH(1) ausgeführt.1 Wegen

(

)

ε 2t = σ 2t ⋅ Z 2t = σ 2t + σ 2t ⋅ Z 2t − 1 = ω + α ⋅ ε 2t −1 + η t sind für {ηt} die Eigenschaften des „weißen Rauschens“ zu zeigen:

( ) (

)

E(η t ) = E σ 2t ⋅ E Z 2t − 1 = 0

( ) [

] ( ) [ = (ω + 2αω E (ε ) + α E (ε ))⋅ 2 = const.

]

2 2 Var (η t ) = E σ 4t ⋅ E Z 2t − 1  = E σ 4t ⋅ 2 = E ω + α ⋅ ε 2t −1  ⋅ 2     2

2 t −1

( (

2

)

4 t −1

(

)) ( (

)

) (

)

Cov(η t , η t +s ) = E σ 2t ⋅ Z 2t − 1 ⋅ σ 2t +s ⋅ Z 2t +s − 1 = E σ 2t ⋅ Z 2t − 1 ⋅ σ 2t +s ⋅ E Z 2t +s − 1 = 0 , für s > 0. Für GARCH-Modelle wird analog verfahren.

1

Der Beweis für ARCH(p) ist z. B. bei Schlittgen [1996], S. 451 ff. nachzulesen.

Kapitel 2

7

Dieser Satz lässt folgende Strukturidentifikation eines GARCH-Modells zu: •

Ein Cut der Autokorrelationen der quadrierten Residuenfolge {ε2t} legt die Zeitverzögerungen der Varianzen fest.



Ein vergleichsweise mindestens ebenso großer Cut der partiellen Autokorrelationen bestimmt die Zeitverzögerungen der Residuenquadrate. Andernfalls legt das Muster der Autokorrelationen auch die Lag-Struktur der quadrierten Residuen fest.

2.4 Modellüberprüfung mit dem ARCH-LM-Test (Lagrange Multiplier Test) Um zu prüfen, ob die Residuen eines AR-Modells tatsächlich ARCH-Strukturen enthalten, wird ein so genannter ARCH-LM-Test durchgeführt. Die beiden Hypothesen lauten: H0: Es liegt keine ARCH-Struktur bis zum Lag q vor. HA: Es liegt eine ARCH-Struktur bis zum Lag q vor. Es wird dann ein Autoregressionsmodell für die quadrierten Residuen geschätzt q

ε 2t = β 0 + ∑ β i ⋅ ε 2t −i + a t i =1

und die zugehörige Engle-Statistik n⋅R2 (Anzahl der Beobachtungen mal Bestimmtheitsmaß) ausgewertet, die asymptotisch χ2-verteilt ist mit q Freiheitsgraden. Mit Hilfe des LM-Tests kann die Eingrenzung der Lags nach der visuellen Inspektion der Korrelogramme quadrierter Residuen statistisch überprüft werden. Der LM-Test kann auch auf die Residuen der autoregressiven Gleichung einer zweistufigen Schätzung angewendet werden, um zu prüfen, ob die entsprechende Varianzgleichung um einen quadratischen Fehlerterm erweitert werden sollte. Er neigt in der Phase der Spezifikation allerdings zur Unterschätzung der Modellordnung, so dass die begleitenden Optimierungskriterien das jeweilige Testergebnis durchaus aufheben können.

2.5

Modellüberprüfung mit dem BDS-Test

Weit verbreitet ist der von Brock, Dechert und Scheikman 1987 vorgeschlagene BDS-Test (vgl. www.faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf). Er funktioniert unabhängig von der Verteilung der Residuen und kann sowohl als Test auf nichtlineare Strukturen als auch als Test auf eine Fehlspezifikation von GARCH-Modellen eingesetzt werden. Der BDS-Test ist in einer jüngeren Simulationsstudie von Caporale u. A. noch einmal auf seine Zuverlässigkeit untersucht. worden. Dabei wurden logarithmierte standardisierte Residuen eines GARCH(1,1)-Prozesses analysiert (vgl. Caporale u. A. [2005]). Der BDS-Test basiert auf dem so genannten Korrelationsintegral Cm,ε für T Beobachtungen, einem Set von m ausgewählten Beobachtungen und einer Fehlerschranke Epsilon

8

Kapitel 2

C m ,ε =

T − m +1 T − m +1 m −1 2 ∑ ∑ ∏ I ε (X s+ j , X t + j ). Tm (Tm − 1) s =1 t =s +1 j= 0

Das Korrelationsintegral misst die Wahrscheinlichkeit, mit der sich unter m unabhängigen Beobachtungen zwei beliebige Beobachtungen um weniger ε unterscheiden, und nutzt dazu eine Indikatorfunktion Iε

1 if I ε ( x , y) =  0

x−y 1,96 ist. Anders ausgedrückt ist das Modell korrekt spezifiziert, wenn die ausgewiesene Grenzwahrscheinlichkeit zum Verwerfen der Nullhypothese kleiner als 5% ist. Bei der praktischen Durchführung des Tests werden für m meist die Werte von 2 bis 5 für m untersucht und ein Epsilon von 0,7 gewählt.

2.6

Verallgemeinerung der Modellklassen ARCH und GARCH

Schlittgen macht auf die Klasse der CHARMA(p, q, r, s)- (conditional heteroscedasticity ARMA) Prozesse von Tsay als einer sehr weit gefassten Verallgemeinerung von ARCH(p)Prozessen aufmerksam (vgl. Schlittgen [1996], S. 454). Dabei sind zwei Modellgleichungen zu schätzen:

Φ p (B) X t = Θ q (B) ε t ˆ +η . Α r (B) ε t = Β s (B) X t t Die Koeffizienten der ersten Modellgleichung (Beobachtungsgleichung) sind konstant, die der zweiten Modellgleichung (Innovationsgleichung) sind „weißes Rauschen“ mit einem Erwartungswert gleich Null und konstanten Kovarianz-Matrizen. Der ARCH(p)-Prozess entspricht einem CHARMA(0, 0, p, 0)-Prozess. Augenfällig ist die Erweiterungsmöglichkeit auf ARMA-Strukturen in der ersten Gleichung und auf zeitverzögerte Einschritt-Prognosen in der Innovationsgleichung. GARCH-Prozesse lassen sich in diesen Ansatz allerdings nicht einbetten.

Kapitel 3

3.

9

Methodik zur Spezifikation von autoregressiven (integrierten) -Modellen mit GARCH-Residuen

Die Spezifikation von Eingleichungsmodellen für die Klasse multiplikativer ARIMA Prozesse folgt einer mehrstufigen Auswahlprozedur, die in der Literatur beschrieben ist (vgl. Götze [2000], S. 198). Eine grafische Darstellung ist in Bild 3.1 zu sehen.

Modelleingrenzung

Auswahlkriterien

Prognosemodell

RMSE% RMAX% Trefferquoten

Vergleichsprognose korrekt spezifizierte Modelle

Modelle optimaler Kompliziertheit

Ensemble identifizierter Modelle

Modellüberprüfung

Modellschätzung

Modellidentifikation

Portmanteau-Test Durbin-Watson-Statistik Kumuliertes Periodogramm Overfitting Signifikanz-Test der Modellparameter Minimierung von AIC bzw. SBC

Auswertung von: Autokorrelationen partiellen Autokorrelationen Periodogramm Mean-Range-Diagramm Differenzen Histogramm und QQ-Plot

Modellklasse ARIMA (p,d,q)(pm,dm,qm)m

Bild 3.1

Modellspezifikation für multiplikative ARIMA-Modelle

Für den Fall autoregressiver Modelle mit GARCH-Residuen ist ein zweistufiges Verfahren entwickelt worden. Zuerst werden Einheitswurzel, Differenzen und Time-Lags der Autoregression bestimmt (vgl. Bild 3.2). Das führt im ersten Schritt auf die sogenannte Beobachtungsgleichung für Xt. Durch Auswertung der Korrelogramme der quadrierten Residuen in Verbindung mit dem LM-Test wird eine GARCH-Struktur maximaler Dimension identifiziert. Daran schließt sich die Spezifikation eines optimal parametrisierten GARCH-Modells an (vgl. Bild 3.3), was zu einer zusätzlichen Varianzgleichung führt. Dabei kann sich die LagStruktur der Beobachtungsgleichung noch einmal verändern. Mit Hilfe des entstehenden Zweigleichungsmodells werden dann Vergleichsprognosen erstellt, um die prognostischen Eigenschaften am aktuellen Rand zu evaluieren.

10

Kapitel 3

Bild 3.2

Spezifikation eines autoregressiven (integrierten) Modells mit stochastischen Regressoren

Die Arbeitsetappen des zweistufigen Auswahlverfahrens sind nachfolgend dargelegt: •

Bestimmung der Saisonstruktur mit Hilfe des Periodogramms und der Autokorrelationsfunktionen.



Einheitswurzeltest nach Dickey-Fuller und Phillips-Perron für die Originaldaten.



Wiederholung des Einheitswurzeltest für die saisonbereinigten Daten.



Beseitigung der Einheitswurzeln mittel Differenzenbildung.



Bestimmung der Lag-Struktur für ein autoregressives Modell mit Hilfe der partiellen Autokorrelationen pacf.



Schätzung eines parametersparsamen Modells mit signifikanten Parametern (Beobachtungsgleichung).



Auswertung der Autokorrelationen acf und der partiellen Autokorrelationen pacf der quadrierten Residuenfolge {εt2}.

Kapitel 3

11



Identifikation eines GARCH-Modells für die zeitvariablen Varianzen nach folgender Regel: Ein Cut in der acf bestimmt das maximale Lag der Varianzfolge. Das Maximum der Cuts in acf und pacf begrenzt die Lags der quadrierten Residuen.



Lagrange-Multiplier-Test zur Abgrenzung gegen höhere Lags in der Varianzgleichung.



Schätzung eines parametersparsamen autoregressiven (integrierten) Modells mit GARCH-Residuen (Beobachtungsgleichung und Varianzgleichung).



Wechsel der Modellklasse auf EGARCH oder PGARCH bei Konvergenzproblemen mit der Schätzroutine.



Überprüfung der Autokorrelation der Residuen mit Hilfe der Durbin-Watson-Statistik.



Überprüfung der Schiefe und des Q-Q-Plots der Residuen.



Erneuter LM-Test zur Abgrenzung gegen höhere Lags im Varianzmodell



BDS-Test zur Prüfung auf weitere nichtlineare Strukturen in den Residuen.

Modelleingrenzung

Prognosemodell

Varianzund Vergleichsprognose

korrekt spezifizierte Modelle

Modelle optimaler Kompliziertheit

Ensemble identifizierter Modelle

Modellüberprüfung

zweistufige Modellschätzung

Modellidentifikation

Teil 2

Bild 3.3

Auswahlkriterien

RMSE% RMAX%

BDS-Test, LM-Test Q-Statistik Durbin-Watson-Statistik Verteilungsparameter, QQ-Plot Signifikanz-Test der Modellparameter Minimierung von AIC bzw. SBC Konvergenzgeschwindigkeit prüfen Modellkorrekturen Autokorrelationen und partielle Autokorrelationen der quadrierten Residuen aus der Autoregression

GARCH-Spezifikation

Erweiterung eines autoregressiven (integrierten) Modells durch ein GARCHModell

12

Kapitel 3



Vergleich der Einschritt-Punkt- und Intervallprognose mit den Ist-Werten am aktuellen Rand.



Prognose der Varianz des Einschritt-Prognose-Fehlers.



Vergleich mit den Eingleichungsmodells.

Prognoseergebnissen

des

autoregressiven

(integrierten)

Beim Vergleich der Prognosegüte zwischen Eingleichungs- und Zweigleichungsmodell ist zu beachten, dass die Unterschiede zwischen den Fehlern der Punktprognose meistens gering ausfallen und der eigentliche Gewinn in der zusätzlichen Varianzprognose liegt, mit der sich das Risiko für die Punktschätzung quantifizieren lässt. Größere Unterschiede zwischen den Fehlern der Punktprognose können sich vor allem bei saisonalen Reihen ergeben, wenn die Lag-Struktur mit oder ohne multiplikative Modellterme abgebildet oder wenn die Varianz als externe Größe mit in die Beobachtungsgleichung einbezogen wird. 4.

Erläuterung der untersuchten Datenbestände

In die Untersuchung sind insgesamt 61 Zeitreihen mit 88.464 Beobachtungen eingegangen. Untergliedert nach der Periodisierung wurden modelliert •

18 Stundenreihen,



11 Tagesreihen,



1 Wochenreihe,



31 Monatsreihen.

Unterteilt nach Anwendungsfeldern wurden modelliert: •

17 Energiepreisreihen aus den USA und Spanien,



5 Finanzmarktreihen weltweit,



15 Elektroenergieumsatz- und -absatzreihen aus den USA,



7 Reihen zu Ölpreisen in den USA und weltweit,



6 Reihen zum Erdgaspreisen in den USA,



1 Reihe zum Absatz von Margarine eines Lebensmittelherstellers,



10 Reihen zum Zugang in PC-Labore der FH Stralsund.

Die Beschreibung der Zeitreihen ist in den folgenden Tabellen 4.1 bis 4.7 zu finden.

Kapitel 4

Tabelle 4.1

Durchschnittpreise für Elektroenergie pro Stunde in den USA und Spanien

Bezeichner

Abgrenzung

Werte von bis

USP10

Preis der ISO in Cent pro KWh1

10/2002-7/2003

7296

USP20

Preis für Absenken der Last für 10/2002-7/2003 den Folgetag in Cent pro KWh

7296

USP3

Preis für Hochfahren der Last für 10/2002-7/2003 den Folgetag in Cent pro KWh

7296

USP4

Preis für Absenken der Last für 10/2002-7/2003 die Folgestunde in Cent pro KWh

7296

USP5

Preis für Hochfahren der Last für 10/2002-7/2003 die Folgestunde in Cent pro KWh

7296

USP6

Ersatzmenge für die Folgestunde 10/2002-7/2003 in KWh

7296

EASTNY Preis für Elektroenergie $/MWh2 für New York East 3

Werteanzahl

Quelle UCEI UCEI UCEI UCEI UCEI UCEI

in 5.11.04 00.0029.12.04 23.00

1320

NYISO

EAST101 Preis für Elektroenergie in $/MWh 5.11.04 00.00aus der ständig im 10-Minuten- 29.12.04 23.00 Takt verfügbaren Kapazitätsreserve

1320

NYISO

EAST102 Preis für Elektroenergie in $/MWh 5.11.04 00.00aus der fallweise im 10-Minuten- 29.12.04 23.00 Takt verfügbaren Kapazitätsreserve

1320

NYISO

EAST30

Preis für Elektroenergie in $/MWh 5.11.04 00.00aus der operativen Reserve für 30 29.12.04 23.00 Minuten

1320

NYISO

NEHP

RCP-Preis in $/MWh

1.11.04-17.1.05

1872

NE-ISO

NEHD

DACD-Nachfrage in MWh

1.11.04-17.1.05

1872

NE-ISO

ESP

Preis in Cent pro KWh

10/2002-9/2003

8760

Omel

1

KWh 103 Wattstunden MWh 106 Wattstunden 3 Es gibt zwei Regulierungsgebiete für den Staat New York: EAST und WEST. Die Preise weisen aber im Untersuchungszeitraum keinen Unterschied auf. 2

13

14

Kapitel 4

Tabelle 4.2 Ausgewählte Finanzmarkt- und sonstige Daten Bezeichner

Abgrenzung

Werte von bis

DY97T

Dollar-Yen-Kurs Tagesabschluss

2.1.97-30.12.97

249

Markt-Daten

GDH

Goldpreis schluss

Tagesab- 2.1.73-20.10.04

7962

Markt-Daten

DJT

Dow Jones Tagesabschluss

2.1.90-20.10.04

3725

Markt-Daten

DAXT

DAX Tagesabschluss

2.1.90-20.10.04

3723

Markt-Daten

OPT

Rohölpreis Tagesabschluss

22.1.97-30.9.02

1423

Turtletrader

IBMT

IBM-Aktie Tagesabschluss

17.5.61 ff.

369

Jenkins/Watts

MARW

Absatz Margarine und Backfett in Tonnen wöchentlich

1/81-12/83

147

Eigene Erhebung, festtagsbereinigt

in

Dollar

Werteanzahl

Quelle

Tabelle 4.3 Labornutzung im Fachbereich Wirtschaft der FH Stralsund Bezeichner

Abgrenzung

Werte von bis

Werteanzahl

Quelle

PoolT

Pool- Eintritte pro Tag

Sep.-Dez. 2001

122

FHS

Lab1T

Labor 1- Eintritte pro Tag

Sep.-Dez. 2001

122

FHS

Lab2T

Labor 2- Eintritte pro Tag

Sep.-Dez. 2001

122

FHS

Lab3T

Labor 3- Eintritte pro Tag

Sep.-Dez. 2001

122

FHS

EH21T

Eingangseintritte pro Tag Haus 21

Sep.-Dez. 2001

122

FHS

PoolH

Pool- Eintritte pro Stunde

9/01-12/01

2928

FHS

Lab1H

Labor 1- Eintritte pro Stunde

9/01-12/01

2928

FHS

Lab2H

Labor 2- Eintritte pro Stunde

9/01-12/01

2928

FHS

Lab3H

Labor 3- Eintritte pro Stunde

9/01-12/01

2928

FHS

EH21H

Eingangseintritte pro Stunde Haus 21

9/01-12/01

2928

FHS

Kapitel 4

Tabelle 4.4 Bezeichner

Monatliches Energiegeschäft im US-Bundesstaat Kalifornien Abgrenzung

Werte von bis

Anzahl Werte

Quelle

R1

Umsatz Elektroenergie in TDollar4: Sektor Haushalte

1/90-7/03

163

EIA

R2

Umsatz Elektroenergie in TDollar: Sektor Handel

1/90-7/03

163

EIA

R3

Umsatz Elektroenergie in TDollar: Sektor Industrie

1/90-7/03

163

EIA

R4

Umsatz Elektroenergie in TDollar: Sektor Sonstige Bereiche

1/90-7/03

163

EIA

R5

Umsatz Elektroenergie in TDollar: Gesamt

1/90-7/03

163

EIA

R6

Absatz Elektroenergie in MWh: Sektor Haushalte

1/90-7/03

163

EIA

R7

Absatz Elektroenergie in MWh: Sektor Handel

1/90-7/03

163

EIA

R8

Absatz Elektroenergie in MWh: Sektor Industrie

1/90-7/03

163

EIA

R9

Absatz Elektroenergie in MWh: Sektor Sonstige Bereiche

1/90-7/03

163

EIA

R10

Absatz Elektroenergie in MWh: Gesamt

1/90-7/03

163

EIA

R11

Erlöse in Dollar/KWh: Sektor Haushalte

1/90-7/03

163

EIA

R12

Erlöse in Dollar/KWh: Sektor Handel

1/90-7/03

163

EIA

R13

Erlöse in Dollar/KWh: Sektor Industrie

1/90-7/03

163

EIA

R14

Erlöse in Dollar/KWh: Sektor Sonstige Bereiche

1/90-7/03

163

EIA

R15

Erlöse in Dollar/KWh: Gesamt

1/90-7/03

163

EIA

4

TDollar 103 Dollar

15

16

Kapitel 4

Tabelle 4.5

Rohölpreise in den USA

Bezeichner

Abgrenzung für US-Reihen

Werte von bis

Anzahl Werte

Quelle

CODPUUS

Erster Einkaufspreis für inländisches Rohöl: Cent per Barrel5

1/74-7/04

367

EIA

COFMUUS

Einkaufspreis für importiertes Rohöl (incl. Transportkosten): Cent per Barrel

1/74-7/04

367

EIA

COIMUUS

Einkaufspreis für Importiertes Rohöl (incl. Sämtliche Bezugskosten6): Cent per Barrel

1/74-7/04

367

EIA

RADMUUS

Aufkaufpreis von Raffinerien für inländisches Rohöl: Cent per Barrel

1/74-7/04

367

EIA

RAIMUUS

Aufkaufpreis von Raffinerien für importiertes Rohöl: Cent per Barrel

1/74-7/04

367

EIA

RACPUUS

Aufkaufpreis von Raffinerien für Rohöl insgesamt: Cent per Barrel

1/74-7/04

367

EIA

Tabelle 4.6 Erdgaspreise in den USA Bezeichner

Abgrenzung für US-Reihen

NGWPUUS

Erdgaspreis ab Förderstelle: Cent per 1000 cubic feet7

1/76-7/04

343

EIA

NGCGUUS

Erdgaspreis ab Zuleitung: Cent per 1000 cubic feet

1/84-7/04

247

EIA

NGRCUUS

Erdgaspreis für Abnehmer aus dem Sektor Haushalte: Cent per 1000 cubic feet

1/81-7/04

283

EIA

NGCCUUS

Erdgaspreis für Abnehmer aus dem Sektor Handel: Cent per 1000 cubic feet

1/84-7/04

247

EIA

NGINUUS

Erdgaspreis für Abnehmer aus dem Sektor Industrie: Cent per 1000 cubic feet

1/84-7/04

247

EIA

NGEIUUS

Erdgaspreis für Abnehmer aus dem Sektor Energieerzeugung: Cent per 1000 cubic feet

1/79-6/04

306

EIA

5

1 Barrel entspricht 0,1589873 m3 Produktpreis, Transportkosten, Zoll, Steuern, Abgaben 7 1 cubic foot entspricht 0,3048 m3 6

Werte von bis

Anzahl Werte

Quelle

Kapitel 4

Tabelle 4.7

Preise für Elektroenergie in den USA

Bezeichner

Abgrenzung für US-Reihen

Werte von bis

Anzahl Werte

Quelle

ESRCUUS

Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Haushalte

1/01-7/04

43

EIA

ESCMUUS

Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Handel

1/01-7/04

43

EIA

ESICUUS

Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Sektor Industrie

1/01-7/04

43

EIA

ESTCUUS

Durchschnittpreis für Elektroenergie in 100 Cent per KWh: Gesamt

1/01-7/04

43

EIA

17

18

Kapitel 5

5. Demonstrationsbeispiel GARCH Als Demonstrationsbeispiel wird die Zeitreihe „Stündlicher Preis für Elektroenergie in Cent pro kWh für Spanien“ (vgl. Tabelle 4.1) modelliert. Die Beobachtungen reichen vom 1.10.2002 bis zum 30.9.2003 und umfassen 8760 Werte. Bild 5.1 gibt einen optischen Eindruck der Preisdynamik. Da sich die Beobachtungen offensichtlich nicht in ein Intervall mit konstanter Breite einpassen lassen, ist von einer zeitvariablen Varianz auszugehen.

12 10 8 6 4 2 0 1000 2000 3000 4000 5000 6000 7000 8000 Bild 5.1

Zeitreihe ESP (Preis Cent pro kWh für Spanien)

Die Frequenzanalyse deutet im Periodogramm (vgl. Bild 5.2) und noch deutlicher im geglätteten Periodogramm (Bild 5.3) mit Peaks (engl. Spitze) bei 0,00594 = 1/168 und 0,04167 = 1/24 auf zwei sich überlagernde Zyklen hin. Es handelt sich dabei um den 24-Stunden-Rhythmus und den Wochentagsrhythmus von 168 Stunden. Die Harmonischen der ersten Peaks sind als weitere Spitzen bei den höheren Frequenzen zu erkennen. Sie können aber vernachlässigt werden. Der Monatszyklus bei der Frequenz 0,0015 = 1/672 spielt nur eine untergeordnete Rolle und wird bei der Modellierung nicht berücksichtigt. Die beiden Einheitswurzeltests nach Dickey-Fuller (vgl. Tabelle 5.1) und Phillips-Perron (vgl. Tabelle 5.2) lehnen die Nullhypothese ab. Demzufolge müssen keine einfachen Differenzen vorgeschaltet werden. Die Sichtprüfung der Reihe lässt zudem keinen Trend erkennen. Zur Modellierung der Saisonalität wird auf Saisondifferenzen verzichtet. Denn diese enthalten implizit einfache Differenzen. Hinzu kommt, dass Differenzen über sehr viele Beobachtungen, wie hier über 24 oder 168 Perioden, die Prognosegüte erfahrungsgemäß ganz erheblich schmälern können. In dem Zusammenhang ist auch zu beachten, dass EViews 5 eine Integration von differenzierten Reihen mit zwei unterschiedlichen saisonalen Differenzen nicht unterstützt.

Kapitel 5

19

Bild 5.2 Frequenzzerlegung der Varianz mit Peaks bei 0,00594 = 1/168 und 0,04167 = 1/24

Bild 5.3 Frequenzzerlegung der Varianz (geglättet)

20

Kapitel 5

Tabelle 5.1

Einheitswurzeltest nach Dickey-Fuller

Null Hypothesis: CENTPROKWH has a unit root Exogenous: Constant Lag Length: 24 (Automatic MAXLAG=24) based on SIC t-Statistic Augmented Dickey-Fuller test statistic Test critical values:

1% level 5% level 10% level

Prob.*

-7.500.892 -3.430.937 -2.861.684 -2.566.888

0.0000

*MacKinnon (1996) one-sided p-values.

H0 : Die Zeitreihe hat eine Einheitswurzel (erste Differenz). HA : Die Zeitreihe hat keine Einheitswurzel. Testverteilung:

Augmented Dickey-Fuller (ADF)- Statistik

Prüfgröße: Parameter d1 im ARI(1)-Modell ohne Absolutglied. Entscheidungsregel für eine Irrtumswahrscheinlichkeit α: - H0 wird verworfen, falls der kritische Wert größer als die Teststatistik tα ist. - H0 wird nicht verworfen, falls der kritische Wert kleiner als die Teststatistik tα ist. Im Beispiel gilt für α = 0,05: -7,5 < -2,861 ⇒ H0 wird verworfen. Tabelle 5.2 Einheitswurzeltest nach Phillips-Perron1 Null Hypothesis: CENTPROKWH has a unit root Exogenous: Constant Bandwidth: 128 (Newey-West using Bartlett kernel) Adj. t-Stat Phillips-Perron test statistic Test critical values:

1% level 5% level 10% level

-22.092.020 -3.430.935 -2.861.683 -2.566.888

Prob.* 0.0000

*MacKinnon (1996) one-sided p-values. 1

Es handelt sich hierbei um einen nichtparametrischen Test auf serielle Korrelation, bei dem eine Kerndichteoder Spektraldichteschätzung verwendet wird (vgl. EViews 5 S. 508 ff.) Der Hypothesenaufbau und die Entscheidungsregel entsprechen dem ADF-Test.

Kapitel 5

21

Deshalb werden die Zyklen mit Hilfe der partiellen Autokorrelationen an den jeweils signifikanten Lags gesetzt. Der Vorteil gegenüber einem multiplikativen ARIMA-Modell (vgl. Contreras u. A. [2002]) besteht darin, dass die Modellgleichung wesentlich weniger Terme umfasst. Das erleichtert die Handhabung und die Interpretation eines Modells ganz erheblich. Tabelle 5.3

Schätzung des autoregressiven Modells

CENTPROKWH Dependent Variable: Method: Least Squares Date: 10/14/04 Time: 13:05 Sample (adjusted): 194 8592 Included observations: 8399 after adjustments Model Equation Variable

Coefficient

C CENTPROKWH(-1) CENTPROKWH(-24) CENTPROKWH(-25) CENTPROKWH(-168) CENTPROKWH(-169) CENTPROKWH(-192) CENTPROKWH(-193)

0.048395 0.871781 0.314691 -0.260802 0.376141 -0.299481 0.111535 -0.127470

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.930874 0.930816 0.359029 1.081.615 -3.310.128 2.077.976

Std. Error 0.012190 0.005421 0.010523 0.010665 0.010250 0.010579 0.010901 0.010844

t-Statistic

Prob.

3.970.087 1.608.057 2.990.547 -2.445.342 3.669.839 -2.830.909 1.023.189 -1.175.447

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

0.0001 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 3.552.557 1.364.982 0.790125 0.796826 16142.24 0.000000

Die Modellgleichung nimmt explizit folgende Gestalt an: X t = 0,048 + 0,872 ⋅ X t −1 + 0,315 ⋅ X t − 24 − 0,261 ⋅ X t − 25 + 0,376 ⋅ X t −168 LL − 0,299 ⋅ X t −169 + 0,112 ⋅ X t −192 − 0,127 ⋅ X t −193 + ε t . Die Wahrscheinlichkeiten der kritischen Werte des t-Tests sind bei allen Parametern kleiner als 5%. Folglich sind alle Parameter statistisch gesichert. Die Minimierungskriterien AIC und SBC liegen mit 0,79 und 0,80 fast gleichauf. Die Durbin-Watson-Statistik wird mit 2,078 ausgewiesen. Demzufolge ist in den Residuen des Modells keine Autokorrelation erster Ordnung nachweisbar. Das Bestimmtheitsmaß beträgt 93%. Folglich kann das gewählte Modell 93% der Varianz der untersuchten Zeitreihe erklären. Um die maximalen Lags für das GARCH-Modell zu bestimmen, werden die Korrelogramme der quadrierten Residuen εt2 des autoregressiven Modells (vgl. Tabelle 5.4) ausgewertet.

22

Kapitel 5

Tabelle 5.4

Korrelogramme der quadrierten Residuen des autoregressiven Modells

Date: 11/10/04 Time: 13:24 Sample: 194 8592 Autocorrelation |** |* | | | | | | | |* | | | | | | | | | | | | |* |**

| | | | | | | | | | | | | | | | | | | | | | | |

Partial Correlation |** | | | | | | | | | | | | | | | | | | | | | |* |*

| | | | | | | | | | | | | | | | | | | | | | | |

AC 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

0.208 0.094 0.038 0.012 0.004 0.032 0.054 0.064 0.043 0.076 0.054 0.030 0.031 0.036 0.024 0.041 0.045 -0.000 -0.016 -0.012 0.008 0.045 0.095 0.225

PAC

Q-Stat

0.208 0.053 0.009 -0.002 -0.001 0.031 0.044 0.043 0.016 0.059 0.024 0.005 0.016 0.021 0.005 0.026 0.023 -0.028 -0.025 -0.013 0.008 0.039 0.074 0.191

363.90 437.77 449.90 451.20 451.36 459.71 484.49 518.63 534.18 582.66 607.00 614.43 622.57 633.71 638.40 652.68 669.86 669.86 672.11 673.38 673.87 690.58 766.31 1192.3

Prob 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

Nach der im Kapitel 2 formulierten heuristischen Entscheidungsregel für ein GARCH(p, q)Modell deuten die beiden Spitzen beim Lag 1 in beiden Korrelogrammen auf ein GARCH(1, 1)- Modell hin. Der LM-Test plädiert für eine Erweiterung der Lag-Struktur hinsichtlich der quadrierten Residuen im Varianzmodell (vgl. Tabelle 5.5). Ausgehend von einem GARCH(2, 2)-Ansatz wird schrittweise auf GARCH(1, 1) abgerüstet mit Hilfe der Kriterien von Akaike und Schwarz 2⋅L 2⋅k + T T 2 ⋅ L k ⋅ ln T SBC = − + , T T AIC = −

wobei L die Log-Likelihood Funktion ist

L=−

 1 T 2  T  ⋅ 1 + ln 2π + ln εt  ⋅    2  T t =1   



Kapitel 5

23

Tabelle 5.5 LM-Test für die Residuen des AR-Modells ARCH Test F-statistic Obs*R-squared

1.357.272 Probability 3.885.243 Probability

0.000000 0.000000

Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/20/06 Time: 18:57 Sample (adjusted): 197 8592 Included observations: 8396 after adjustments Variable

Coefficient

C RESID^2(-1) RESID^2(-2) RESID^2(-3)

Std. Error

0.095845 0.197087 0.051073 0.009217

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.046275 0.045934 0.379902 1.211.178 -3.785.401 1.999.976

t-Statistic

0.004630 0.010916 0.011112 0.010916

2.070.097 1.805.547 4.596.364 0.844363

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0.0000 0.0000 0.0000 0.3985 0.129061 0.388940 0.902668 0.906020 1.357.272 0.000000

Die optimale Parameteranzahl wird durch Minimieren des AIC- bzw. des SBC-Wertes ermittelt. Beide Optimierungskriterien, sowohl das nach Akaike als auch das nach Schwarz, empfehlen ein GARCH(2, 2)-Modell.

Tabelle 5.6 Auswahl eines Modells optimaler Kompliziertheit Statistik/Modell AIC SBC DW

GARCH(1,1)

GARCH(1,2)

GARCH(2,2)

0,6516 0,6600 2,0486

0,5854 0,5947 2,0656

0,5808 0,5908 2,0659

Die Durbin-Watson-Statistik wächst mit der Parameteranzahl, ohne dass der Test auf Autokorrelation erster Ordnung anschlägt.

24

Kapitel 5

Tabelle 5.7

Schätzung des Zweigleichungsmodells

Dependent Variable: CENTPROKWH Method: ML - ARCH Date: 10/14/04 Time: 12:27 Sample (adjusted): 194 8592 Included observations: 8399 after adjustments Convergence achieved after 16 iterations Variance backcast: ON GARCH = C(8) + C(9)*RESID(-1)^2 + C(10)*RESID(-2)^2 + C(11) *GARCH(-1) + C(12)*GARCH(-2) Model Equation Variable

Coefficient

CENTPROKWH(-1) CENTPROKWH(-24) CENTPROKWH(-25) CENTPROKWH(-168) CENTPROKWH(-169) CENTPROKWH(-192) CENTPROKWH(-193)

Std. Error

0.871072 0.371137 -0.308725 0.341728 -0.260033 0.102246 -0.118492

0.004060 0.006952 0.007458 0.005954 0.007006 0.007099 0.007355

z-Statistic

Prob.

2.145.688 5.338.725 -4.139.589 5.739.657 -3.711.592 1.440.381 -1.610.968

0.0000 0.0000 0.0000 0.0000 0.0000 0.0000 0.0000

Variance Equation Variable

Coefficient

C RESID(-1)^2 RESID(-2)^2 GARCH(-1) GARCH(-2)

7.87E-05 0.324110 -0.312190 1.132187 -0.143745

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0.930476 0.930385 0.360147 1.087.842 -2.427.013

Std. Error 1.19E-05 0.013640 0.013396 0.017547 0.017245

z-Statistic 6.606.104 2.376.254 -2.330.460 6.452.184 -8.335.479

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

Prob. 0.0000 0.0000 0.0000 0.0000 0.0000 3.552.557 1.364.982 0.580787 0.590839 2.065.888

Die Beobachtungsgleichung mit den GARCH-Residuen εt lautet X t = 0,871 ⋅ X t −1 + 0,371 ⋅ X t − 24 − 0,309 ⋅ X t − 25 + 0,342 ⋅ X t −168 − 0,260 ⋅ X t −169 + 0,102 ⋅ X t −192 − 0,118 ⋅ X t −193 + ε t . Die Varianzgleichung nimmt explizit folgende Gestalt an: σ 2t = 1,132 ⋅ σ 2t −1 − 0,144 ⋅ σ 2t − 2 + 0,324 ⋅ ε 2t −1 − 0,312 ⋅ ε 2t − 2 . Die Wahrscheinlichkeiten der kritischen Werte des t-Tests sind bei allen Parametern kleiner als 5%. Folglich sind alle Parameter statistisch gesichert. Im Unterschied zum autoregressiven Modell ist das Absolutglied in der Beobachtungsgleichung nicht signifikant. Die Schätzwerte für die Parameter weichen geringfügig voneinander ab. Die Minimierungskriterien AIC und SBC liegen mit 0,58 und 0,59 ebenfalls fast gleichauf. Ihre Werte sinken unter die entspre-

Kapitel 5

25

chenden Größen des autoregressiven Modells. Die Durbin-Watson-Statistik wird mit 2,066 auch etwas niedriger ausgewiesen. Auch in diesem Fall ist in den Modellresiduen keine Autokorrelation erster Ordnung nachweisbar. Das Bestimmtheitsmaß bleibt nahezu unverändert bei 93%, so dass sich mit dem Zweigleichungsmodell ebenfalls 93% der Varianz der untersuchten Zeitreihe erklären lassen. Anschließend werden die GARCH-Residuen des spezifizierten Zweigleichungsmodells auf Autokorrelation höherer Ordnung untersucht (vgl. Tabelle 5.8 und 5.9 sowie Bild 5.4). Mit Hilfe der Q-Statistik von Box und Ljung (vgl. Götze [2000], S. 150) wird ein entsprechender Test aufgebaut. Die entscheidende Inputgröße ist die empirische Autokorrelation rk der Residuen εt2 des autoregressiven Modells: T

∑ (ε t − ε )⋅ (ε t − k − ε )

rk =

t = k +1

T

.

∑ (ε t − ε )

2

t =1

Die Zahl der eingehenden Werte T ist gegenüber der Anzahl der Beobachtungen n um das maximale Lag der Autoregression reduziert. Der zugehörige Test ist folgendermaßen aufgebaut:

H0 : Es liegt keine Autokorrelation bis zum Lag k vor. HA : Es gibt Autokorrelation bis zum Lag k. k

Q * = T ⋅ (T + 1) ⋅ ∑

Testfunktion:

r j2

j =1 T

−j

Testverteilung unter H0: χ2-Verteilung mit k - p Freiheitsgraden (asymptotisch), wobei p die Anzahl der Parameter des Modells ohne das Absolutglied ist. Die Entscheidungsregel lautet: Ist für eine gegebene Irrtumswahrscheinlichkeit α der Wert von Q* kleiner als der zugehörige Vergleichswert, dann kann die Nullhypothese nicht verworfen werden. Es liegt keine Autokorrelation der quadrierten Residuen vor. Ist der Wert von Q* größer oder gleich dem Vergleichswert, dann wird die Nullhypothese verworfen. Im Beispiel liegt der Prüfwert für k = 24 mit 218,46 deutlich über dem Wert 22,263 des 5%Quantils der χ2-Verteilung für 24 – 11 Freiheitsgrade, so dass die Nullhypothese verworfen wird. Die Ursache hierfür ist in der sehr großen Stichprobe des Beispiels zu sehen, deren Umfang T quadratisch in die Testgröße eingeht. Da es nur eine Autokorrelation gibt, die beim Lag 24 am Rand der 2σ-Grenzen liegt, lässt den Testausgang in einem anderen Licht erscheinen.

2

Die Residuen {εt} sind wegen ihrer zeitvariablen Varianz kein „Weißes Rauschen“ {at}.

26

Kapitel 5

Tabelle 5.8

Korrelogramm der Residuen des GARCH-Modells

Date: 06/29/06 Time: 18:14 Sample: 194 8592 Included observations: 8399 Autocorrelation Partial Correlation | | | | | | | | | | | | | | | | | | | | | | | *|

| | | | | | | | | | | | | | | | | | | | | | | |

| | | | | | | | | | | | | | | | | | | | | | | *|

| | | | | | | | | | | | | | | | | | | | | | | |

AC 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

PAC 0.015 0.014 0.001 -0.000 0.002 -0.018 0.031 0.041 0.051 0.059 0.033 -0.003 -0.019 -0.004 0.011 -0.032 -0.029 -0.001 0.025 0.018 0.028 0.038 0.055 -0.082

Q-Stat

0.015 0.013 0.000 -0.000 0.002 -0.018 0.032 0.041 0.049 0.057 0.031 -0.006 -0.019 -0.003 0.010 -0.035 -0.035 -0.009 0.017 0.013 0.027 0.038 0.058 -0.080

19.425 34.777 34.814 34.821 35.176 62.908 14.458 28.662 50.790 79.862 88.946 89.038 92.223 92.345 93.274 101.82 108.78 108.79 114.19 116.82 123.31 135.60 161.31 218.46

Prob 0.163 0.176 0.323 0.481 0.621 0.391 0.044 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000 0.000

Es schließt sich ein Test auf Normalverteilung nach Jarque-Bera (vgl. Bild 5.4) an. Dieser Test ist wie folgt aufgebaut:

H0 : HA :

Die Residuen εt sind normalverteilt. Die Residuen εt sind nicht normalverteilt.

Testfunktion:

2 T − k  2 (g 2 − 3)  g1 +  6  4 

mit der Schiefe g1 und Wölbung g2, sowie T Residuenwerten und k geschätzten Modellparametern.

Testverteilung unter H0: χ2-Verteilung mit 2 Freiheitsgraden. Entscheidungsregel: Ist die ausgewiesene Wahrscheinlichkeit kleiner als 5%, dann ist H0 zu verwerfen. Ist hingegen die ausgewiesene Wahrscheinlichkeit größer gleich 5%, dann kann H0 nicht verworfen werden.

Kapitel 5

27

2400 Series: Standardized Residuals Sample 194 8592 Observations 8399

2000 1600 1200 800 400 0 -6

Bild 5.4

-4

-2

0

2

4

6

Mean Median Maximum Minimum Std. Dev. Skewness Kurtosis

0.011052 0.005264 8.022713 -6.820220 1.002624 0.382261 8.600527

Jarque-Bera Probability

11181.31 0.000000

8

Parameter und Verteilung der Residuen

Im Beispiel wird als Prüfwert 11181 ausgewiesen, der größer als das Quantil Chi-QuadratVerteilung für 2 Freiheitsgrade ist. Die Grenzwahrscheinlichkeit zum Verwerfen der Nullhypothese verschwindet. Dass die Normalverteilungshypothese zu verwerfen ist unterstützen auch P-P-Plot und der Q-Q-Plot der Residuen (vgl. Bild 5.5 und 5.6). P-P-Diagramm von Normal von Res Garch (2,2)

Q-Q-Diagramm von Normal von Res Garch (2,2)

1,0

4

Erwartete Kum. Wahrsch.

Erwarteter Wert von Normal

0,8 2

0

-2

0,6

0,4

0,2

-4

0,0 -5

0

5

10

Standardisierter beobachteter Wert

Bild 5.5 Q-Q-Plot der GARCH-Residuen

0,0

0,2

0,4

0,6

0,8

1,0

Beobachtete Kum. Wahrsch.

Bild 5.6 P-P-Plot der GARCH-Residuen

Der folgende BDS-Test (vgl. Tabelle 5.9) weist darauf hin, dass das Modell korrekt spezifiziert worden ist und keine weiteren Parameter zur Modellierung nichtlinearer Strukturen in den Residuen in die Varianzgleichung aufgenommen werden sollten. Die entsprechende V-Statistik liegt sowohl bei Paarvergleich als auch beim Tripelvergleich deutlich unter dem 5%-Quantil der Normalverteilung von 1,96.

28

Kapitel 5

Tabelle 5.9

BDS-Test für die Residuen des GARCH-Modells

BDS Test for RESID22 Date: 06/29/06 Time: 15:31 Sample: 1 8592 Included observations: 8592 Dimension

BDS Statistic Std. Error

2 3 4 5 6

0.027445 0.047636 0.057357 0.058724 0.055283

Raw epsilon Pairs within epsilon Triples within epsilon

0.001189 0.001890 0.002252 0.002350 0.002268

z-Statistic

Prob.

2.308.665 2.520.536 2.546.697 2.499.227 2.437.075

0.0000 0.0000 0.0000 0.0000 0.0000

0.425077 V-statistic V-statistic

0.703235 0.549010

Auch eine abschließende Anwendung des LM-Tests auf die quadrierten Residuen (vgl. Tabelle 5.10) bringt keine neuen Erkenntnisse. Die Nullhypothese (H0: Korrelation der quadrierten Residuen) wird erst ab einer Irrtumswahrscheinlichkeit von 16,24% abgelehnt. Zulässig wären 5%. Eine zusätzliche Erweiterung der Varianzgleichung kommt somit nicht in Frage.

Tabelle 5.10 Ergebnisse des LM-Test für die GARCH-Residuen ARCH Test: F-statistic Obs*R-squared

1.952.218 Probability 1.952.229 Probability

0.162385 0.162347

Test Equation: Dependent Variable: STD_RESID^2 Method: Least Squares Date: 06/29/06 Time: 15:25 Sample (adjusted): 195 8592 Included observations: 8398 after adjustments Variable

Coefficient

C STD_RESID^2(-1)

1.020.577 -0.015247

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

0.000232 0.000113 2.774.396 64626.30 -20484.84 2.000.232

Std. Error

t-Statistic 0.032201 0.010912

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

3.169.374 -1.397.218

Prob. 0.0000 0.1624

1.005.249 2.774.553 4.878.981 4.880.657 1.952.218 0.162385

Eine Modellerweiterung hätten alle drei Testverfahren (DW-Statistik, BDS-Test und LMTest) allerdings auch für sparsamer parametrisierte Modelle vom Typ GARCH(1, 1) und GARCH(1, 2) abgelehnt (vgl. Tabelle 5.11). Deshalb ist es wichtig, den LM-Test vor der Schätzung der Varianzgleichung durchzuführen und beim Abrüsten des Modells die Optimie-

Kapitel 5

29

rungskriterien anzuwenden. Insgesamt enthält das Zweigleichungsmodell (incl. Absolutglied) 12 Parameter, d. h. vier Parameter mehr als die Autoregression.

Tabelle 5.11 Testvergleich Statistik/Modell

GARCH(1,1)

GARCH(1,2)

GARCH(2,2)

H0 H0 H0

H0 H0 H0

H0 H0 H0

LM-Test BDS-Test DW

Der mittlere quadratische Prognosefehler wird im EViews 5 leider nur absolut ausgewiesen (vgl. Bild 5.7). Um ihn relativ zum Mittelwert auszudrücken, wird der Mittelwert der Beobachtungen im Vergleichszeitraum benötigt. Das kann mit Hilfe eines Samples geschehen, dass von der Beobachtung 8593 bis zur Beobachtung 8760 reicht. Der entsprechende Wert beträgt 4,816. Einen Vergleich der Fehlerkriterien zeigt Tabelle 5.12.

Tabelle 5.12 Vergleich von Einschritt-Prognosefehlern Fehler

AR-Modell

GARCH(1, 1)

GARCH(2, 2)

RMSE

0,341

0,341

0,341

RMSE %

7,080

7,090

7,087

MAE

0,249

0,249

0,251

MAPE %

5,215

5,208

5,237

Für einen Vergleichszeitraum von t = T,...., T + h mit den Beobachtungswerten xt und den Schätzwerten xˆ t sind die Fehler aus der Tabelle 5.12 wie folgt definiert:

RMSE =

1 T+h 2 ⋅ ∑ (xˆ t − x t ) , h t =T + 1

RMSE % =

MAE =

RMSE ⋅ 100 1 T+h ⋅ ∑ xt h t = T +1

1 T+h ⋅ ∑ xˆ t − x t , h t =T + 1

MAPE % =

100 T + h xˆ t − x t ⋅ ∑ . h t =T + 1 xt

30

Kapitel 5

Die Prognosefehler der Modelle in Tabelle 5.12 unterscheiden sich im Zeilenvergleich nur geringfügig. Gegenüber dem autoregressiven Modell tritt ein leichter Fehleranstieg ein, der beim korrekt spezifizierten GARCH(2, 2)-Ansatz geringfügig höher ausfällt, als bei einem unterparametrisierten GARCH(1, 1)-Ansatz. Das ist angesichts der geringen Änderungen bei der Parameterschätzung des autoregressiven Modells nicht weiter verwunderlich und zeigt, dass die Überlegenheit eines Zweigleichungsmodells, bestehend aus einer Beobachtungsgleichung autoregressiver Struktur und einer Varianzgleichung mit einer GARCH-Struktur, nicht an den Fehlern der Punktprognose festgemacht werden kann. Der Vorteil des Zweigleichungsmodells besteht vielmehr darin, dass Zusatzinformationen über die Risikodynamik erhältlich sind (vgl. Bild 5.7). Der Nutzer kann mit ihrer Hilfe die Zuverlässigkeit der Punktprognosen besser einschätzen und unter Einbeziehung von entsprechendem Fachwissen den ausgewiesenen Erwartungswert innerhalb des Prognoseintervalls verschieben. 9 Forecast: CENTPROKWHF_GARC Actual: CENTPROKWH Forecast sample: 8593 8760 Included observations: 168

8 7 6

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

5 4 3 2 1 8600

8625

8650

8675

8700

8725

8750

CENTPROKWHF_GARC

.7 .6 .5 .4 .3 .2 .1 .0 8600

8625

8650

8675

8700

8725

8750

Forecast of Variance

Bild 5.7

Einschrittprognose mit dem GARCH-Modell für eine Woche

0.341330 0.250563 5.237366 0.034571 0.010938 0.011294 0.977768

Kapitel 5

31

Die Vergleichsprognose für das autoregressive Modell enthält Bild 5.8. Eine Überlagerung der Punktprognose aus dem Zweigleichungsmodell mit den Ist-Werten zeigt das Bild 5.9.

8 Forecast: CENTPROKWHF_ARMA Actual: CENTPROKWH Forecast sample: 8593 8760 Included observations: 168

7 6

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

5 4 3 2

0.340794 0.249474 5.214904 0.034559 0.017614 0.019738 0.962648

1 8600

8625

8650

8675

8700

8725

8750

CENTPROKWHF_ARMA

Bild 5.8

Einschrittprognose mit dem autoregressiven Modell für eine Woche

8.000.000 7.000.000 6.000.000 5.000.000 4.000.000 3.000.000 2.000.000 1.000.000 0 1

25

49

73 Ist Spanien

Bild 5.9

97

121

ESP Garch

Vergleich der Einschrittprognose (GARCH) mit den Ist-Werten

145

32

Kapitel 6

6.

Interpretation der empirischen Ergebnisse

6.1

Analyse der Stundendaten für Elektroenergie

Die stündliche Preisentwicklung für Elektroenergie wies Zyklen über einen Tag (24 Beobachtungen) und über eine Woche (164 Beobachtungen) auf. Demgegenüber spielten monatliche und kalenderbedingte Schwankungen eine untergeordnete Rolle. Ein Trend war nicht erkennbar. Alle Einheitswurzeltests verwarfen die Nullhypothese. Gegenüber den Untersuchungen von Garcia [2003] wurden durch die zusätzliche Signifikanzprüfung insgesamt wesentlich weniger Parameter pro Modell geschätzt. Zwischen den einzelnen Reihen für ein Territorium und zwischen den Territorien waren jedoch wesentliche Unterschiede in der Modellstruktur festzustellen. •

Die 6 Reihen von der ISO Kalifornien wiesen ein besonders heterogenes Bild auf. Drei Modelle enthielten im autoregressiven Modell Terme beim Lag 1, beim Tages-Lag 24 bzw. 25, beim Wochen-Lag 164 bzw. 165 und zusätzlich einem gemischten TagesWochen-Lag von 192 bzw. 194. Letzteres weist auf die sogenannten multiplikativen Modellstrukturen von Box und Jenkins hin (siehe Götze [2000], S. 134). Die Varianzgleichungen waren höchstens von der Ordnung GARCH(2, 2). Drei Modelle enthielten allerdings gar keine Wochen-Terme. Dafür gab es ein Modell mit autoregressiven Termen bis zum Lag 3 (siehe Tabelle 6.3). Die Bestimmtheitsmaße fielen bei allen Reihen etwas ab, wenn die Varianzgleichung zur Beobachtungsgleichung hinzu gefügt worden sind. Das ist nicht weiter verwunderlich, weil das Minimum der Kleinste-Quadrate-Schätzung für das autoregressive Modell meistens verlassen wird.



Die 4 Reihen von der ISO aus New York hatten eine nahezu identische Modellstruktur (vgl. Tabelle 6.3). Die autoregressive Beobachtungsgleichung enthielt Terme beim Lag 1, beim Tages-Lag 24 bzw. 35 und beim Wochen-Lag 164 bzw. 165. Die Varianzgleichungen waren höchstens von Typ GARCH(1, 1). Insgesamt war eine geringere Parameterausstattung der Modelle gegenüber den für Kalifornien zu verzeichnen. Die Bestimmtheitsmaße fielen beim Übergang zur zweistufigen Schätzung ebenfalls etwas ab.



Die zwei Reihen von der ISO aus New England unterschieden sich nur geringfügig in der Modellstruktur (siehe Tabelle 6.3). Es traten Terme zum Lag 1, zum Tages-Lag 24 und zum Wochen-Lag 168 auf. Die Nachfragegleichungen enthielten zusätzlich einen Term zum Lag 2. Ein wesentlicher Unterschied bestand bei der Schätzgüte. Während die Nachfrage mit einem Bestimmtheitsmaß von 98,7% erklärt werden konnte, so gelang das für den Preis nur mit einem Bestimmtheitsmaß von 41,9%. Der Modellierungsversuch mit der Nachfrage als exogener Variabler führte zu keiner Verbesserung der Erklärungsgüte.



Die Reihe von OMEL aus Spanien enthielt im AR-Teil des Modells Terme zum Lag 1, zum Tages-Lag 24 und zum Wochen-Lag 168. Darüber hinaus waren auch Terme am vermischten Tages-Wochen-Lag 192 bzw. 193 signifikant. Für die Varianzgleichung ergab sich ein Modell des Typs GARCH(1, 1). Der Verlust an Erklärungsgüte beim Übergang zum Zweigleichungsmodell war marginal. Im Gegensatz zu den US-Reihen konnte ein sehr hohes Bestimmtheitsmaß von über 90% erreicht werden (vgl. Tabelle 6.3).

Eine mögliche Ursache für die niedrigen Bestimmheitsmaße der Preismodelle für Kalifornien, New England und New York hängt mit der Datenstruktur zusammen. Die US-Preis-Reihen enthielten zahlreiche singuläre Ausreißer. So fiel z. B. ein häufig wieder kehrender Wert 17,49 Dollar/kWh in den New Yorker Daten auf, der sich jeweils erheblich vom Vorgängerund Nachfolgerpreis unterschied und nur während der nachfrageschwachen Nachtstunden

Kapitel 6

33

auftrat. Die verfügbaren Unterlagen gaben allerdings keinen Aufschluss darüber, ob es sich bei dem besagten Wert um eine zufallsbedingte Preisschwankung oder einen Festpreis handelte, welcher in Stunden mit geringfügiger Nachfrage gesetzt wurde. Zahlreiche Fehlstellen und teilweise sogar negative Preise, wie in den Daten aus Kalifornien, wiesen zudem auf mögliche softwaretechnische Probleme hin. Ein Vergleich der verschiedenen Standardabweichungen und Variationskoeffizienten für die US-Reihen (CA bezeichnet Kalifornien und NY New York) und die Spanienreihe (ESP) belegte auf die erheblichen Volatilitätsunterschiede zwischen den Daten. Tabelle 6.1 s v

Vergleich von Streumaßen für Stundenreihen

ESP CA1 CA2 CA3 CA4 CA5 CA6 NY1 NY2 NY3 NY4 1,378 24,180 12,159 10,752 13,626 8,108 6,640 22,119 2,774 0,240 0,206 0,383 0,681 0,692 0,623 0,763 1,353 0,292 0,679 0,919 0,772 0,698

Angesichts der hervorragenden Ergebnisse bei der Nachfragemodellierung in New England wird ein entsprechendes Zweigleichungsmodell vorgestellt. Die Zeitreihe stündliche Nachfrage nach Elektroenergie (EE) in MWh ist in Bild 6.1 zu sehen. Die Ergebnisse der Modellschätzung enthält Tabelle 6.2. Die Punkt- und Intervallprognosen sind dem Bild 6.2 zu entnehmen.

20000 18000 16000 14000 12000 10000 8000 250

500

750

1000

1250

1500

Bild 6.1 EE-Nachfrage in New England vom 1.11.2004 bis zum 10.1.2005 Die Beobachtungsgleichung lautet X t = 126 ,171 + 0,992 ⋅ X t −1 − 0,057 ⋅ X t − 2 + 0, 407 ⋅ X t − 24 − 0,384 ⋅ X t − 25 + 0,534 ⋅ X t −168 − 0,501 ⋅ X t −169 + ε t . Die zugehörige Varianzgleichung hat die Gestalt

σ 2t = 51094,46 + 0,343 ⋅ ε 2t −1 .

34

Kapitel 6

Tabelle 6.2

Modellschätzung für die EE-Nachfrage in New England

Dependent Variable: Nachfrage Method: ML - ARCH (Marquardt) - Normal distribution Date: 01/24/05 Time: 11:58 Sample (adjusted): 170 1704

Included observations: 1535 after adjustments Convergence achieved after 24 iterations Variance backcast: ON

Model Equation Variable

Coefficient

C NACHFRAGE(-1) NACHFRAGE(-2) NACHFRAGE(-24) NACHFRAGE(-25) NACHFRAGE(-168) NACHFRAGE(-169)

Std. Error

126,170600 0,992049 -0,056724 0,407146 -0,383743 0,533572 -0,500680

z-Statistic

47,669960 0,013035 0,010263 0,010296 0,011483 0,011068 0,012233

Prob.

2,646752 76,108370 -5.526957 39,544490 -33,419290 48,207360 -40,928740

0,0081 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Variance Equation Variable

Coefficient

C RESID(-1)^2

Std. Error

51094,46 0,343215

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0,986990 0,986921 266,2923 1,08E+08 -10704,72

z-Statistic

1743,276 0,034218

Prob. 29,30945 10,03031

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

14278,820 2328,517 13,95924 13,99053 1,887118

20000 Forecast: NACHFRAGEFNEU Actual: NACHFRAGE Forecast sample: 1705 1872 Included observations: 168

18000 16000

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

14000 12000 10000

298.0686 204.5688 1.485390 0.010151 0.001624 0.000000 0.998376

8000 1725

1750

1775

1800

1825

1850

NACHFRAGEFNEU

700000 600000 500000 400000 300000 200000 100000 0 1725

1750

1775

1800

1825

0,0000 ,.0000

1850

Forecast of Variance

Bild 6.2 Prognose der EE-Nachfrage in New England vom 11.1. bis 17.1.2005

Kapitel 6

35

36

Kapitel 6

Kapitel 6

37

38

6.2

Kapitel 6

Analyse ausgewählter täglicher Finanzmarktdaten

Bei der Analyse täglicher Finanzmarktdaten (vgl. Tabelle 6.5) zeigten die Einheitswurzeltests an, dass einfache Differenzen aufzulegen sind. Die Beobachtungsgleichung war zumeist autoregressiv von erster Ordnung. Nur beim Rohölpreis wurde das Modell um einen Gleitmittelterm erster Ordnung auf ARIMA(1, 1, 1) erweitert. Die Korrelogramme der quadrierten Residuen wiesen nicht in jedem Fall einen Cut auf, der zur Identifikation der Modellstruktur des Varianzmodells hätte verwendet werden können. In diesen Fällen wurde der Standardansatz GARCH(1,1) genutzt. Die Bestimmtheitsmaße der spezifizierten Modelle betrugen mindestens 95%. Die Schiefe lag bei allen Reihen betragsmäßig unter eins. Bei der DAX-Reihe ließ sich die Schiefe durch Logarithmieren etwas verringern, und zwar von 0,69 auf 0,16. Auf die Modelstruktur hatte das aber keinen Einfluss. Auch der RMSE% bliebt unverändert bei 0,85%. Exemplarisch wird ein Zweigleichungsmodell für den Goldpreis in Dollar (Tagesabschluss) vorgestellt. Die Zeitreihendarstellung ist Bild 6.3 zu entnehmen. Die Ergebnisse der Modellschätzung fasst Tabelle 6.4 zusammen. Die Modellgleichungen werden explizit angegeben. Die Intervall- und Varianzprognosen zeigt Bild 6.4.

900 800 700 600 500 400 300 200 100 0 1000 2000 3000 4000 5000 6000 7000 Bild 6.3

Entwicklung des Goldpreises vom 2.1.97 bis zum 31.8.04

Die spezifizierte Beobachtungsgleichung (vgl. Tabelle 6.3) lautet X t = 1,055 ⋅ X t −1 − 0,055 ⋅ X t −2 + ε t . Die zugehörige Varianzgleichung hat die Gestalt

σ 2t = 0,044 + 0,936 ⋅ σ 2t −1 + 0,170 ⋅ ε 2t −1 − 0,104 ⋅ ε 2t −2 .

Kapitel 6

Tabelle 6.4

Modellschätzung zur Reihe Goldpreis in Dollar

Dependent Variable: D(GOLD,1,0) Method: ML - ARCH (Marquardt) - Normal distribution Date: 12/31/04 Time: 18:25

Sample (adjusted): 3 7926 Included observations: 7924 after adjustments Convergence achieved after 24 iterations Variance backcast: ON

Model Equation Variable

Coefficient

D(GOLD(-1),1,0)

Std. Error

-0,055551

0,013457

z-Statistic

Prob.

-4,128031

0

Variance Equation Variable

Coefficient

Std. Error

C RESID(-1)^2 RESID(-2)^2 GARCH(-1)

0,044317 0,169702 -0,104377 0,936445

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0,002873 0,00237 5,329722 224946,6 -20298,19

0,003523 0,008612 0,008763 0,001937

z-Statistic

Prob.

12,57857 19,7055 -11,91054 483,4864

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

0,043154 5,336048 5,124481 5,128883 1,99898

430 Forecast: GOLDFNEU Actual: GOLD Forecast sample: 7927 7962 Included observations: 36

420

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

410

400

390 7930

7935

7940

7945

7950

7955

7960

7955

7960

GOLDFNEU

17 16 15 14 13 12 11 10 9 8 7930

7935

7940

7945

7950

Forecast of Variance

Bild 6.4

Prognose des Goldpreises vom 1.9.04 bis zum 20.10.04

0 0 0 0

3.232548 2.697303 0.657098 0.003942 0.021697 0.013993 0.964310

39

40

Kapitel 6

Kapitel 6

6.3

41

Analyse der Labornutzung am Fachbereich Wirtschaft der FH Stralsund

Die Analyse der Eintrittshäufigkeit in das Gebäude und in die PC-Labore des FB Wirtschaft der FH Stralsund führte auf einen Zyklus über 24 Beobachtungen für Stundendaten (Tageszyklus) und auf einen Zyklus über 7 Beobachtungen für Tagesdaten (Wochenzyklus) auf. Die angesetzten Einheitswurzeltests verwarfen die Nullhypothese, so dass keine Differenzen aufgelegt werden müssten. Die Varianzgleichungen reichten bis zum Modelltyp GARCH(2, 2). Die identifizierten Modellstrukturen wiesen bemerkenswerte Unterschiede sowohl zwischen den Eintrittsbereichen als auch zwischen den Stunden- und den Tagesaufzeichnung auf. •

Für die 6 Stundenreihen (vgl. Tabelle 6.7) wurden überwiegend autoregressive Modelle mit Termen am Lag 1 und am Lag 2, sowie am Tages-Lag 24 identifiziert. Eine Ausnahme davon bildete das Labor 1, bei dem der Parameter für das Lag 1, nicht aber der für das Lag 2 signifikant geschätzt werden konnte. Modellerweiterungen am Tages-Lag waren beim Übungspool (Term für Lag 25) und bei der Eingangstür (Terme für Lag 25) zu verzeichnen. Die Erklärungsgüte lag für alle vier Pools unter 15%. Lediglich das Modell für den Hauseintritt erreichte ein Bestimmtheitsmaß von 53% im Eingleichungsansatz und von 46% im Zweigleichungsansatz. Die GARCH-Strukturen umfassten zwischen einem und vier Parameter. Im Fall von Labor 1 musste auf ein EGARCH-Modell ausgewichen werden, um statistisch signifikante Parameterschätzungen zu erhalten.



Für die 6 Tagesreihen (vgl. Tabelle 6.8) ergaben sich sparsam parametrisierte Modelle. Neben dem Wochen-Lag 7, das allerdings in der Reihe für den Eingang zum Gebäude nicht signifikant war, traten Terme zum Lag 1 für Labor 3, den Übungspool und den Eingang auf. Bei Labor 2 wurde darüber hinaus der Parameter für Lag 5 und beim Eingang zusätzlich der Parameter für Lag 3 signifikant. Die einstellbare Parameteranzahl in den Varianzmodellen reichten von 1 beim Pool bis zu 4 beim Labor 2. Schätzprobleme beim Standardansatz führten dazu, dass bei Labor 3 auf ein EGARCH(1, 1)-Modell und bei Labor 2 auf ein CGARCH(2, 2)-Modell ausgewichen werden musste. Die Erklärungsgüte lag beim Eingleichungsansatz unter 30% und bei Zweigleichungsansatz unter 20%.

Exemplarisch wird das Stunden-Modell für den Eingang von Haus 21 vorgestellt. Die Zeitreihe ist im Bild 6.5 dargestellt. Auffällig sind zahlreiche Nullen in der Zeit vom 17.9.91 bis 29.9.91, als durch einen Softwarefehler die Aufzeichnung ausfiel. Die Modellspezifikation beginnt deshalb erst am 29.9.91 um 13 Uhr mit der Beobachtung 686. Die Ergebnisse der Modellschätzung sind in Tabelle 6.6 enthalten. Die Modellgleichungen werden explizit formuliert. Die Intervall- und Varianzprognosen zeigt Bild 6.6. Der mittlere quadratische Vorhersagefehler ist höher als der Mittelwert im Vergleichszeitraum. Es wird deshalb auf dem MAPE verwiesen, der mit 32,98% relativ hoch ausfällt. Wird die Lücke im Beobachtungszeitraum belassen, dann ändert sich die Modellstruktur nur geringfügig. In der Beobachtungsgleichung tritt ein zusätzlicher Term bei Lag 26 auf. Das Varianzmodell wächst um zwei Parameter auf GARCH(2, 2). Die Änderungen in den Parameterschätzwerten fallen vor allem beim Varianzmodell ins Gewicht.

42

Kapitel 6

25

20

15

10

5

0 500 Bild 6.5

1000

1500

2000

2500

Häufigkeit des Eintretens in Haus 21 (FB Wirtschaft) vom 1.9.01 bis zum 31.12.01

Tabelle 6.6

Modellschätzung zum Eintrittsverhalten in Haus 21

Dependent Variable: EINGANG Method: ML - ARCH (Marquardt) - Normal distribution Date: 01/05/05 Time: 12:59

Sample: 686 2760 Included observations: 2075 Convergence achieved after 52 iterations Variance backcast: ON

Model Equation Variable C EINGANG(-1) EINGANG(-2) EINGANG(-24) EINGANG(-25)

Coefficient 0,142416 0,346533 0,080147 0,351586 0,047983

Std. Error 0,041903 0,026869 0,019819 0,009409 0,012947

z-Statistic

Prob.

3,398710 1,289731 4,043955 3,736743 3,705994

0,0007 0,0000 0,0001 0,0000 0,0002

Variance Equation Variable C RESID(-1)^2 GARCH(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Coefficient 1,330609 0,748913 0,329831 0,459706 0,457876 2,928286 17724,24 -4,774648 1,424405

Std. Error 0,052972 0,041372 0,018428

z-Statistic 2,511910 1,810173 1,789846

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0 0 0 2,800964 3,977080 4,609782 4,631517 2,512421 0

Kapitel 6

43

Die Beobachtungsgleichung lautet X t = 0,142 + 0,347 ⋅ X t −1 + 0,0810 ⋅ X t −2 + 0,352 ⋅ X t −24 + 0,048 ⋅ X t −25 + ε t . Die zugehörige Varianzgleichung hat die Gestalt

σ 2t = 1,331 + 0,330 ⋅ σ 2t −1 + 0,749 ⋅ ε 2t −1 .

20 Forecast: EINGANGFKURZGARCH Actual: EINGANG Forecast sample: 2761 2928 Included observations: 168

16 12 8

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

4 0 -4

1.580579 1.049404 32.98215 0.390543 0.005143 0.161971 0.832886

-8 -12 2775

2800

2825

2850

2875

2900

2925

2900

2925

EINGANGFKURZGARCH

60 50 40 30 20 10 0 2775

2800

2825

2850

2875

Forecast of Variance

Bild 6.6 Intervall- und Varianzprognose für das Eintretens in Haus 21 (FB Wirtschaft) vom bis zum 25.12. bis 31.12.01

44

Kapitel 6

Kapitel 6

45

46

Kapitel 6

6.4 Analyse des monatlichen Elektroenergiehandels im US-Bundesstaat Kalifornien Bei den Monatsreihen aus dem US-Bundesstaat Kalifornien wurden Einheitswurzeltests und Korrelogramme zur Identifikation der Differenzenstruktur durchgeführt. Dem ersten Einheitswurzeltest, angewendet auf die Ausgangsdaten, folgte ein zweiter Test, angewendet auf die saisonalen Differenzen, sofern in den Korrelogrammen Ausschläge beim Saison-Lag 12 zu verzeichnen waren. In 5 Fällen wurden gemischte einfache und saisonale Differenzen, in 3 Fällen nur saisonale Differenzen und in einem Fall lediglich eine einfache Differenz aufgelegt. In weiteren 5 Fällen wurde auf eine Differenzenbildung verzichtet. Die autoregressive Beobachtungsgleichung enthielt zumeist Terme am Lag 1 und am Saison-Lag 12. Nur bei zwei Reihen (R9 und R11) fehlte jeweils ein saisonaler Term. Bei der Reihe R4 wurde der Saisoneinfluss mit Hilfe eines Terms beim Lag 24 modelliert. Ein solcher Term trat zusätzlich bei drei anderen Reihen auf (R10, R11, R15). Bei 12 von 15 Modellen wurde eine Erklärungsgüte von mehr als 75% erreicht. Unter 50% lagen nur die Modelle zur Reihe R8. Die Korrelogramme der quadrierten Residuen wiesen mitunter Cuts bei Lag 2 oder Lag 3 auf. Die Parameterschätzung schloss höhere Lags im Varianzmodell aber meistens aus. Die Struktur GARCH(2, 2) konnte nur einmal signifikant geschätzt werden. Am häufigsten wurde das Modell GARCH(0, 1) für insgesamt 7 Reihen ausgewiesen. Auf Platz 2 folgte das Standardmodell GARCH(1, 1) für vier Reihen (vgl. Tabelle 6.11). Neben den Zweigleichungsmodellen wurden auch multiplikative ARIMA-Modelle von BoxJenkins als spezielle Eingleichungsmodelle angepasst. Letztere spielen bei Anwendern nach wie vor eine große Rolle. Die Parameteranzahl lag fast immer unter der beim entsprechenden Zweigleichungsmodell (vgl. Tabelle 6.9), wohingegen das Bestimmtheitsmaß vergleichsweise meistens etwas höher ausfiel (vgl. Tabelle 6.11). Tabelle 6.9 Parameteranzahl im Zweigleichungsmodell (ZGM) und im Eingleichungsmodell (EGM) R1

R2

R3

R4

R5

R6

R7

R8

R9

R10

R11

R12

R13

R14

R15

pZGM

4

3

3

3

6

3

3

4

3

4

6

5

3

3

5

pEGM

2

3

2

1

2

1

3

3

3

2

2

2

2

2

2

Für eine inhaltliche Analyse musste die Struktur der Daten etwas näher betrachtet werden: •

Bei der Analyse der fünf monetären Reihen R1 bis R5 (Elektroenergieumsatz in Tausend Dollar, sektoral untergliedert nach Haushalten, Handel, Industrie und Sonstigen Bereichen, sowie Sektoren insgesamt) fielen insbesondere die Modelle für die Sektoren Industrie und Sonstige Bereiche mit einer relativ niedrigen Erklärungsgüte und einem geringen RSME% bei der Vergleichsprognose auf. Typisch war die Kombination von einfachen und saisonalen Differenzen in den Modellen für die Sektoren Handel und Industrie, sowie das Gesamtmodell. Dem gegenüber stand die ausschließlich saisonale Differenz im Modell für den Sektor Haushalte. Das spricht für eine progressive Preisentwicklung in den Sektoren Handel bzw. Industrie einerseits und eine lineare Preisentwicklung für den Sektor Haushalte.



Die fünf entsprechenden Mengenreihen R6 bis R10 (Elektroenergieabsatz in MWh, sektoral untergliedert nach Haushalten, Handel, Industrie und Sonstigen Bereichen, sowie Sektoren insgesamt) wiesen ähnliche Unterschiede bei der Modellierung auf, wobei der Sektor Industrie durch eine Kombination von sehr niedrigem Bestimmtheitsmaß und sehr hohem RMSE% besonders auffiel. Diese niedrige Bestimmtheit ist auf Trendbrüchen zu-

Kapitel 6

47

rück zu führen, die dem Rationalisierungsschub nach der ersten Ölkrise und Strukturveränderungen in den letzten Jahren geschuldet sind. Bemerkenswert war ferner, dass die Differenzenstruktur aus der Analyse der monetären Reihen lediglich für den Sektor Haushalte und den Sektor Sonstige Bereiche übernommen wurde. Vor allem einfache Differenzen traten nicht mehr auf. Das spricht für eine höchstens lineare Zunahme des Elektroenergieverbrauchs. •

Bei der Modellierung der fünf Erlösreihen R10 bis R15 (Umsatz pro Mengeneinheit) setzten sind die sektoralen. Unterschiede bei der Modellierung fort. Die Erlöse für den Sektor Sonstige Bereiche ließen sich deutlich schwerer erfassen, als z. B. die Erlöse für den Sektor Haushalte oder die Erlöse für alle Sektoren zusammen.

Exemplarisch wird ein Zweigleichungsmodell für den Elektroenergieumsatz in Tausend Dollar (TDollar) im Sektor Sonstige Bereiche des US-Bundesstaates Kalifornien vorgestellt. Der Zeitreihenverlauf ist Bild 6.7 zu entnehmen. Die grafische Darstellung der Einschrittprognose zeigt Bild 6.8. Die Ergebnisse der Modellschätzung sind in der Tabelle 6.10 zusammen gefasst. Die Modellgleichungen werden explizit angegeben.

120000 100000 80000 60000 40000 20000 0 90 91 92 93 94 95 96 97 98 99 00 01 02 Bild 6.7

Energieumsatz in Kalifornien (Sektor Sonstige Bereiche in TDollar) 1/90-12/02

Die spezifizierte Beobachtungsgleichung lautet X t = 0,927 ⋅ X t −1 + 0,098 ⋅ X t −24 + a t . Die zugehörige Varianzgleichung hat die Gestalt

σ 2t = 16.130.726 + 2,171 ⋅ ε 2t −1 .

48

Kapitel 6

Tabelle 6.10

Ergebnisse der Modellschätzung zum Elektroenergieumsatz in Kalifornien

Dependent Variable: R4 Method: ML - ARCH Date: 11/03/04 Time: 10:58 Sample (adjusted): 1992M01 2002M12

Included observations: 132 after adjustments Convergence achieved after 26 iterations Variance backcast: ON

Model Equation Variable

Coefficient

R4(-1) R4(-24)

Std. Error

0,927449 0,097646

z-Statistic

0,010396 0,016301

Prob.

89,21472 5,990155

0 0

Variance Equation Variable

Coefficient

Std. Error

z-Statistic

C RESID(-1)^2

16130726 2,170993

2860096 0,284417

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0,758758 Mean dependent var 0,753104 S.D. dependent var 7776,546 Akaike info criterion 7,74E+09 Schwarz criterion -1354,565 Durbin-Watson stat

Prob.

5,639925 7,633135

0 0 38620,09 15650,54 20,58431 20,67167 1,891754

70000 Forecast: R4FTEXT Actual: R4 Forecast sam ple: 2003M01 2003M07 Included observations: 7

60000 50000

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

40000 30000 20000 10000 0 03M01

03M02

03M03

03M04

03M05

03M06

03M07

03M06

03M07

4606.018 3810.148 11.86220 0.065325 0.684278 0.003286 0.312437

R4FTEXT

2.00E+08

1.60E+08

1.20E+08

8.00E+07

4.00E+07

0.00E+00 03M01

03M02

03M03

03M04

03M05

Forecast of Variance

Bild 6.8

Intervallprognose und Varianzprognose für den Elektroenergieumsatz in Kalifornien (Sektor Sonstige Bereiche in TDollar) vom 1.1.2003 bis zum 30.7.2003

Kapitel 6

49

50

Kapitel 6

Kapitel 6

51

52

Kapitel 6

6.5 Analyse monatlicher Preise für Rohöl, Erdgas und Elektroenergie in den USA •

Die 5 Preisreihen für Rohöl auf dem US-Markt zeichneten sich jeweils durch eine Einheitswurzel aus. Es waren mithin einfache Differenzen zu bilden. Saisonale Einflüsse waren nicht nachweisbar. Die autoregressiven Modelle hatten stets die Ordnung 2. Die Korrelogramme der entsprechenden quadrierten Residuen wiesen Cuts nach einem Lag (Reihe 1 bis 3 und Reihe 3) und nach Lag 3 (Reihe 4 und Reihe 5) auf. Die GARCHModelle hatten zwischen zwei und vier signifikante Parameter. Die Bestimmtheitsmaße lagen stets über 97% (vgl. Tabelle 6.13). Die Modellierung der Rohölpreise für den Handel mit Inlandöl und importiertem Öl (nur mit Transportkosten und mit vollständigen Bezugskosten) als auch der drei Aufkaufpreise von Raffinerien (für Inlandöl, Importöl, Rohöl gesamt) ergab leichte Unterschiede in der Volatilität zwischen den Preisen für Rohöl aus eigenem Aufkommen und für importiertes Rohöl. Die entsprechenden Inlandmodelle umfassten vergleichsweise mehr Parameter. Für den Inlandölpreis wurde zur Untersuchung der Modellrobustheit ein Probelauf auf verkürztem Datensatz (1/74 bis 12/98) durchgeführt. Die Autoregression der Modellgleichung ging dabei über das Lag 1 nicht hinaus. Auch das Varianzmodell hatte lediglich die Struktur GARCH(1, 1), obwohl der Cut bei den partiellen Autokorrelationen erst bei Lag 4 lag. Doch die Parameter zu den höheren Lags ließen sich nicht signifikant schätzen. Das Bestimmtheitsmaß betrug für den verkürzten Zeitraum 97,7%. Offensichtlich hatte die Volatilität der Preisentwicklung seit Ende der 90er Jahre zugenommen. Das schlug sich in einer höheren Parametrisierung sowohl der Beobachtungsgleichung als auch der Varianzgleichung und in einem verminderten Bestimmtheitsmaß nieder.



Die Preisreihen für Erdgas auf dem US-Markt verfügten bis auf die Reihe 6 ebenfalls über Einheitswurzeln. Bei Reihe 3 war zudem im Korrelogramm ein saisonaler Einfluss erkennbar. Es wurden einfache Differenzen für die Reihen 1, 2, 4 und 5 aufgelegt. Für die saisonalen Differenzen von Reihe 3 wurde die Nullhypothese für eine Einheitswurzel verworfen, so dass keine einfache Differenz zusätzlich aufgelegt werden mussten. Die Lag-Struktur der autoregressiven Modelle fiel sehr unterschiedlich aus. Bei der Reihe 5 war nicht einmal der Parameter zum Lag 1 signifikant. Alle anderen Reihen wiesen Modell-Terme beim Lag 1, teilweise auch beim Lag 2 (Reihe 1, Reihe 3 und Reihe 6) auf. Die saisonale Reihe 3 verfügte darüber hinaus über Terme beim einfachen Monats-Lag 12 und beim doppelten Monats-Lag 24. Die Bestimmtheitsmaße fielen etwas niedriger als bei den Rohölreihen aus, lagen aber stets deutlich über 80% (vgl. Tabelle 6.14). Für die beiden Erdgaspreise (ab Förderstelle und ab Zuleitung) ergaben sich unterschiedliche Modelle. Der Erdgaspreis bei Lieferung aus der Leitung (City Gate Price) wurde modellseitig niedriger parametrisiert als der Erdgaspreis ab Bohrloch (Wellhead Composite Price). Die Erklärungsgüte stieg mit der Parameteranzahl, wobei die Güte der Vergleichsprognose gleichzeitig sank. Bei der sektoralen Betrachtung fiel das saisonale Abnahmeverhalten der Haushalte auf, was bei den anderen Sektoren nicht erkennbar war. Für den Handel und die Industrie ergab sich zudem eine etwas höher parametrisierte Varianzgleichung, was auf ein anderes Volatilitätsmuster schließen ließ. Auffällig war die vergleichsweise schwache Vergleichsprognose für die Preisentwicklung des Erdgasverkaufs an die Versorger (Energieerzeugung).



Die vier Preisreihen für Elektroenergie auf dem US-Markt wiesen keine Einheitswurzeln, wohl aber saisonale Einflüsse auf. Die Lag-Struktur der autoregressiven Modelle bestand aus Termen erster Ordnung, teilweise auch zweiter Ordnung, wie bei der Reihe 1 und der

Kapitel 6

53

Reihe 4, und saisonalen Termen beim Monats-Lag 12, teilweise in Verbindung mit dem benachbarten Lag 13, wie bei der Reihe 2 und der Reihe 4, oder sogar beim doppelten Monats-Lag 24, verbunden mit dem benachbarten Lag 25, wie bei Reihe 3. Die Bestimmtheitsmaße lagen stets über 80% (vgl. Tabelle 6.15). Der Modellvergleich zwischen den Sektoren Haushalte, Handel und Industrie offenbarte eine recht unterschiedliche Volatilität. Das Modell für den Sektor Haushalte gewann durch Einführung der logarithmierten Varianz in die Beobachtungsgleichung eine deutlich höhere Bestimmtheit gegenüber dem Eingleichungsmodell. Die Varianzgleichung für den Industriesektor war am niedrigsten parametrisiert. Offenbar schlug die Autokorrelation der Preise über zwei Jahre aus der Beobachtungsgleichung auf die Varianzgleichung durch. Exemplarisch wird ein Zweigleichungsmodell für den durchschnittlichen Erdgaspreis für Haushalte in Cent pro 1000 cubic foot (vgl. Tabelle 4.6) vorgestellt. Die grafische Darstellung dieser Zeitreihe zeigt das Bild 6.9. Die Ergebnisse der Modellschätzung fasst die Tabelle 6.12 zusammen. Die beiden Modellgleichungen werden explizit angegeben. Die Intervall- und die Varianzprognose sind im Bild 6.10 zu sehen. Weitere Schätz- und Prognoseergebnisse sind der Tabelle 6.12 zu entnehmen.

1400 1200 1000 800 600 400 200 82 Bild 6.9

84

86

88

90

92

94

96

98

00

02

Erdgaspreis für US-Haushalte im Zeitraum 1/82 – 12/02

Die spezifizierte Beobachtungsgleichung lautet X t = 1,192 ⋅ X t −1 − 0,319 ⋅ X t −2 + 0,127 ⋅ X t −3 + 0,554 ⋅ X t −12 − 0,554 ⋅ X t −13 + 0,371 ⋅ X t −24 − 0,371 ⋅ X t −25 + ε t . Die zugehörige Varianzgleichung ist

σ 2t = 10,949 + 0,823 ⋅ σ 2t −1 + 0,189 ⋅ ε 2t −1 .

54

Kapitel 6

Tabelle 6.12

Ergebnisse der Modellschätzung zum Beispiel Erdgaspreis US-Haushalte

Dependent Variable: D(GAS_3,1,0) Method: ML - ARCH (Marquardt) - Normal distribution Date: 12/31/04 Time: 19:06 Sample (adjusted): 1983M02 2003M12

Included observations: 251 after adjustments Convergence achieved after 71 iterations Variance backcast: ON

Model Equation Variable

Coefficient

D(GAS_3(-1),1,0) D(GAS_3(-2),1,0) D(GAS_3(-12),1,0) D(GAS_3(-24),1,0)

Std. Error

0,192106 -0,127372 0,554251 0,371288

z-Statistic

0,051078 0,044213 0,053391 0,056717

Prob. 3,761037 -2,880843 10,38104 6,546322

0,0002 0,004 0 0

Variance Equation Variable

Coefficient

C RESID(-1)^2 GARCH(-1)

Std. Error

10,94949 0,188738 0,82345

R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood

0,709707 0,702569 28,81366 202575,4 -1135,784

z-Statistic

5,62947 0,041483 0,036706

Prob. 1,94503 4,549782 22,43397

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Durbin-Watson stat

1,410359 52,83297 9,105848 9,204167 1,93881

1500 Forecast: GAS_3FTEXT Actual: GAS_3 Forecast sample: 2004M01 2004M07 Included observations: 7

1400 1300

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

1200 1100 1000 900

29.24778 24.68023 2.173880 0.012981 0.014024 0.006244 0.979732

800 04M01 04M02 04M03 04M04 04M05 04M06 04M07 GAS_3FTEXT

1250 1200 1150 1100 1050 1000 950 900 850 04M01 04M02 04M03 04M04 04M05 04M06 04M07 Forecast of Variance

Bild 6.10

0,0518 0 0

Intervall- und Varianzprognose zum Beispiel Erdgaspreise für US-Haushalte von Januar bis Juli 2004

Kapitel 6

55

56

Kapitel 6

Kapitel 6

57

58

6.6

Kapitel 6

Analyse der Absatzreihe Margarine

Die Wochenreihe zum Margarineabsatz eines Lebensmittelherstellers reichte über drei Jahre (vgl. Bild 6.11) und zeichnete sich durch eine hohe Volatilität aus. Sie besaß keine Einheitswurzeln und es gabt auch keinen Hinweise auf saisonale Einflüsse. Kalenderbedingte Festtagsspitzen für die Wochen vor Ostern und Weihnachten sind heraus gerechnet worden. Das autoregressive Modell umfasste Terme zum Lag 1 und zum Lag 2. Das Varianzmodell hatte die Struktur GARCH(1, 1). Das Bestimmtheitsmaß betrug allerdings nur 24% (vgl. Tabelle 6.16). Die Prognosegüte für die zweite bis vierte Dezemberwoche fiel mit einem RMSE% von 18,94% ebenfalls bescheiden aus (vgl. Bild 6.12).

5000 4500 4000 3500 3000 2500 2000 25 Bild 6.11

50

75

100

Wöchentlicher Margarineabsatz über drei Jahre

Die spezifizierte Beobachtungsgleichung lautete X t = 1407,412 + 0,392 ⋅ X t −1 + 0,196 ⋅ X t −2 + ε t . Die zugehörige Varianzgleichung hatte die Gestalt

σ 2t = 26750,88 + 0,672 ⋅ σ 2t −1 + 0,145 ⋅ ε 2t −1 .

125

Kapitel 6

Tabelle 6.16

59

Ergebnisse der Modellschätzung zum Beispiel Margarineabsatz

Dependent Variable: MARGA Method: ML - ARCH Date: 11/03/04 Time: 09:59 Sample (adjusted): 3 143

Included observations: 141 after adjustments Convergence achieved after 37 iterations Variance backcast: ON

Model Equation Coefficient C MARGA(-1) MARGA(-2)

Std. Error

1407,412 0,392444 0,19622

z-Statistic

292,6245 0,095495 0,09395

Prob.

4,80962 4,109583 2,08856

0 0 0,0367

Variance Equation Coefficient C RESID(-1)^2 GARCH(-1) R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat

Std. Error

z-Statistic

26750,88 0,145209 0,672501

24559,66 0,104295 0,212476

1,08922 1,392294 3,165061

0,24133 0,213231 393,948 20951332 -1035,819 2,069352

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic)

Prob. 0,2761 0,1638 0,0016 3415,66 444,1354 14,77758 14,90306 8,588606 0

5500 Forecast: MAR GAF Actual: MARGA Forecast sam ple: 144 147 Included observations: 4

5000 4500

Root Mean Squared Error Mean Absolute Error Mean Abs. Percent Error Theil Inequality Coefficient Bias Proportion Variance Proportion Covariance Proportion

4000 3500 3000 2500 2000 144

145

146

147

146

147

752.4408 644.0498 15.79304 0.095713 0.101285 0.279258 0.619458

MARGAF

360000 320000 280000 240000 200000 160000 120000 144

145

Forecast of Variance

Bild 6.12 Intervall- und Varianzprognose zum Beispiel Margarineabsatz für die 3 Wochen

60

Kapitel 7

7. Zur Prognosegüte ausgewählter Zweigleichungsmodelle mit GARCH-Struktur Die zum Teil umstrittenen Erkenntnisse aus den umfangreichen empirischen Prognosevergleichen mit konkurrierenden Modellen, wie z. B. in der M3-Studie (siehe Makridakis [2000]), haben in den letzten Jahren sowohl zu methodischer als auch inhaltlicher Weiterentwicklung geführt. Vor allem die Aussage, dass Prognosen mit einfachen Modellen nicht grundsätzlich schlechter als solche mit komplizierten Modellen ausfallen würden, ist auf Kritik gestoßen. In einem Überblicksartikel diskutieren Clements u. A. [2004] das Für und Wider einer nichtlinearen Modellbildung und geben einen verhalten optimistischen Ausblick auf zukünftige Anwendungen vor allem für Preis- und Kursdaten. Sie stützen sich dabei vor allem auf die Erkenntnis, dass viele Prozesse speziell auf den Finanzmärkten als nichtlinear anzusehen sind und dementsprechend auch nichtlinear modelliert werden sollten. Boero u. A. [2004] vergleichen Prognosen für den täglichen Euro-Kurs, die mit (nichtlinearen) Modellen der Schwellwertautoregression (SETAR) und GARCH-Modellen erstellt worden sind, und kommen zu dem Schluss, dass letztere für eine Intervall- und Dichteprognose vorzuziehen sind. Einen empirischen Vergleich von Tageskursen auf internationalen Finanzmärkten stellt Taylor [2004] vor. Er zeigt, dass die Volatilitätsprognose von diversen GARCH-Modellen mit Hilfe zusätzlicher Glättungstechniken noch verbessert werden kann. Eine systematische Einführung in Fehlermaße von Punkt-, Intervall- und Dichteprognosen gibt Küster [2004]. Er verweist darauf, dass Prognosewettbewerbe nur unzureichend über die Eignung bestimmter Modellklassen Auskunft geben können und die Anwendungsentscheidung letztlich von einer Vergleichsprognose am aktuellen Rand abhängt. Die Prognosegüte der in Kapitel 6 vorgestellten Zweigleichungsmodelle ist sehr unterschiedlich ausgefallen. Für die Stundenreihe aus Spanien (vgl. Tabelle 7.1) konnten die guten Ergebnisse von Garcia gemessen am RMSE% bestätigt werden. Seine GARCH Modelle wiesen, bezogen jeweils auf das Jahr 2000, für eine Mai-Woche Fehler zwischen 2,9% und 7,6%, für eine August-Wochen Fehler zwischen 4,81% und 10,1% und für eine November-Woche Fehler zwischen 5,47% und 10,2% aus (Garcia u.A. [2003], Tabelle I bis III). Tabelle 7.1

Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Spanien1

Reihe/RMSE% Mi ESP

Do 4,65

Fr 6,48

Sa

So

6,05

7,34

Mo 6,86

Di

10,66

5,01

Für die Stundenreihe aus Kalifornien (siehe Tabelle 7.2) hingegen konnten die Ergebnisse von Garcia für das Jahr 2000 nicht bestätigt werden, der für eine Aprilwoche Fehler von unter 5% offerierte (Garcia u.A. [2003], Tabelle IV). Beachtet werden muss dabei allerdings, dass unterschiedliche Wochen in 2000 und in 2003 ausgewertet wurden und die jeweils verwendeten Prognosemodelle sich in der Parameteranzahl erheblich unterscheiden. Tabelle 7.2 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien2 Reihe/RMSE% Fr USP10

1 2

24.9. bis 30.9.2003 25.7. bis 31.7.2003

Sa 23,93

So 18,24

Mo 21,96

35,13

Di

Mi 13,23

Do 20,99

13,88

Kapitel 7

61

In den meisten Fällen erwies sich die Prognose für einen Montag als besonders kompliziert. Diese Erfahrung aus der vorliegenden empirischen Untersuchung stimmt mit den Ergebnissen von Garcia überein. Für die New Yorker Preisdaten (vgl. Tabelle 7.3) sind eine Woche vor Weihnachten und die anschließende Festwoche ausgewertet worden. Der tägliche RMSE% war dabei so hoch, dass die spezifizierten Modelle nicht als praktikable angesehen werden konnten. Als besonders problematisch für eine Preisprognose erwiesen sich im Falle von New York die Freitage. Tabelle 7.3 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für New York Reihe/Tag

Mo

Di

Mi

Do

Fr

Sa

So

EASTNY3

31,05

59,32

49,94

46,80

71,39

22,47

43,07

EAST101

44,26

45,78

67,52

69,92

133,35

62,75

175,90

EAST102

48,43

56,21

31,45

15,20

79,41

29,77

69,88

EAST30

27,35

31,42

24,32

21,52

68,75

33,02

32,08

EASTNY4

44,06

41,41

50,89

48,84

55,82

21,92

44,53

EAST101

68,84

122,21

143,88

259,03

183,52

23,23

149,78

EAST102

72,22

72,92

55,07

25,58

86,03

25,13

47,21

EAST30

41,42

64,54

42,59

36,21

74,48

33,02

21,67

Eine Verbesserung der Prognosegüte für New York kann nach Guirguis u. A. dadurch erreicht werden, dass erklärende Variable, wie der Gaspreis, eingebaut und vor allem Ausreißer systematisch beseitigt werden. Allein die Ausreißerbeseitigung lässt eine Fehlersenkung um mehr als 50% zu (vgl. Guirguis u. A. [2004], S. 163). Besonders auffällig im New Yorker Zeitreihenmuster waren wiederholte Preissprünge gegen 7.00 Uhr und gegen 17.00 Uhr, die von den angesetzten autoregressiven Modellen aber nicht erfasst worden sind. An den entsprechenden Lags ließen sich jedenfalls keine signifikanten Parameter schätzen. Zu beachten ist auch, dass der relative mittlere quadratische Fehler bezogen auf den Mittelwert RMSE% zwar ein statistisch interessantes Fehlermaß ist, aber nicht unbedingt einen hohen praktischen Stellenwert besitzt. In den Reports des PJM-Verbundes von 13 Bundesstaaten wird immer wieder auf die Bedarfsspitze von 107,820 MW hingewiesen (vgl. Reynolds [2004], S. 84). Offenbar spielen vor allem die Preisspitzen in den Morgen- und Abendstunden eine besondere Rolle. Die Fehlergüte in den Nachtstunden, aber auch die Schwankungen zwischen den Tagesspitzen sind, abgesehen von Temperaturstürzen, eher von geringerem Interesse. Dabei muss aber auch berücksichtigt werden, dass in einem Stromverbund von Flächenstaaten, wie dem von PJM, die Spitzen einer Zeitverschiebung unterliegen und zeitlich etwas anders liegen, als etwa in New York. Die NYISO gibt z. B. als durchschnittlichen absoluten Fehler für tägliche Nachfrageprognosen im Monat August 2004 den Wert 2,53% an (vgl. Fernandez [2004], S. 16). Gemeint ist dabei der durchschnittliche Fehler für die Nachfragespit3 4

vom 14.12. bis zum 20.12.2004 vom 21.12. bis zum 27.12.2004

62

Kapitel 7

zen pro Tag. Für die Preisprognosen werden allerdings keine Fehlerangaben gemacht. Es wird aber auf vergleichende Untersuchungen hinsichtlich der Ergebnisse von PJM und des Verbundes der New England Staaten (Data and Reports NE-ISO [2005]) hingewiesen. Interessant sind die Fehlerunterschiede zwischen einer Preis- und einer Nachfrageprognose für Elektroenergie. Am Beispiel des New England Verbundes (siehe Tabelle 7.4) wird deutlich, dass die tägliche Nachfrage im Mittel wesentlich genauer als der tagesdurchschnittliche Preis prognostiziert werden kann. Bei der Preisprognose fällt der Maximalfehler für den Montag auf. Die Nachfrageprognose hingegen scheint eher für das Wochenende schwierig zu sein. Danach folgt im Fehlerranking aber auch schon der Montag. Tabelle 7.4 Prognoseergebnisse für stündliche Nachfrage und Preise an Elektroenergie pro Tag in den Bundesstaaten von New England Reihe/Tag

Di

Mi

Do

Fr

Sa

So

Mo

NEHP Preis univariat

16,81

15,93

14,57

18,23

17,37

24,27

30,62

NEHP Preis bivariat mit Einflussgröße NEHD

16,67

15,93

14,19

18,16

17,05

23,67

30,34

NEHD Nachfrage univariat

1,92

1,53

1,43

1,69

2,30

1,67

1,30

Die Einbeziehung der Nachfrage als erklärender Variablen Y änderte nur wenig am RMSE%. Das spezifizierte bivariate Modellsystem X t = 9,343 + 0,497 ⋅ X t −1 + 0,355 ⋅ X t −24 − 0,158 ⋅ X t −25 + 0,499 ⋅ Yt −24 − 0,642 ⋅ Yt −25 + ε t σ 2t = 23,306 + 0,074 ⋅ σ 2t −1 0,316 ⋅ ε 2t −1

ist demzufolge keine Alternative zum univariaten Ansatz.

Kapitel 8

63

8. Einführung in das Paket EViews 5.0 Das Programmpaket EViews wird von der Firma Quantitative Micro Software aus Irvine USA angeboten und weltweit vertrieben (www.eviews.com). Es ist ein spezielles Tool zur Analyse und Prognose von Zeitreihen mit Hilfe diverser einstellbarer Modelle. Es umfasst im methodischen Bereich sowohl Eingleichungs- als auch Mehrgleichungsmodelle und bietet neben der individuellen Modellspezifikation durch den Nutzer auch methodischen Support für Standardverfahren, wie z. B. für X11-ARIMA. Die Dateneingabe ist aus verschiedenen Umgebungen heraus möglich. Sind z. B. Zeitreihendaten aus einer EXCEL-Tabelle zu importieren, dann wird zunächst ein interner Workfile angelegt und bezeichnet (vgl. Bild 8.1). Die Periodisierung der Daten lässt sich ab einem Erfassungszeitraum von einem Tag kalendermäßig einstellen. Für Stundendaten ist die Option Integer Date hilfreich, bei der nur die Werteanzahl abgefragt wird (vgl. Bild 8.2). Beim Import aus einer EXCEL-Tabelle (vgl. Bild 8.3) in einen bestehenden Workfile wird nur jeweils eine Spalte übernommen. Die Auswahl erfolgt mit Hilfe der Spaltenkodierung von Excel. Die importierte Reihe ist gesondert zu bezeichnen. Die gewählte Bezeichnung sollte nicht zu lang sein, weil mit ihrer Hilfe die Modellgleichungen formuliert werden.

Bild 8.1

Einrichten eines Workfiles für den Datenimport

Für die importierte Reihe stehen zahlreiche deskriptive Auswertungstechniken zu Verfügung (vgl. Bild 8.4). Sie reichen von der Tabellenanzeige bis zu verschiedenen Darstellungsformen im Untermenü Graphics. Meist begnügt man sich mit einer Liniendarstellung. Darüber hinaus können einzelne Saisonzyklen jeweils getrennt oder überlagert angezeigt werden. Aus der Zeitreihe lässt sich eine Teilreihe (Sample) auswählen. Auf diese Weise kann man z.B. einen Teil der Beobachtungen am aktuellen Rand von der Modellspezifikation ausschließen und für eine spätere Vergleichsprognose zurück halten. Dabei sind der Beginn und das Ende der Stichprobe einzugeben. Die deskriptive Auswertung kann für Teilreihen genau so umfangreich wie für den gesamten Datensatz durchgeführt werden. Zu diesem Zweck wird im Untermenü Stats Table das entsprechende Sample definiert.

64

Kapitel 8

Bild 8.2

Einstellung der Periodisierung für nicht vordefinierte Intervalle

Bild 8.3

Datenimport aus einer Excel-Datei

Zur deskriptiven Auswertung (siehe Bild 8.4) gehören Histogramme, Box-Plots und Tabellen mit Maßzahlen. Es werden Parametertests für das arithmetische Mittel, die Varianz und den Median angeboten. Verteilungstests sind für alle gängigen Wahrscheinlichkeitsverteilungen verfügbar. Hinzu kommen Quantilplots und Kerndichteschätzer. Für die Zeitreihenanalyse sind vor allem Korrelogramme (acf und pacf) für die Originaldaten und deren erste und zweite Differenzen wichtig. Um die Ordnung der Differenzenbildung zu prüfen oder zwischen

Kapitel 8

65

trendstationären Prozessen und Irrfahrtprozessen zu unterscheiden, können 6 verschiedene Einheitswurzeltests herangezogen werden. Die Tests sind anwendbar auf die Originaldaten, aber auch auf die ersten und zweiten Differenzen (vgl. Bild 8.5).

Bild 8.4

Deskriptive Auswertung der Zeitreihendaten

Bild 8.5

Einstellung eines Einheitswurzeltests nach Phillips Perron

66

Kapitel 8

Jedes Modell wird als Objekt definiert. Die Eingabe der formalisierten Modellstruktur erfolgt über den Menüpunkt Equation, der auch den Zugriff auf die 8 Schätzroutinen von EViews ermöglicht (siehe Bild 8.6 bis 8.8).

Bild 8.6

Objektspezifikation

Bild 8.7

Anlegen einer Modellgleichung

Die Formeldeklaration (vgl. Bild 8.8) beginnt mit der linken Seite, hier ds4, gefolgt vom Absolutglied, hier c, und der um ein Lag verzögerten Einflussgröße ds4(-1).

Bild 8.8

Ausfüllen der Modellgleichung und Vorbereitung der Schätzung

Kapitel 8

67

Eine vorgeschaltete logarithmische Transformation und eine nachfolgende einfache Differenz werden mit Hilfe der Funktion dlog(reihe, 1) realisiert. Gemischte Differenzen lassen sich mit Hilfe der Funktionen d(reihe, d, m) bilden, wobei d die Ordnung der einfachen Differenz und m für eine saisonale Differenz erster Ordnung bei m Saisonperioden steht. Darüber hinaus können Rauschterme vom Typ AR(p) oder MA(q) eingefügt werden (vgl. Bild 8.9).

Bild 8.9

Aufbau eines ARIMA-Modells (1,1,1)(0,1,0)12 mit Absolutglied und logarithmischer Transformation der Daten

Weitere wichtige Objekttypen sind mit Sample und VAR bezeichnet. Im Menü SAMPLE können Stichproben gezogen und als gesonderte Tabellen angelegt werden. Über das Untermenü VAR erfolgt der Zugang zur multivariaten Analyse einschließlich Kointegration. Die sich an die Schätzung anschließende Modellüberprüfung umfasst zahlreiche grafische und statistische Komponenten. Dazu gehören die Korrelogramme der Residuen und der quadrierten Residuen mit den entsprechenden Q-Statistiken, das Histogramm mit einem Test auf Normalverteilung und der Lagrange Multiplier Test für ARCH Strukturterme (vgl. Bild 8.10). Den Abschluss der Untersuchung bilden Vergleichsvorhersagen, um die Prognosegüte am aktuellen Rand zu ermitteln. Die Vergleichsvorhersage wird als gesonderter File abgespeichert. Für jedes Experiment ist demzufolge ein entsprechender Bezeichner zu wählen. Es kann zwischen einer Mehrschrittvorhersage (Dynamic Forecasting) und einer Einschrittvorhersage (Static Forecasting) gewählt werden. Im Fenster Forecast Sample ist der Prognosezeitraum abgesteckt. Ist die Modellierung mit einem verkürzten Datensatz durchgeführt worden, so muss der verbleibende Datensatz am aktuellen Rand gesondert eingestellt werden (vgl. Bild 8.11).

68

Kapitel 8

Bild 8.10 Abtesten der Modellresiduen

Bild 8.11

Einstellen des Prognosealgorithmus

Im Demonstrationsbeispiel (vgl. Bild 8.11) ist für den korrigierten Vergleichszeitraum (Forecast Sample) als Anfangsbeobachtung 8593 und als Endbeobachtung 8760 zu setzen.

Kapitel 8

69

Falls Transformationen der linken Seite zurück gerechnet werden müssen, wird ein erweitertes Prognosemenü angezeigt (vgl. Bild 8.12). Darin kann wahlweise für die Originaldaten oder die transformierten Daten vorhergesagt werden.

Bild 8.12

Rückrechnung der Transformationen bei der Prognose eines ARIMA-Modells

9. Vergleich der Programmpakete EVIEWS 5.0 und ITSM 2000 Neben EViews 5.0 wurde mit ITSM 2000 (siehe Brockwell u. Davies [2002]) ein weiteres Programmpaket zur Zeitreihenanalyse getestet. Einen Vergleich der Stärken und Schwächen beider Softwareprodukte enthält die Tabelle 9.1. Daran schließt sich ein Demonstrationsbeispiel zur Handhabung von ITSM 2000 an.

70

Kapitel 9

Tabelle 9.1

Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000

Merkmal

EViews 5.0

ITSM 2000

Schnittstellen

EXCEL, LOTUS, DB, DRI

ASCII-Dateien name.dat

Periodisierung

Jahres- bis Tagesdaten

fehlt

Histogramm

Histogramm

Datenimport

Datenvorbehandlung

Maßzahlen Box-Plot Verteilungsplot Sample-Funktion

Sample-Funktion

4 Saisonbereinigungsverfahren

Simulation

Exponentielle Glättung

Box-Cox-Transformation Exponentielle Glättung

Filtertechniken

Lücke

Simulation

Tabellenanzeige

3 Einstichprobentests

acf, pacf, ccf

3 Zweistichprobentests

Differenzen

6 Unit-Root-Tests

QQ-Plot

acf, pacf, ccf

Spektralanalyse

Modellidentifikation

Differenzen Verteilungstests, incl. QQPlot 2 Kointegrationstests Lücken

Periodogramm fehlt

Kapitel 9

Tabelle 9.1

71

Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000 (Fortsetzung)

Merkmal

EViews 5.0

ITSM 2000

Methodenangebot univariat

ARMA-Modelle

ARMA-Modelle

GARCH-Modelle und Derivate

Fraktional integrierte Modelle

Ausschlussmöglichkeit von Zwischenwerten

GARCH-Modelle

Fraktional integrierte Modelle

Derivate von GARCHModellen

Lücken

Einschränkung bei der Autoregression mit zyklischen Peaks Keine Autoregression mit zeitverzögerten Einflussgrößen Methodenangebot multivariat

Mehrgleichungsmodelle Inputmodelle mit definierbarer Struktur Transferfunktionen Vektorautoregression Residuen-Modelle Multivariate YuleWalker-Gleichungen

Modellschätzung für kardinale Daten

LS, MLS, TSLS, GMM, GARCH

Modellschätzung für diskrete Daten

BINARY, ORDERED, CENSORED, COUNT

Lücke Automatische Modellgenerierung

LS, MLS, GARCH

Modelle für diskrete Daten nein

ja

72

Kapitel 9

Tabelle 9.1

Stärken-Schwächen-Vergleich EViews 5.0 versus ITSM 2000 (Fortsetzung)

Merkmal

EViews 5.0

Modellüberprüfung

4 Testverfahren für Parameter, z.B. KonfidenzEllipse, LikelihoodRatio-Test 6 Testverfahren für Residuen, z.B. ARCH-LMTest, Verteilungstest, Serielle Korrelation

2 Testverfahren für Residuen auf Korrelation und Gauß-Verteilung

Histogramm, acf, pacf, acf der Quadrate,

acf, pacf, acf der Absolutbeträge und Quadrate,

4 Stabilitätstests, z.B. Chow Breakpoint Test Lücken

ITSM 2000

Kumuliertes Periodogramm

QQ-Plot, Histogramm,

Keine Parameter- und Stabilitätstests Kein ARCH-LM-Test

Vergleichsprognose

Einschritt- und Mehrschritt-Modus

Mehrschrittprognose

Diverse Fehlermaße Lücke

RMSE% fehlt

Keine Fehlermaße

Qualität der Grafiken

6 Grafiktypen

1 Grafiktyp

Nachberarbeitung

Grafikeditor

Farbeinstellung

Exportfilter

3 Ausgabeformate

ASCII-File Clipboard

Qualität der Tabellen

gut

Nachberarbeitung nötig

Übersichtlichkeit der Menüs

gut bis sehr gut

befriedigend

Trennung von Modellen und Daten

definierbar

vorgegeben

Preis

895 Dollar Version 4.0

150 Dollar

245 Dollar Upgrade auf 5.0

Professional Version

Lücke

Aktuelle StudentenVersion

Kapitel 9

73

Ein Demonstrationsbeispiel zur Handhabung von ITSM 2000 Untersucht wird die Zeitreihe „Stündlicher Preis für Elektroenergie im US Staat Kalifornien“ (vgl. Tabelle 4.1). Der Datenimport erfolgt aus einer EXCEL-Datei mit dem Attribut CSV, in der die Zeitreihen spaltenweise ohne Bezeichnerzeile und ohne Datumsspalte abgelegt sind, wahlweise in ein univariates oder ein multivariates Projekt mit der Bezeichnung „name.tsm“. Für das multivariate Projekt ist die Anzahl der zu übernehmenden Spalten anzugeben. Die Dateneingabe führt unmittelbar zur Visualisierung der Zeitreihe (vgl. Bild 9.1). Series 200.

150.

100.

50.

0.

-50.

-100.

-150.

-200.

-250. 1000

Bild 9.1

3000

5000

7000

Zeitreihendiagramm Kalifornien

Zur deskriptiven Auswertung werden zwei Menüs angeboten. Unter Statistics sind die Korrelogramme, der QQ-Plot, das Histogramm und die Spektraldichtefunktion zu finden. Die Frequenzanalyse kann darüber hinaus im Menü Spectrum vertieft werden. Wählbar sind das Periodogramm, das geglättete Periodogramm, die logarithmierte Spectraldichtefunktion und die kumulierte Spektraldichtefunktion (incl. kumuliertes Periodogramm). Einige wichtige Ergebnisplots zum Beispiel liefern die Bilder 9.2 bis 9.4. Im Menü Transform können darüber hinaus eine Box-Cox-Transformation, einfache Differenzen, eine Dekomposition, eine Normierung oder Teilfolgenbestimmung vorgenommen werden. Im Menü Model wird über die Option Specify die Modellgleichung eingegeben (vgl. Bild 9.5), über Estimate eine ggf. zweistufige Schätzung oder alternativ ein Autofitting, d.h. eine automatisierte Modellspezifikation, angeboten. Letztere kann der Nutzer als Einstieg in die Modellierung verwenden und sich danach systematisch einer Strukturverfeinerung zu wenden. Eine Besonderheit bietet der Korrelationsplot, bei dem empirische und theoretische Korrelationen mit Hilfe der Einstellung Sample/Model jeweils in grün und rot einander gegenüber gestellt sind. Die theoretischen Korrelationen beziehen sich auf die Modellempfehlung aus dem Autofit (vgl. Bild 9.7) .

74

Kapitel 9

Periodogram/2pi Model Spectrum

12000.

10000.

8000.

6000.

4000.

2000.

0.

.0

.5

1.0

1.5

2.0

2.5

3.0

Bild 9.2 Periodogramm Kalifornien

2000.

1800.

1600.

1400.

1200.

1000.

800.

600.

400.

200.

-200

-100

0

100

200

Bild 9.3 Histogramm Kalifornien Unter dem Menü Garch kann ein Modell aus zeitverzögerten Varianzen und Quadratfehlern spezifiziert und überprüft werden (vgl. Bild 9.8 und 9.9). Dabei wird die Struktur das zuvor ermittelten ARMA-Modells auf die Beobachtungsgleichung übertragen. Zur Überprüfung werden verschiedene Grafiken angeboten: Residuenplot (vgl. Bild 9.10), Korrelogrammplots der Residuen und der quadrierten Residuen (vgl. Bild 9.11) und zwei QQ-Plots, einer auf Normalverteilung und einer auf t-Verteilung (vgl. Bild 9.12). An Testverfahren sind die BoxLjung-Statistik, der McLeod Li Test auf Normalverteilung, ein Ranktest auf Unabhängigkeit und der Jarque-Bera-Test ebenfalls auf Normalverteilung vorgesehen (vgl. Bild 9.13)

Kapitel 9

Q-Q (Normal) Plot, R^2 = .978968 200.

150.

100.

50.

0.

-50.

-100.

-150.

-200.

-250. -3

-2

-1

0

Bild 9.4 QQ-Plot Kalifornien

Bild 9.5 Parametereinstellung für ein ARMA-Modell

1

2

3

75

76

Kapitel 9

======================================== ITSM::(Maximum likelihood estimates) ======================================== Method: Maximum Likelihood ARMA Model: X(t) = .6390 X(t-1) + .0000 X(t-2) + Z(t) WN Variance = .635660E+03 AR Coefficients .638990 .000000 Standard Error of AR Coefficients .009128 .000000 (Residual SS)/N = .635660E+03 AICC = .660187E+05 BIC = .660237E+05 FPE = .635839E+03 -2Log(Likelihood) = .660147E+05 Accuracy parameter = .00640000 Number of iterations = 1 Number of function evaluations = 11 Uncertain minimum. Bild 9.6

Output der automatisierten AR-Schätzung Sample ACF Model ACF

1.00

Sample PACF Model PACF

1.00

.80

.80

.60

.60

.40

.40

.20

.20

.00

.00

-.20

-.20

-.40

-.40

-.60

-.60

-.80

-.80

-1.00

-1.00 0

Bild 9.7

5

10

15

20

25

30

35

40

0

5

10

15

Korrelogramme der Daten (grün) und des AR-Modells (rot)

20

25

30

35

40

Kapitel 9

Bild 9.8

Parametereinstellung für ein GARCH-Modell

========== ITSM::(INFO) ========== # of Data Points =

7104

Subtracted Mean = -.0062 Sample Variance = .107422E+04 Std.Error(Sample Mean) = .627301 (square root of (1/n)SUM{(1-|h|/r)acvf(h)}, |h| 5,991 verworfen. • Das Verhältnis H(47) der Quadratsumme aus den ersten und letzten 47 Residuen n

H(h ) =

∑ aˆ 2t

t = n − h +1 d +1+ h aˆ 2t t = d +11











ist mit dem Quantil der F-Verteilung F(47, 47; 0,05) = 1,64 zu vergleichen (vgl. Koopman u. A. [2000], S. 183). Die Nullhypothese (H0: Die Varianz ist zeitunabhängig.) wird wegen 2,7087 > 1,64 verworfen. Die beiden Autokorrelationen der Residuen zum Lag 1 und zum Lag 11, r(1) und r(11), sind wegen der für große Stichproben gültigen Näherung sr2~ 1/T zu vergleichen mit dem Quantil der N.V.(0, 1/T) für α = 0,05, d. h. mit 0,158 (siehe Koopman u. A. [2000], S. 173). Die Durbin-Watson-Statistik beträgt 1,7556 und ist zu vergleichen mit dem Quantil der N.V. (2; 4/T) für α = 0,05, d.h. mit 2,314 (siehe Koopman u. A. [2000], S. 173). Die Nullhypothese (H0: Autokorrelation erster Ordnung liegt nicht vor.) wird wegen 4 - 2,314 < 1,7556 < 2,314 nicht verworfen. Die Box-Ljung-Statistik zur Anzeige serieller Korrelation bis zum Lag 11 beträgt 7,9913 und ist mit dem Quantil der Chi-Quadrat-Verteilung χ2(8; 0,05) = 15,507 zu vergleichen. Die Nullhypothese (H0: Serielle Korrelation bis zum Lag 11 liegt nicht vor.) wird folglich nicht verworfen. Das saisonale Bestimmtheitsmaß beträgt 22,9%. Es setzt die Restvarianz σa2 ins Verhältnis zur Varianz der Saisondifferenzen der Beobachtungen.

Die Residualvarianzen der einzelnen Gleichungen werden jeweils auf die Restvarianz der Beobachtungsgleichung bezogen (vgl. q - ratio in Tabelle 13.3). Auf die Niveaugleichung entfällt danach ein Erklärungsanteil von 5,87% und auf die Saisongleichung ein Erklärungs-

Kapitel 13

91

anteil von unter 1%. Die Trendänderungsgleichung leistet keinen Beitrag zur Varianzerklärung. Der Trendzuwachs wird demzufolge als nicht stochastisch eingestuft. Die entsprechende Gleichung ist überflüssig. Die gewählte Saisonmodellierung könnte mit Hilfe eines LR-Tests mit den Alternativen (Dummy-Ansatz bzw. konstante Ausschläge in der Beobachtungsgleichung) verglichen werden.1

Tabelle 13.3 Estimated variances of disturbances Component Irregular Level Slope Seasonal

variance

q-ratio

1052,9 61,758 0,00000 0,82786

1,0000 0,0587 0,0000 0,0008

Für die Standardabweichungen sind die entsprechenden Verhältniszahlen (q - ratio) in Tabelle 13.4 aufgelistet.

Tabelle 13.4 Estimated standard deviations of disturbances Component

Standard deviation

Irregular Level Slope Seasonal

32,448 7,8586 0,00000 0,90987

q-ratio 1,0000 0,2422 0,0000 0,0280

Die Schätzung des Zustandsraumvektors am Ende des Analysezeitraums enthält Tabelle 13.5. Das Niveau, der Trendzuwachs und 5 der modifizierten Saisonausschläge sind signifikant geschätzt. Die modifizierten Saisonausschläge 1, 3, 7, 9 und 11 hingegen lassen sich nicht signifikant schätzen.

Tabelle 13.5 Estimated coefficients of final state vector Variable

Coefficient R.m.s.e.

Level Slope Sea_ 1 Sea_ 2 Sea_ 3 Sea_ 4 Sea_ 5 Sea_ 6 Sea_ 7 Sea_ 8 Sea_ 9 Sea_10 Sea_11

804,81000 1,60270 0,78449 -59,51100 -3,19890 84,21500 20,48600 13,15900 3,38560 17,52600 1,70720 20,31900 0,98623

1

15,70500 0,64778 6,78640 6,90630 6,53840 6,61070 6,49030 6,55230 6,47430 6,53330 6,46970 6,53000 5,44470

t-value 51,24500 2,47420 0,11560 -8,61700 -0,48924 12,73900 3,15640 2,00820 0,52293 2,68260 0,26387 3,11160 0,18114

p-value 0,0000 0,0145 0,9081 0,0000 0,6254 0,0000 0,0019 0,0465 0,6018 0,0082 0,7923 0,0022 0,8565

Der Standardfehler für ein Modell mit Dummy-Saison beträgt 37,771. Der LR-Wert 10,153 liegt über dem Vergleichswert 7,815 der Chi-Quadrat-Statistik. Der Dummy-Ansatz ist somit vorzuziehen.

92

Kapitel 13

Zur Saisonanalyse gehören ein Test auf Saisonalität und eine Liste der Saisonausschläge (vgl. Tabelle 13.6). Der Test auf saisonalen Einfluss geht von folgenden Hypothesen aus:

H0 :

Die s – 1 Saisonkomponenten im Schätzvektor sind identisch.

HA:

Die s – 1 Saisonkomponenten sind signifikant verschieden voneinander.

Die Teststatistik SC mit dem Vektor der s – 1 Saisonkomponenten a und der Matrix P der Mean Square Error-Schätzung ergibt sich aus SC = a ' ⋅ P −1 ⋅ a und wird mit dem Quantil der Chi-Quadrat-Verteilung χ2(s - 1; 0,05) verglichen. Im Beispiel gilt SC = 298.333 > χ2(11; 0,05) = 19,675. Folglich ist H0 zu verwerfen. Das Saisonmuster zeigt positive Ausschläge in den Wintermonaten Januar und Dezember (Heizperiode), sowie in den Sommermonaten Juli bis September (Klimatisierungsperiode). Tabelle 13.6 Saisonausschläge Seas 1 Value

Seas 2

76,595 Seas 7

Value

-29,728 Seas 8

91,068

Seas 3

Seas 4

-46,753 Seas 9

147,020

-106,76 Seas 10

57,949

Seas 5 -98,027 Seas 11

-6,9665

-86,750

Seas 6 -21,805 Seas 12 24,151

Das Testen auf Normalverteilung kann weiter verfeinert werden, indem Schiefe und Wölbung jeweils einzeln oder gemeinsam nach Bowman/Shenton bzw. Jarque/Bera (BS) bzw. weiter verfeinert nach Doornik/Hansen (DH) abgetestet werden (siehe Koopman u. A. [2000], S. 139). Die Vergleichswerte der Chi-Quadrat-Statistik betragen für α = 0,05 und einen Freiheitsgrad 3,841 bzw. 5,991 für zwei Freiheitsgrade. Die Nullhypothese (H0: Normalverteilung liegt vor.) wird in allen vier Fällen auf einem Signifikanzniveau von unter 5% verworfen. Tabelle 13.7 Normality test for Residuals Maßzahl Sample Size Mean Std.Devn. Skewness Excess Kurtosis Minimum Maximum Skewness Chi^2(1) Kurtosis Chi^2(1) Normal-BS Chi^2(2) Normal-DH Chi^2(2)

Schätzwert

P - value 143 -0,039716 0,999211 0,649390 0,855871 -2,471899 3,414540 10,0510 4,3646 14,4150 9,4620

0,0015 0,0367 0,0007 0,0088

Kapitel 13

93

Einige weitere Gütemaße sind in Tabelle 13.8 zu sehen. Neben der Restvarianz pev , sind die mittlere absolute Abweichung md

pev = σ a2

md =

T σ at ∑ T − d t =d +1

und das Verhältnis aus Restvarianz und dem Quadrat der mittleren absoluten Abweichung aufgeführt. Letzteres sollte bei korrekter Spezifiktion näherungsweise gleich 1 sein. Das trifft offensichtlich zu. Tabelle 13.8 Goodness-of-fit results and serial correlation statistics for residuals Maßzahl

Wert

Prediction error variance (p.e.v) Prediction error mean deviation (m.d) Ratio p.e.v. / m.d in squares Coefficient of determination ... based on differences ... based on diff around seas mean Information criterion of Akaike Information criterion of Schwartz (Bayes)

1531,968274 1177,412957 1,077760 0,852309 0,777104 0,229034 7,539437 7,852243

R2 RD2 RS2 AIC BIC

Durbin-Watson Asymptotic deviation for correlation

1,75663 0,0836242

Die drei Bestimmtheitsmaße R2, RD2 und RS2

R2 = 1−

σ a2 σ 2x

R 2D = 1 −

σ a2 2 σ dx

DX t = (1 − B) ⋅ X t

R S2 = 1 −

σ a2 2 σ sx

SX t = (1 − B12 ) ⋅ X t

geben Aufschluss über die Erklärungsgüte, wobei insbesondere RS2 zu beachten ist, weil die Reihe über Trend und Saison verfügt. Diese Maßzahl zeigt an, wie viel Varianz das Modell über die durch Trend und Saison verursachte Variation hinaus erklären kann. Die beiden Gütemaße für Modelle optimaler Kompliziertheit von Akaike und Bayes-Schwartz

AIC = ln σ a2 + 2 ⋅

m T

BIC = ln σ a2 + ln T ⋅

m T

liegen mit 7,539 und 7,852 dicht beieinander. Die Durbin-Watson-Statistik wurde bereits im Zusammenhang mit der Tabelle 13.2 ausgewertet. Die asymptotische Standardabweichung sr der Autokorrelationen rk ist der Kehrwert der Wurzel aus n = 143 und beträgt 0,0836. Mit ihrer Hilfe kann ein Konfidenzband um die Autokorrelationen der Residuen gezogen und ein Test auf identische Normalverteilung mit N.V.(0, 1/n) durchgeführt werden. Da gemäß Tabelle 13.9 weniger als 5% der rk außerhalb der 2-Sigma-Grenzen ±1,96·0,0836 = ±0,1639 liegen2, ist die Nullhypothese (H0: Identische Normalverteilung.) zu verwerfen. 2

Es dürften maximal 2 Werte außerhalb liegen. Tatsächlich fällt aber gar kein Wert aus dem Konfidenzband heraus.

94

Kapitel 13

Die Box-Ljung-Statistik für Lag 31 (siehe Tabelle 13.9) ist bei vier Hyperparametern mit dem Wert der Chi-Quadrat-Statistik für 31 – 4 + 1 = 28 Freiheitsgraden, d. h. 41,337 bei α = 0,05 zu vergleichen (siehe Koopman u. A. [2000], S. 182). Die Nullhypothese (H0: Serielle Korrelation bis zum Lag 31 liegt nicht vor.) wird wegen 19,0571 < 41,337 nicht verworfen. Tabelle 13.9

Lag

Korrelogramm der Residuen

dF 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31

SerCorr 0 0 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27

0,1170 -0,1130 0,0092 -0,0654 0,0296 -0,0328 0,0492 -0,1193 -0,0438 0,0176 0,0413 0,0027 0,0402 0,1585 -0,0281 0,0148 -0,0351 -0,0338 0,0166 -0,0145 0,0071 -0,0560 0,0561 0,0102 0,0653 -0,0353 -0,0784 -0,0056 -0,1043 -0,0087 -0,0718

BoxLjung

4,6591 4,8220 5,1918 7,3782 7,6750 7,7233 7,9913 7,9925 8,2507 12,2879 12,4159 12,4518 12,6548 12,8447 12,8911 12,9264 12,9349 13,4729 14,0166 14,0347 14,7831 15,0043 16,1035 16,1091 18,0891 18,1028 19,0571

ProbChi2(dF)

0,0309 0,0897 0,1583 0,1172 0,1751 0,2591 0,3334 0,4342 0,5091 0,2663 0,3332 0,4101 0,4748 0,5388 0,6107 0,6781 0,7405 0,7628 0,7827 0,8287 0,8337 0,8621 0,8508 0,8841 0,8386 0,8720 0,8679

Das kumulative Periodogramm (vgl. Götze [2000], S. 151) wird für [n/2] = 71 Werte berechnet und im Einheitsquadrat abgetragen (vgl. Bild 13.2). Der maximale Abstand von der Diagonalen ist bei der Periodogrammordinate 44 zu verzeichnen und beträgt 0,17306. Kritische Werte für einen zweiseitigen Test nach Durbin sind 0,44 für T ~ 80, 0,4 für T ~ 100 und 0,3 für T ~ 200 (siehe Koopman u. A. [2000], S. 183). Danach wird die Nullhypothese (H0: Ein Saisoneinfluss in den Residuen ist nicht vorhanden.) wegen 0,17306 < 0,3 nicht abgelehnt. Ein entsprechendes Konfidenzband würde das kumulative Periodogramm im Bild 13.2 vollständig einhüllen.

Kapitel 13

2.5

Correl og ram

1

Residual r1

95

Residual r1

0

0.0

1995 Pergr

0.50

2000

0

10

Density

Spectrum

20

30

N(s=0.999)

0.4

0.25

0.2

0 QQ plot

20

40

60

80

normal

2.5

-2 1.0

0

2

4

Residual CusumPergr2

0.5

0.0

-2

-1

Bild 13.2

0

1

2

0

20

40

60

80

Diagramme zur Residuenanalyse

Ein grafische Darstellung des Verlaufs der geschätzten Trend-, Saison- und Restkomponente offeriert das Bild 13.3.

1000

r1

Trend_r1

800 600 1990

1995

2000

1995

2000

1995

2000

Seas_r1

100 0 -100 1990 100

Irr_r1

50 0 -50 1990

Bild 13.3

Diagramme der Komponenten

Durch eine Glättung der Residuen aus der Beobachtungsgleichung und aus der Niveaugleichung (vgl. Koopman u. A. [2000], S. 60) kann die Wirkung von Ausreißern und Trendbrüchen auf die Testergebnisse untersucht werden (siehe Tabelle 13.10 und Bild 13.4). Offensichtlich wird für die geglätteten Fehler in der Beobachtungsgleichung (IrrRes) die Nullhypothese auf Normalverteilung nicht mehr durchweg verworfen, da zumindest der Prüfwert bezogen auf die Schiefe mit 2,732 unter dem Vergleichswert 3,841 der Chi-Quadratverteilung

96

Kapitel 13

liegt. Die Residuen der Niveaugleichung folgen in allen vier Testverfahren einer Normalverteilung. Tabelle 13.10

Normality tests for smoothed residuals

Komponente

Maßzahl

Wert

Normality test for IrrRes

Sample Size Mean Std.Devn. Skewness Excess Kurtosis Minimum Maximum Skewness Chi^2(1) Kurtosis Chi^2(1) Normal-BS Chi^2(2) Normal-DH Chi^2(2)

156 -0,000293 1,001539 0,324155 1,064985 -2,974751 3,035828 2,732 7,3723 10,104 8,3612

0,0984 0,0066 0,0064 0,0153

Sample Size Mean Std.Devn. Skewness Excess Kurtosis Minimum Maximum Skewness Chi^2(1) Kurtosis Chi^2(1) Normal-BS Chi^2(2)

156 -0,000106 0,991810 -0,167669 0,408778 -3,022720 2,335930 0,73093 1,08610 1,81710

0,3926 0,2973 0,4031

Normality test for LvlRes

Standardfehler

Density 2.5

IrrRes r1

0.0

0.25

-2.5 1990 QQ plot 2.5

N(s=1)

0.50

1995

2000

-4

normal

2

-2

0

2

4

LvlRes r1

0

0.0

-2 -2.5 -2 Density

-1

0

1

2

1990 QQ pl ot 2.5 normal

N(s=0.992)

1995

2000

0.4 0.0 0.2 -2.5 -4

-3

Bild 13.4

-2

-1

0

1

2

3

-2

-1

0

1

Diagramme der geglätteten Residuen für Niveau und Trend

2

Kapitel 13

97

Im Bild 13.5 sind die Vergleichsprognosen für die ersten 7 Monate des Jahres 2003 bezogen auf die Beobachtungen und auf die geschätzten Trend- und Saisonkomponenten aufgeführt. Bild 13.5

Diagramme zur Vergleichsprognose mit Komponenten

Die Fehler der Einschritt-Vergleichsprognosen sind der Tabelle 13.11 zu entnehmen (Spalte Error). Dividiert durch die fortgeschriebene Restvarianz (RMSE) ergeben sich daraus die Residuen (Spalte Residual). Deren Summe (Cusum) bzw. deren Quadratsumme (Cusum2) wer1000

F-r1

Forecast

800 600 1997 1000

F-r1

1998

1999

2000

2001

2002

2003

2004

1998

1999

2000

2001

2002

2003

2004

1998

1999

2000

2001

2002

2003

2004

F-Trend_r1

800

600 1997 F-Seas_r1

100 0 -100 1997

den jeweils noch einmal abgetestet, um Hinweise auf eine mögliche Fehlspezifikation des Modells zu erhalten (vgl. Koopman u. A. [2000], S. 184 ff.). •

Die Summe der Residuen, dividiert durch Wurzel aus 7, folgt approximativ einer StudentVerteilung mit 156 - 7 Freiheitsgraden. Da der Prüfwert 1,622 unter dem Wert der tStatistik 1,65 für α = 5% liegt, wird die Nullhypothese (H0: Das ist Modell korrekt spezifiziert.) nicht verworfen.



Die Quadratsumme der Residuen folgt approximativ einer Chi-Quadrat-Verteilung mit 7 Freiheitsgraden. Da der Prüfwert von 27,64 über dem Vergleichswert von χ2(7 ; 0,05) = 14,067 liegt, wird die Nullhypothese (H0: Das Modell ist korrekt spezifiziert.) hiernach verworfen.

Es ergibt sich ferner ein mittlerer quadratischer Fehler relativ zum Mittelwert von 10%. Der Wert erscheint allerdings nicht im Output. Er liegt um 3% höher als beim entsprechenden GARCH-Ansatz in Kapitel 7. Die Vergleichsprognose liegt nicht vollständig im Konfidenzband (vgl. Bild 13.6). Sie bricht im Januar und im Juli aus. Das deutet auf die Nachfragespitzen im Winter und im Hochsommer hin.

98

Kapitel 13

Tabelle 13.11 7 post-sample predictions

Period

Error

2003.1 2003.2 2003.3 2003.4 2003.5 2003.6 2003.7

93,28 -71,47 -78,60 21,52 11,65 45,15 154,5

R.m.s.e. 41,02 41,01 41,01 41,01 41,01 41,00 41,00

Residual 2,274 -1,743 -1,917 0,5248 0,2842 1,101 3,767

Cusum 2,274 0,5317 -1,385 -0,8602 -0,5759 0,5251 4,293

Failure Chi2(7) test is 27.6449 [0.0003] Cusum t(7) test is 1.62244 [0.1487]

r1

1000

Fitted

800

600

1990 1100

1995 r1

2000

Forecast

1000 900 800 700

2003

Bild 13.6 Punkt- und Intervallprognose am aktuellen Rand

Cusum2 5,172 8,209 11,88 12,16 12,34 13,45 27,64

Kapitel 14

14.

99

Interpretation der empirischen Ergebnisse

Nachfolgend werden Strukturgleichungsmodelle für ausgewählte Monatsreihen vorgestellt. Dazu gehören Umsatz- und Absatzreihen des Elektroenergiehandels in Kalifornien und Preisreihen für Erdöl, Erdgas und Elektroenergie für die USA insgesamt. Daran schließen sich zwei Versuche mit Wochen- und Tagesdaten an. Es handelt sich um die Modellierung einer Wochenreihe zum Margarineabsatz und einer täglichen Preisreihe für Elektroenergie im US Bundesstaat Kalifornien. Den Abschluss bilden Untersuchungen von Tagesreihen für die Labornutzung an der Fachhochschule Stralsund, die sich bei der GARCH-Modellierung im ersten Teil der Studie als besonders schwierig heraus gestellt haben. 14.1 Analyse des monatlichen Elektroenergiehandels im US-Bundesstaat Kalifornien •

Es wurden zunächst nur jene 11 Monatszeitreihen untersucht, bei denen Ausschläge im Korrelogramm beim Lag 12 und verschiedene Einheitswurzeltests auf saisonale Differenzen bzw. eine Kombination von saisonalen mit einfachen Differenzen hingewiesen haben (Gruppe 1).



In einem zweiten Modelllauf wurden solche Reihen untersucht, bei denen beide Einheitswurzeltest die Nullhypothese jeweils abgelehnt haben, aber im Korrelogramm Ausschläge beim Saisonlag oder bei Vielfachen des Saisonlags, z. B. beim Lag 24, zu beobachten waren (Gruppe 2).



Am Schluss wurde auch noch die Reihe R 9 betrachtet, bei der weder die Korrelogramme, noch das Periodogramm Aufschluss über ein Trend- bzw. Saisonmuster geliefert und darüber hinaus beide Einheitswurzeltests die Nullhypothese abgelehnt haben.

Tabelle 14.1

Gruppeneinteilung der untersuchten Zeitreihen

Einheitswurzeltests Peaks am Saison- Differenzen lag 12 in zwei Test 1 Test 2 Kennfunktionen1 j

n

j

Reihen

(1 – B12)

R 1, R 6, R 7, R 10, R 13, R 14 12

j

j

j

(1 – B)(1 – B ) R 2, R 3, R 5, R 12, R 15

n

n

j

keine

R 4, R 8, R 11

n

n

n

keine

R9

In der ersten Gruppe wurde in acht Fällen eine stochastische Saison festgestellt, d.h. die Varianz der Saisonkomponenten wurden jeweils als von null verschieden ausgewiesen (vgl. Tabelle 14.2). Das betraf die Umsatzreihen R1, R2, R3 und R5, sowie die Erlösreihen R12, R13, R14 und R15. Die Absatzreihen hingegen wiesen keine stochastischen Saisonkomponenten auf. Die Saisonvarianzen wurden entsprechend mit null ausgewiesen.

1

Im partiellen Korrelogramm und im Periodogramm

100

Kapitel 14

Das saisonale Bestimmtheitsmaß lag bei den Umsatzreihen zwischen 11,38% und 22,9%, bei den Erlösreihen hingegen nur zwischen 0,55% und 2,99%. Bei den Absatzreihen fiel das saisonale Bestimmtheitsmaß wesentlich höher aus und schwankte zwischen 33% und 45%. Ein stochastischer Trend wurde nur bei der Umsatzreihe R2 und der zugehörigen Absatzreihe R 7 festgestellt. Beide Reihen beziehen sich auf den Sektor Handel. Eine Kombination von stochastischer Saison mit stochastischem Trend konnte nur einmal ermittelt werden und zwar für die Reihe R2. Die größte Varianz trat bei 9 von 11 Reihen in der Beobachtungsgleichung auf. Eine Ausnahme bildeten die Erlösreihen R12 und R15. Dort trat die höchste Varianz in der Niveau-Gleichung auf. Mit Ausnahme der Reihe R14 lagen die Bestimmtheitsmaße stets deutlich über 80%. Insgesamt ließ sich für die erste Gruppe feststellen: • • •

Es dominierte die stochastische Saison gegenüber dem stochastischen Trend. Die höchste Varianz wurde überwiegend in der Beobachtungsgleichung ausgewiesen. Die Bestimmtheit lag meist deutlich über 80%.

In der zweiten Gruppe traten negative saisonale Bestimmtheitsmaße bei den Reihen R4 und R11 auf. Bei beiden Reihen wurde die höchste Varianz für die Niveaukomponente ausgewiesen. Bei der Reihe R8 fiel das allgemeine Bestimmtheitsmaß mit 67,5% deutlich ab gegenüber den Vergleichswerten der anderen Reihen. Insgesamt ließ sich für die zweite Gruppe feststellen: • • •

Eine Dominanz der stochastischen Saison gegenüber dem Trend war nicht erkennbar. Die höchste Varianz wurde zumeist in der Niveaugleichung ausgewiesen. Die verschiedenen Bestimmtheitsmaße lagen unter denen der Gruppe 1.

Die dritte Gruppe enthielt mit der Variablen R9 eine Zeitreihe ohne stochastische Saison und ohne stochastischen Trend. Es ergaben sich nur ein sehr niedriges allgemeines Bestimmtheitsmaß und negative Bestimmtheitsmaße für den Trend und die Saison. Da die höchste Varianz für die Niveaugleichung ausgewiesen wurde, bestand zudem wenig Hoffnung, durch zusätzlich Strukturgleichungen eine bessere Anpassungsgüte zu erreichen. Ein weitere Erkenntnis bezog sich auf die Einheitswurzeltests: Vorgeschaltete Einheitswurzeltests halfen speziell bei saisonalen Zeitreihen, die Struktur der stochastischen Komponenten zu identifizieren. Wurden die Nullhypothesen der Einheitswurzeltest abgelehnt, so traten Probleme bei der Modellbildung auf. Die angepassten Strukturgleichungsmodelle wiesen in solchen Fällen meist besonders niedrige Bestimmtheitsmaße auf.

Kapitel 14

101

102

Kapitel 14

Kapitel 14

103

104

Kapitel 14

14.2 Analyse monatlicher Preise für Rohöl, Erdgas und Elektroenergie in den USA Die Anpassung von Strukturgleichungsmodellen an die nichtsaisonalen, monatlichen Rohölpreise führte jeweils auf eine stochastische Niveau- und eine stochastische Trendkomponente. Den Ausgangspunkt bildete ein Einheitswurzeltest, der die Nullhypothese nicht verwerfen konnte. Die höchste Varianz entfiel stets auf die Trendkomponente. Für die Beobachtungsgleichung jeder Reihe wurde eine verschwindende Restvarianz ausgewiesen. Das allgemeine Bestimmtheitsmaß betrug jeweils mehr als 95%. Die Trendbestimmtheit fiel stets negativ aus (siehe Tabelle 14.4). Bei der Modellierung von Erdgaspreisen waren drei Fälle zu unterscheiden: • • •

Vier Reihen mit einer einfachen Einheitswurzel. Eine Reihe mit einer Saisonalen Einheitswurzel. Eine Reihe ohne Einheitswurzel.

Tabelle 14.3

Fallunterscheidung bei den monatlichen Erdgaspreisen

Einheitswurzeltests Test 1 Test 2

Peaks am Saisonlag in Kennfunktionen2

Differenzen

Reihen

j

n

j

(1 – B12)

NGWPUUS, NGCGUUS, NGCCUUS, NGINUUS

j

-

j

keine

NGRCUUS

n

-

n

keine

NGEIUUS



Die Strukturgleichungsmodelle bestanden im Fall 1 bis auf eine Reihe aus einer Beobachtungsgleichung und einer Niveaugleichung. Auf die Niveaukomponente entfiel dabei die höchste Varianz. Das allgemeine Bestimmtheitsmaß betrug mindesten 75%. Die formal mitgeführte Saisonkomponente führte weder eine von 0 verschiedene Varianz noch auf ein positives saisonales Bestimmtheitsmaß (vgl. Tabelle 14.5). Sie kann folglich entfallen. An der Modellspezifikation ändert sich nichts. • Die Modellierung im Fall 2 führte auf eine stochastische Niveau- und eine stochastische Saisonkomponente. Das allgemeine Bestimmtheitsmaß war mit 97% vergleichsweise hoch und das saisonale Bestimmtheitsmaß fiel positiv aus. Die größte Varianz trat ebenfalls bei der Niveaukomponente auf. • Im Fall 3 resultierte aus der Modellbildung lediglich eine stochastische Niveaukomponente. Das allgemeine Bestimmtheitsmaß grenzte an 90%. Die Trendbestimmtheit hatte einen positiven, die Saisonbestimmtheit folgerichtig einen negativen Wert. Die Modellbildung für Elektroenergiepreise (vgl. Tabelle 14.6) zeigte deutlich, dass neben den Einheitswurzeltests auch die Kennfunktionen (Korrelogramme, Periodogramm etc.) zu beachten sind. Obwohl von den Einheitswurzeltests die Nullhypothese stets verworfen wurde, machte es eingedenk der Ausschläge in den Korrelogrammen am Saisonlag 12 und der Peaks in den Periodogrammen bei der Frequenz 0,0833 (gleich 1/12) doch Sinn, eine Saisonkomponente anzusetzen. Alle vier Reihen wiesen somit eine stochastische Niveau- und ein stochastische Saisonkomponenten auf. Die allgemeinen Bestimmtheitsmaße überstiegen 90%. Die Trendbestimmtheit betrug mindestens 70%. Die Saisonbestimmtheit fiel allerdings überall negativ aus. Das lag an den vergleichsweise sehr niedrigen Saisonvarianzen.

2

Im partiellen Korrelogramm und im Periodogramm

Kapitel 14

105

106

Kapitel 14

Kapitel 14

107

108

Kapitel 14

14.3 Analyse einer Wochen- und einer Tagesreihe Die wöchentliche Absatzreihe eines Margarineproduzenten enthielt keine Einheitswurzel und keine Hinweise auf saisonale Einflüsse. Das Strukturgleichungsmodell bestand aus einer stochastischen Beobachtungsgleichung und einer stochastischen Niveaugleichung (vgl. Tabelle 14.7). Die allgemeine Bestimmtheit fiel mäßig aus und lag noch unter der Trendbestimmtheit. Offenbar hätten erklärende Variablen hinzu gezogen werden müssen, um eine bessere Anpassungsgüte zu erreichen. Die Stundenzeitreihe USP10 wurde mit Hilfe eines Viergleichungsmodells abgebildet. Zu der Niveau- und der Trendkomponente gesellte sich noch eine zyklische Komponente für den 24Stunden-Rhythmus hinzu. Der Wochenzyklus konnte wegen seiner Periodenlänge von 168 Stunden in STAMP leider nicht berücksichtigt werden3. Die allgemeine Bestimmtheit erreichte nicht einmal 30%. Der Hauptteil der Varianz wurde von der Beobachtungsgleichung getragen (vgl. Tabelle 14.7). Die schlechten Ergebnisse waren auch vor dem Hintergrund des Einheitswurzeltests zu sehen, welche die Nullhypothese jeweils ablehnten. 14.4 Analyse der täglichen Labornutzung am Fachbereich Wirtschaft der FH Stralsund Die tägliche Labornutzung im Haus 21 wurde mit einem Wochenzyklus von 7 Tagen modelliert, der aber nur bei zwei der fünf Reihen als stochastische Komponente ausgewiesen worden ist: Beim Labor 3 und beim Übungspool (vgl. Tabelle 14.8). Die allgemeine Bestimmtheit wurde auf diese Weise aber nur für das Labor 3 leicht verbessert. Die Kombinationen aus stochastischer Beobachtungsgleichung und Niveaugleichung führte im Fall von Labor 2 und vom Hauseingang auf Bestimmtheitsmaße von 11% bzw. 23%. Insgesamt dominierte jeweils die Varianz der Beobachtungsgleichung. Im Fall von Labor 1 wurde sogar nur diese Gleichung im Output ausgewiesen. Offensichtlich konnte ohne weitere erklärende Variablen keine höhere Anpassungsgüte erreicht werden.

3

Das Eingabefeld für die Zyklenlänge nimmt nur zweistellige Werte an.

Kapitel 14

109

110

Kapitel 14

Kapitel 15

15.

111

Zur Prognosegüte von Strukturgleichungsmodellen

Die Prognosegüte der mit STAMP spezifizierten Strukturgleichungsmodelle wurde mit der Prognosegüte der mit EViews spezifizierten Zweigleichungsmodelle unter Berücksichtigung von GARCH-Residuen verglichen (siehe Tabelle 15.1). Tabelle 15.1 Fehlervergleich zwischen STAMP und EViews Prognosen Zeitreihe R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 R11 R12 R13 R14 R15 CODPUUS COFMUUS COIMUUS RADMUUS RAIMUUS RACPUUS NGWPUUS NGCGUUS NGRCUUS NGCCUUS NGINUUS NGEIUUS ESRCUUS ESCMUUS ESICUUS ESTCUUS Labor 1 Labor 2 Labor 3 Pool Eingang Haus 21 MARW USP10

1

RMSE% STAMP 9,97 6,67 5,18 9,56 6,75 7,85 5,00 6,41 23,13 5,71 4,49 5,36 7,34 24,89 4,75 5,82 5,62 3,17 3,95 5,43 5,28 5,29 3,37 2,78 2,50 3,98 7,80 0,75 0,97 1,74 1,46 434,32 441,32 170,54 70,08 46,04 16,68 37,08

RMSE% GARCH Vergleich1 6,83 7,09 14,03 13,92 6,86 7,19 3,78 6,80 22,98 4,13 4,95 9,44 11,49 26,73 7,45 6,99 6,29 4,63 4,00 7,03 6,70 5,60 4,13 2,80 3,11 6,88 9,01 1,64 1,51 1,75 1,00 354,60 611,10 208,63 62,03 47,14 18,94 22,12

0 + + 0 0 0 0 0 + + + + + 0 + 0 + + 0 0 0 0 + + 0 0 0 0 + + + + -

- Nachteil STAMP, + Vorteil STAMP, 0 Gleichwertigkeit (Betrag der Fehlerdifferenz kleiner als 1%)

112

Kapitel 15

In der Summe ergaben sich 16 herausragende Prognosen mit Strukturgleichungsmodellen, gegenüber 6 herausragenden Prognosen mit GARCH-Ansätzen. In weiteren 16 Fällen war Gleichwertigkeit festzustellen (absolute Fehlerdifferenz kleiner als 1%). Bei näherer Betrachtung ergab sich ein sehr differenziertes Bild: •

Bei den Umsatzreihen R1 bis R5 dominierten die Strukturgleichungsmodelle zum Teil mit spektakulären Vorteilen in der Prognosegüte, z.B. bei R3 mit einem Plus von 8,84%. Bei den Absatzreihen R6 bis R10 lagen hingegen die GARCH-Ansätze leicht vorne. Bei den Erlösen R11 bis R15 wiederum dominierten mehrheitlich die Strukturgleichungsmodelle.



Bei den Rohölreihen waren leichte Vorteile bei den Strukturgleichungsmodellen zu erkennen, die sich aber bei den Gasreihen verringerten und bei den Elektroenergiereihen nahezu verloren.



Bei den Laborreihen waren die Prognoseergebnisse aus praktischer Sicht gleichermaßen unbrauchbar.



Bei der Wochenreihe gelang mit STAMP eine leichte Fehlersenkung, die aber praktisch nicht relevant war.



Bei der exemplarisch untersuchten Stundenreihe für Elektroenergie-Preise in Kalifornien schnitten die Strukturgleichungsmodelle erheblich schlechter ab. Ein Vergleich der Tagesfehler unterstreicht diese Feststellung (siehe Tabelle 15.2). Bei der gravierenden Fehlprognose für den Mittwoch ist zu beachten, dass mit STAMP lediglich der Tageszyklus nicht aber der Wochenzyklus erfasst wurde.

Tabelle 15.2 Prognosefehler für stündliche Elektroenergiepreise im US-Staat Kalifornien2 Reihe/Tag

Fr

Sa

So

Mo

Di

Mi

Do

USP10/Eviews

23,93

18,24

21,96

35,13

13,23

20,99

13,88

USP10/STAMP

7,99

24,49

52,77

301,45

20,94

27,14

21,16

Insgesamt legt der empirische Vergleich nahe, dass mit Strukturgleichungsmodellen und STAMP zumindest für Monatsreihen mit Trend- und Saisoneinfluss etwas niedrigere Fehler bei der vergleichenden Punktprognose erreichbar sein könnten als mit autoregressiven Modellen und GARCH-Residuen. Die Aussagekraft der Intervallprognosen bleibt dahinter aber erheblich zurück, da eine zeitvariable Varianz in STAMP nur mit großen modellseitigen Einschränkungen realisiert werden kann. Vom analytischen Gesichtspunkt aus birgt der Ansatz mit den Strukturgleichungsmodellen zumindest die Gefahr, dass statistische Untersuchungen an der Zeitreihe im Rahmen der Modellidentifikation nicht gründlich genug durchgeführt werden. Derartige Untersuchungen scheinen angesichts der einfachen Modellstruktur mit Random Walks und einer sehr sparsamen, meist sogar überflüssigen Parametrisierung verzichtbar, was sich aber spätestens bei der Interpretation von Ergebnissen als Irrtum heraus stellen dürfte. Ungeeignet scheinen Strukturgleichungsmodelle für die Prognose von Stundendaten auf dem Elektroenergiemarkt zu sein. Der interessante Vorschlag zur Modellierung mit Spline-Polynomen (vgl. Harvey u.A. [1993], der sich mit STAMP realisieren lässt, wurde in der Literatur der letzten Jahre nicht mehr erwähnt. Die typischen Anwendungen liegen meist im Bereich von Monats- und Quartalsdaten (vgl. Proietti [2004]). In den letzten Jahren sind im Bereich der Forschung aber auch Untersuchungen von Tagesreihen aus dem Bereich der Steuereinnahmen von Kommunen durchgeführt worden (vgl. Koopman [2004]). 2

25.7. bis 31.7.2003

Kapitel 16

16.

113

Einführung in das Programmpaket STAMP

Das Programmsystem STAMP ist unter der Federführung von A. C. Harvey am Ende der achtziger Jahre an der London School entwickelt und seither systematisch erweitert worden. Die jüngste Kreation besteht in der Oberfläche GiveWin zur empirischen Modellierung, an der u.a. D. Hendry mitgewirkt hat. Beide Programme werden im Paket von der Firma Timberlake Consultants Ltd. in London vertrieben, die auch weitere Angebote, wie z.B. Datenbestände und Schulungen zu den Programmen und Methoden offeriert. 16.1 Schrittfolge der Dateneingabe und Elemente der Datenmanipulation mit GiveWin • • • • • •

Definieren einer neuen Datenbasis. Festlegen der Periodisierung, der ersten und letzten Periode. Import der Spalten aus einem EXCEL-Tableau. Korrektur der Spaltenbezeichner. Umrechnung auf neue Einheiten. Abspeichern der Datenbasis name.in7.

Bild 16.1

Vorbereitung der Dateneingabe in GiveWin

Eine Tabelle für Tages- oder Stundendaten wird über die Spezifikation Other 1 mit Beobachtung 1 (anstelle des Startjahres) und Beobachtung n (anstelle des Endjahres) aufgebaut.

114

Kapitel 16

Bild 16.2

Abschließen der Dateneingabe in GiveWin

Die Umrechnungsvorschriften im Untermenü Algebra Code sind jeweils mit einem Semikolon abzuschließen. Ein Überspeichern der Variablen ist möglich.

Modellierung

Bild 16.3

Datenmanipulation mit GiveWin

Kapitel 16

115

16.2 Grafische Datenauswertung mit GiveWin Zur grafischen Datenanalyse werden im Menüpunkt Graphics eine oder mehrere Variablen geladen und dann über Next: choose graph aus einem Angebot von 8 Untermenüs mit jeweils mehreren Angeboten ein passender Grafikset zusammen gestellt und unter name.emf abgespeichert (vgl. Bild 16.4 und Bild 16.5).

Bild 16.4 Grafische Datenanalyse in GiveWin

r1

1000 750

750

500

500

1990

1995

-200 1990 r1

6.50 6.25 Density

0.004 0.003 0.002 0.001

0

1995

10

1990 r1 150

1995

2000

100 50 500

1.0

750

5

r1

2000

1000

Lr1

6.75

2000

Dr1

200

7.00

r1

1000

750

1000

500 1

ACF-r1

0.5

750

1000

PACF-r1

0

500 0

Spectral density 0.50

r1

30000

Bild 16.5

10

r1

0 1000

20000

0.25 0.0

5 Periodogram

1.0

0.0

5

10

r1 × normal

750

10000 0.5

QQ plot

500 0.5

1.0

400

600

800

Grafikoutput für eine Zeitreihe

Zu einzelnen Darstellungen werden auch noch Untermenüs über die Option Next angeboten. So kann z.B. beim Q-Q-Plot zwischen einer Chi-Quadrat-Verteilung, einer F-Verteilung, einer Normalverteilung, einer t-Verteilung und einer Gleichverteilung gewählt werden.

116

Kapitel 16

16.3 Schrittfolge der Modellbildung und Prognose mit STAMP • • • • • • • • • • •

Aktivieren des Tools STAMP in der Oberfläche von GiveWin. Formulieren des Modells im Untermenü Model von STAMP. Laden der abhängigen und unabhängigen Variablen mit Doppelklick. Auswahl der Komponenten. Wahl der Schätzmethode und abschneiden von Vergleichswerten am aktuellen Rand. Ausgabe des Standardoutputs. Ausgabe des erweiterter Output (Zustandsraummodell und Regressionsstatistik). Ausgabe von Text und Bild zu den Teststatistiken für die Residuen. Ausgabe von Text und Bild zu den Teststatistiken für die geglättete Residuen. Ausgabe von Text und Bild für die Vergleichsprognose. Ausgabe von Text und Bild für die Prognose.

Bild 16.6

Aktivieren von STAMP und Vorbereitung der Modellspezifikation

Die Texte werden unter „name.out“ und die Grafiken unter „name.emf“ abgespeichert.

Kapitel 16

117

Doppelklick auf die Variable in der Datenbasis und Einstellen der maximalen Zeitverzögerung im Modell. Bild 16.7

Auswahl der Variablen

Auswahl der Zustandsgleichungen und des Typs der Modellbildung in jeder Gleichung. Es können nur Zyklen mit einer zweistelligen Periodenanzahl betrachtet werden (Eingabefeld: Period). Bild 16.8

Auswahl der Komponenten

Abtrennen von 7 Werten am aktuellen Rand (Feld: Less Forecast) und Auswahl der Schätzroutine.

Bild 16.9

Auswahl der Schätzmethode

118

Kapitel 16

Bild 16.10

Erweiterte Ausgabe

Erweiterte Auswahl von Teststatistiken für die Residuen der Beobachtungsgleichung. Bild 16.11 Residuenanalyse Teil 1

Auswertung der geglätteten Residualstatistiken der einzelnen Zustandsgleichungen.

Bild 16.12

Residuenanalyse Teil 2

Kapitel 16

119

Einstellung des Modus der Vergleichsprognose und der Fehlerausgabe. Bild 16.13 Prognose Teil 1

Grafische und tabellarische Ausgabe von Prognosen, incl. Rückrechnung von Transformationen. Bild 16.14

17.

Prognose Teil 2

Paketvergleich von STAMP/GiveWin mit EViews 5.0

Der nachfolgende Vergleich wird den beiden Paketen insofern nicht gerecht, als dass unter der Oberfläche von GiveWin neben STAMP zahlreiche andere Programmsysteme, wie z. B. TSP, vertrieben werden, die eine erhebliche methodische Erweiterung zulassen. Diese Programme können je nach Bedarf hinzu gekauft werden. Sie standen aber für die vorliegende Untersuchung nicht zur Verfügung. Aber auch mit dieser Einschränkung vermittelt die anschließende Tabelle 17.1 einen mehr als informativen Einblick in Stärken und Schwächen beider Systeme, die sich jeweils einer großen Marktnachfrage erfreuen.

120

Kapitel 17

Tabelle 17.1

Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6

Merkmal

EViews 5.0

GiveWin/STAMP 6

Schnittstellen

Excel, Lotus, DB, DRI

Excel, Lotus, ASCII, Gauss, Stata

Periodisierung

Jahres- bis Tagesdaten

Jahres- bis Tagesdaten

Histogramm

7 Zeitreihendarstellungen

Maßzahlen

7 grafische Transformationen (ln, Diff. etc.)

Datenimport

Datenvorbehandlung

Box-Plot Verteilungsplot Sampelfunktion 4 Saisonbereinigungsverfahren

5 Kennfunktionen (acf, pacf, ccf, sdf, pg) 6 Verteilungsplots

Exponentielle Glättung

3 Q-Q-Plots für 5 verschiedene Verteilungen

Filtertechniken

Box-Plot 6 Scatterplots 5 3D-Plots Box-Cox-Transformation Hodrick-Prescott Filter

Lücken

Simulation

Tabellenanzeigen

Modellidentifikation

3 Einstichprobentests

Grafische Datenanalyse mittels Kennfunktionen

3 Zweistichprobentests 6 Unit-Root-Tests acf, pacf, ccf Differenzen Verteilungstests, incl. QQ-Plot 2 Cointegrationstests

Lücken

Periodogramm fehlt

Testverfahren und Tabellen fehlen

Kapitel 17

Tabelle 17.1

121

Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6 (Fortsetzung)

Merkmal

EViews 5.0

GiveWin/STAMP 6

ARMA-Modelle

Strukturgleichungsmodelle

Methodenangebot univariat GARCH-Modelle und Derivate Ausschlussmöglichkeit von Zwischenwerten

Incl. Niveau, Trend, Saison, drei Zyklen, Autoregression erster Ordnung und Interventionen AR-Modelle GARCH(1, 1)- Modell1

Lücken

Fraktional integrierte Modelle fehlen

Zyklen mit dreistelliger Periodenanzahl Allg. GARCH-Modelle

Methodenangebot multivariat

Mehrgleichungsmodelle Mehrgleichungsmodelle mit definierbarer Struktur mit vorgegebener Struktur und Lags in der endogenen Vektorautoregression Variablen

Modellschätzung für kardinale Daten

OLS, MLS, TSLS, GMM, GARCH

Modellschätzung für diskrete Daten

BINARY, ORDERED, CENSORED, COUNT

Lücke Automatische Modellgenerierung

1

OLS, MLS, MLSC2, MLS mit vorgegebenen Parameterbereichen

Modelle für diskrete Daten nein

nein

Das Verfahren ist nur über mehrere Transformationen realisierbar und beruht auf einer heuristischen Annahmen für zwei Parameter. Es wird vorbereitet durch eine logarithmische Transformation der Quadrate der Beobachtungen im Menü Transformationen ((Stochastic volatility). 2 Maximum Likelihood Schätzung mit Maximierungskontrolle. Geschätzte Parameter können verändert und die Schätzung neu gestartet werden

122

Kapitel 17

Tabelle 17.1

Stärken-Schwächen-Vergleich EViews 5.0 versus versus GiveWin/STAMP 6 (Fortsetzung)

Merkmal

EViews 5.0

Modellüberprüfung

4 Testverfahren für Parameter, z.B. KonfidenzEllipse, LikelihoodRatio-Test

GiveWin/STAMP 6

6 Testverfahren für Residuen, z.B. ARCH-LMTest, Verteilungstest, serielle Korrelation

5 Testverfahren für Residuen, z.B. Verteilungstest, Heteroskedastie, serielle Korrelation, kumulatives Periodogramm

Histogramm, acf, pacf, acf der Quadrate,

QQ-Plot, Histogramm, acf und Spektrum der Residuen und der geglätteten Residuen

4 Stabilitätstests, z. B. Chow Breakpoint Test Lücken

Kumuliertes Periodogramm fehlt

Parametertests fehlen

Vergleichsprognose

Einschritt- und Mehrschritt-Modus

Einschritt- und Mehrschritt-Modus

Diverse Fehlermaße

2 Stabilitätstests

Lücken

RMSE% fehlt

Keine globalen Fehlermaße

Qualität der Grafiken

6 Grafiktypen

1 Grafiktyp

Nachberarbeitung

Grafikeditor

Grafikeditor

Exportfilter

3 Ausgabeformate

4 Ausgabeformate

Qualität der Tabellen

gut

Nachberarbeitung nötig

Übersichtlichkeit der Menüs

gut bis sehr gut

gut bis sehr gut

Trennung von Modellen und Daten

definierbar

vorgegeben

Programmierung

Kommandosprache

Kommandosprache

Preis

895 Dollar Version 4.0

850 Dollar Version 6.0

245 Dollar Upgrade auf 5.0

275 Euro Upgrade von Version 5.0

Lücke

Studenten-Version

Literaturverzeichnis

123

Verwendete Literatur- und Datenquellen (Stand 6/06) Bienwald, B.; Steinhurst, W.; White, D.; Roschelle, A.: A Comparison of Wholesale Power Costs in the PJM Market to Indexed Generation Service Costs, Synapse Energy Economics, Cambridge, 3.6.2004 Boero G.; Marrocu, E.: The performance of SETAR models: a regime conditional evaluation of point, interval and density forecasts, Int. Journal of Forecasting, 20(2004), 305-320 Brockwell, P. J.; Davis, R. A.: Introduction to Time Series and Forecasting, Springer Verlag 2002 California ISO, 2004 Summer Assessment California ISO, Market Analysis Report for July and August 2004 California ISO, Market Analysis Report for September 2004 Carnero, A.; Koopman, S. J.; Ooms, M.: Periodic heteroskedastic RegARFIMA models for daily electricity prices, Technical Report 03-071/4, Tinbergen Institute, Amsterdam, 2003 Caporale, G. M., Ntantamis, Ch.; Pantelidis, Th.; Pittis, N.: The BDS Test as a Test for the Adequacy of a GARCH(1,1) Specification: A Monte Carlo Study, Journal of Financial Econometrics 32(2005), S. 282-309 Clements, M. P.; Franses, H. P.; Swanson, N. R.: Forecasting economic and financial timeseries with non-linear models, Int. Journal of Forecasting, 20(2004), 169-183 Conejo, A. C.; Plazas, M. A.; Espinola, R.; Molina, A. B.: Day-Ahead Electricity Price Forecasting Using the Wavelet Transform and ARIMA Models, IEEE Trans. On Power Systems, 20(2005)2, S. 1034- 1042 Contreras, J.; Espinola, R.; Nogales, F. J.; Conejo, A. J.: ARIMA Models to predict NextDay Electricity Prices, IEEE Trans. On Power Systems, 18(2002)3, 1014-1020 DeLurgio, A. St.: Forecasting Principles and Applications, Mc Graw-Hill 1998 Doornik, J. A.; Hendry, D. H.: GiveWin- an interface to empirical modelling, TCL 2001 Dube, St.: Visualisierung und Analyse des liberalisierten Elektrizitätsmarktes der USA, Diplomarbeit, FH Stralsund, 2006 Edel, K.; Schäffer, K.-A.; Stier, W.: Analyse saisonaler Zeitreihen, Physica-Verlag, 1997 Energy Information Administration (EIA): Annual Energy Outlook 2004 Energy Information Administration (EIA): National Energy Modeling System, 4.3.2003 Espinoza, M.; Joye, C.; Belmans, R.: Short –Term Load Forecasting, Profile Identification, and Customer Segmentation: A Methodology Based on Periodic Time Series, IEEE Trans. On Power Systems, 20(2005)3, S. 1622-1631 EViews 5 User’s Guide, 9.3.2004 Fernandez, R.: NYISO Monthly Report, New York, August 2004 Figueiredo, V.; Rodrigues, F.; Vale, Z.: An Electric Energy Consumer Characterization Framework Based on Data Mining Techniques, IEEE Trans. On Power Systems 20(2005)2, S. 596-602 Garcia, R. C.; Contreras, J.; van Akkeren, M.; Garcia, J. B. C.: A Garch Forecasting Model to Predict Day-Ahead Electricity Prices; Paper, Workshop of Applied Infrastructure, TU Berlin, 11.10. 2003 (wip.tu-berlin.de/workshop/2003/papers, accepted by IEEE Trans. Power Systems 2005) Garcia, R.; Contreras, J.; van Akkeren, M.; Garcia, J. B. C.: A GARCH Forecasting Model to Predict Day-Ahead Electricity Prices, IEEE Trans. On Power Systems, 20(2005)2, S. 867874 Götze, W.: Vorhersageorientierte Modellwahl zur Vorausberechnung von Zeitreihen aus Lebensmittelkombinaten, Messen Steuern Regeln 34(1991)4, S.267-271 Götze, W.: Specification and Forecasting Basic Structural Time Series Models, Wissenschaftliche Zeitschrift der Humboldt-Universität, Geistes- und Sozialwissenschaften, 2/1992, S.3144 Götze, W.: Techniken des Business Forecasting, Oldenbourg Verlag 2000

124

Literaturverzeichnis

Götze, W.; Deutschmann, C.; Link, H.: Statistik, Oldenbourg Verlag 2002 Götze, W.: Modellierung des Personaleinsatzes auf dem Flughafen Helsinki-Vantaa mit Hilfe von ARMA-Prozessen, wiss. Schriftenreihe der FH Stralsund, Heft 3, 2004, S. 45-54 Granger, C., W., J.: Forecasting Business and Economics, 2. Edition, Academic Press, 1989 Green, W. H.: Econometric Analysis, Prentice Hall International Inc., 2000 Guirguis, H. S.; Felder, F. A.: Further Advances in Forecasting Day-Ahead Electricity Prices Using Time Series Models, KIEE Int. Trans. On PE, 4-A(2004)3, 159-166 Gunnarshaug, J.; Ellerman, D.: Natural Gas Pricing in the Northeastern U.S., CEEPR MIT, 1998, web.mit.edu/ceepr/www/98012.pdf Harvey, A. C.: Forecasting structural time series models and the Kalman filter, Cambridge University Press 1990 Harvey, A. C.; Koopman, S. J.: Forecasting hourly electricity demand using time-varying splines, Journal of the American Statistical Association 88 (1993), S. 1228-1237. Hinz, J.: Modeling day-ahead electricity prices, Paper, TU Dresden 11.5.2003 Hor, C.: Analyzing the Impact of Weather Variables on Monthly Electricity Demand, IEEE Trans. On Power Systems 20(2005)4, S. 2078-2085 IEA: Key World Energy Statistics 2004 IEA: Energy Statistics Manual 2004 Koopman, S. J.; Harvey, A. C.; Doornik, J. A.; Shephard, N.: Stamp – Structural time series analyser, modeller and predictor, TCL 2000 Koopman, S. J.; Ooms, M.: Time Series Modelling of daily tax revenues, Statistica Neerlandica 57(2003), 439-469. Koopman, S. J.; Ooms, M.: Forecasting daily time series using periodic unobserved components time series models, paper 2. OxMetrics User Conference, Cass Business Scholl, London, 26.-27.8.2004 Küsters, U.: Evaluation, Kombination und Auswahl betriebswirtschaftlicher Prognoseverfahren, Paper 46. Sitzung der AG Prognoseverfahren der GOR, 1.-2-.4 2004, Eltville Makridakis, S.; Hibon, M.: The M3-Competition: results, conclusions and implications, Int. Journal of Forecasting 16(2000), 451-476 MateoGonzales, A.; MunozsanRoque, A.; Garcia-Gonzales, J.: Modeling and Forecasting Electricity Prices with Input/Output Hidden Markov Models, IEEE Trans. On Power Systems, 20(2005)1, 13-24 Nogales, F. J.; Contreras, J.; Conejo, A. J.; Espinola, R.: Forecasting Next-Day Electricity Prices by Time Series Models, IEEE Trans. On Power Systems, 17(2002)2, 342-348 New York Independent System Operator (NYISO), Annual Report 2002 New York Independent System Operator (NYISO), Annual Report 2003 Operator del Mercado Iberico de Energia-Polo Espanol (OMEL), Annual Report 2003 Rodriguez, C. P.; Anders, G. J.: Energy price forecasting in the Ontario competitive power system market, IEEE Trans. On Power Systems, 19(2004)1, 366-374 Proietti, T.: Seasonal Specific Structural Time Series, Studies in Nonlinear Dynamics and Econometrics 8(2), Article 16, 2004, http://www.bepress.com/snde/vol8/iss2/art16. Reynolds, J. M.: PJM Load Forecast Report – Supplemental Tables, 28.4.2004 Ryan, D. W.: A Comparison of Natural Gas Spot Price Linear Regression Forecasting Models, Thesis, 6.5.2001, Polytechnic Institute of the Virginia State University, http://scholar.lib.vt.edu/theses Schlittgen, R.; Streitberg, B. H. J.: Zeitreihenanalyse, Oldenbourg Verlag, 6. Auflage 1995 Serletis, A.; Shahmoradi, A.: Business Cycles and Natural Gas Prices, Discussion paper 200419, University of Calgary Canada, http://www.econ.ucalgary.ca/research Soares, L. J.; Medeiros, M. C.: Modeling and forecasting short-term electric load demand: a two step methodology, Discussion Paper Nr. 495 2005 (www.econ.puc-rio.br)

Literaturverzeichnis

125

Soares, L. J.; Souza, L. R.: Forecasting electricity demand using generalized long memory, Int. Journal of Forecasting, 22(2006)1, S. 17-28 Suenaga, H.; Williams, J.: The Natural Number of Forward Markets for Electricity, Paper, University of California, 19.5.2004 (http://www.ucei.berkeley.edu/ucei/conf 2004) Taylor, J. W.: Volatility forecasting with smooth transition exponential smoothing, Int. Journal of Forecasting 20(2004), 273-286 Taylor, J. W.; de Menezes, L. M.; McSharry, P. E.: A comparison of univariate methods for forecasting electricity demand up to a day ahead, Study 2005 Taylor, J. W.; de Menezes, L. M.; McSharry, P. E.: A comparison of univariate methods for forecasting electricity demand up to a day ahead, Int. Journal of Forecasting, 22(2006)1, S. 116 Yaffe, R.: Structural Time Series Modeling with SAS Proc UCM and STAMP, New York University, Spring 2003 Edition, http:// www.nyu.edu/its/pubs/connect/spring03. Daten-Quellen Energiedaten Spanien (http://www.omel.es) Energiedaten der USA (www.eia.doe.gov) Energiedaten des US-Staates New York (www.nyiso.com) Energiedaten des US-Staates Kalifornien (www.caiso.com) Finanzmarktdaten (www.markt-daten.de) Energiedaten der OECD (www.iea.org) Historische Daten (www.turtletrader.com) Jahresdaten zum Energieverbrauch (www.economagic.com/em-cgi/data.exe) Sonstige Quellen American Petroleum Institute (http://api-ep.api.org/economics) DRI/McGraw-Hill Data Files (http://www.lib.uconn.edu/online/databases) Energy Dictionary (http://www.energyvortex.com/energydictionary) Data and Reports of ISO New England, 17.1.2005 (http://www.iso-ne.com) Morgan Energy Market Information (www.morganenergy.com) PJM Manual 11: Scheduling Operations, 19.10.04 (http://www.pjm.com) PJM Territory Served, 27.12.04 (http://www.pjm.com/about/territory-served.html) PJM Energiedaten(pjm.com/markets/jsp/lmp.jsp) Strombörse (http://bgs-aution.com) University of California Energy Institute (http://www.ucei.berkeley.edu/datamine/datamine.htm) University of Washington (http://www.faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf) US Department of Energy, Office of Fossil Energy (http://www.fe.doe.gov) US Energy Information Administration (http://www.eia.doe.gov/eneaf/electricity/epa/epa_sprdshts.html) XploRe e-books HU-Wiwifak (http://www.quantlet.de/scripts/sfm/html) Energiedaten Ontario (www.ieso.ca) Energiedaten EU (www.eex.de) Abkürzungen ACF AECO

Autocorrelation Function Atlantic Electric Company

126

Literaturverzeichnis

AEP AIC API APS ARIMA ARFIMA BDS BGE CAISO COMED DACD DAY DOM DPL DUQ EIA ERCT FERC ERCOD GARCH GIS ICAO IEA JCPL KwH LM LMP MAPE MAX METED MLC MwH MW-ISO NE-ISO NYISO OMEL PACF PECO PENELEC PEPCO PJM PPL PSEG PURPA RECO RCP RMSE RTO SBC UTM WGS

American Electric Power Company Inc. Akaike Information Criterium American Petroleum Institute Allegheny Power Systems Autoregressive Integrated Moving Average Autoregressive Fractional Integrated Moving Average Test auf Fehlspezifikation eines GARCH-Modells Baltimore Gas & Electric Company California Independent System Operator Commonwealth Edison Company Day Ahead Cleared Demand Dayton Power & Light Company Dominion Delmarva Power & Light Company Duquesne Light Energy Information Administration USA Electric Reliability Council of Texas Federal Energy Regulatory Commission Electric Reliability Council of Texas Generalized Autoregressive Conditional Heteroscedasticity Geographisches Informationssystem International Civil Aviation Organisation International Energy Agency OECD und EUROSTAT Jersey Central Power & Light Company Kilowatt per Hour Test auf nichtlineare Strukturen im AR-Modell Locational Marginal Price Mean Absolute Percent Error Maximum Error Metropolitan Edison Company Marginal Loss Component Megawatt per Hour Midwest Independent System Operator New England Independent System Operator New York Independent System Operator Operator del Mercado Iberico de Energia-Polo Espanol Partial Autocorrelation Function Philadelphia Electric Company Pennsylvania Electric Company Potomac Electric Power Company Pennsylvania-New Jersey-Maryland Pennsylvania Power & Light Electric Ulitities Public Service Electric & Gas Company Public Utility Regulatory Policies Act Rockland Electric Company Regulation Clearing Price Root Mean Square Error Regional Transmission Organization Schwartz-Bayes Criterium Universal Transverse Mercator World Geodetic System

Bilder- und Tabellenverzeichnis

Bilder Bild 3.1 Bild 3.2 Bild 3.3 Bild 5.1 Bild 5.2 Bild 5.3 Bild 5.4 Bild 5.5 Bild 5.6 Bild 5.7 Bild 6.1 Bild 6.2 Bild 6.3 Bild 6.4 Bild 6.5 Bild 6.6 Bild 6.7 Bild 6.8 Bild 6.9 Bild 6.10 Bild 6.11 Bild 6.12 Bild 8.1 Bild 8.2 Bild 8.3 Bild 8.4 Bild 8.5 Bild 8.6 Bild 8.7 Bild 8.8 Bild 8.9 Bild 8.10 Bild 8.11 Bild 8.12

Modellspezifikation für multipliktive ARIMA-Modelle ................................. 8 Spezifikation eines autoregressiven (integrierten) Modells mit stochastischen Regressoren .............................................................................. 9 Erweiterung eines autoregressiven (integrierten) Modells durch ein GARCH-Modell ............................................................................... 10 Zeitreihe ESP (Preis Cent pro kWh für Spanien) ............................................. 17 Frequenzzerlegung der Varianz mit Peaks bei 0,00594 = 1/168 und 0,04167 = 1/24 .................................................................................................. 18 Frequenzzerlegung der Varianz (geglättet) ...................................................... 18 Parameter und Verteilung der GARCH-Residuen ........................................... 25 Einschrittprognose mit dem GARCH-Modell für eine Woche ........................ 26 Einschrittprognose mit dem autoregressiven Modell für eine Woche ............. 28 Vergleich der Einschrittprognose (GARCH) mit den Ist-Werten .................... 28 EE-Nachfrage in New England vom 1.11.2004 bis zum 10.1.2005 ................ 30 Prognose der EE-Nachfrage in New England vom 11.1. bis 17.1.2005 .......... 31 Entwicklung des Goldpreises vom 2.1.97 bis zum 31.8.04 ............................. 35 Prognose des Goldpreises vom 1.9.04 bis zum 20.10.04 ................................. 36 Häufigkeit des Eintretens in Haus 21 (FB Wirtschaft) vom 1.9.01 bis zum 31.12.01 .............................................................................................. 39 Intervall- und Varianzprognose für das Eintretens in Haus 21 (FB Wirtschaft) vom bis zum 25.12. bis 31.12.01 ........................................... 40 Elektroenergieumsatz in Kalifornien (anderweitige Sektoren in TDollar) 1/90-12/02 ........................................................................................................ 44 Intervallprognose und Varianzprognose für den Elektroenergieumsatz in Kalifornien (anderweitige Sektoren in TDollar) vom 1.1.2003 bis zum 30.7.2003 ............................................................................................ 45 Erdgaspreis für US-Haushalte im Zeitraum 1/82 – 12/02 ............................... 50 Intervall- und Varianzprognose zum Beispiel Erdgaspreise für US-Haushalte von Januar bis Juli 2004 ............................................................ 51 Wöchentlicher Margarineabsatz über drei Jahre .............................................. 55 Intervall- und Varianzprognose zum Beispiel Margarineabsatz für 3 Wochen .................................................................................................... 56 Einrichten eines Workfiles für den Datenimport ............................................. 60 Einstellung der Periodisierung für nicht vordefinierte Intervalle ..................... 61 Datenimport aus einer Excel-Datei .................................................................. 61 Deskriptive Auswertung der Zeitreihendaten ................................................... 62 Einstellung eines Einheitswurzeltests nach Phillips Perron ............................. 62 Objektspezifikation .......................................................................................... 63 Anlegen einer Modellgleichung ...................................................................... 63 Ausfüllen der Modellgleichung und Vorbereitung der Schätzung ................... 63 Aufbau eines ARIMA-Modells (1,1,1)(0,1,0)12 mit Absolutglied und logarithmischer Transformation der Daten ...................................................... 64 Abtesten der Modellresiduen............................................................................ 65 Einstellen des Prognosealgorithmus ................................................................. 65 Rückrechnung der Transformationen bei der Prognose eines ARIMA-Modells .............................................................................................. 66

127

128

Bilder- und Tabellenverzeichnis

Bild 9.1 Bild 9.2 Bild 9.3 Bild 9.4 Bild 9.5 Bild 9.6 Bild 9.7 Bild 9.8 Bild 9.9 Bild 9.10 Bild 9.11 Bild 9.12 Bild 9.13 Bild 9.14 Bild 9.15

Zeitreihendiagramm Kalifornien ...................................................................... Periodogramm Kalifornien ............................................................................... Histogramm Kalifornien................................................................................... QQ-Plot Kalifornien ......................................................................................... Parametereinstellung für ein ARMA-Modell ................................................... Output eines AR(1)-Modells ............................................................................ Korrelogramme der Daten (grün) und des AR-Modells (rot) .......................... Parametereinstellung für ein GARCH-Modell ................................................. Output eines geschätzten GARCH(1, 1)-Modells ............................................ Residuenplot eines GARCH(1, 1)-Modells...................................................... Autokorrelationen von εt und ε2t aus dem AR(1)-Prozess ............................. QQ-Plot von Residuen eines GARCH(1, 1)-Modells ...................................... Residuentests für ein GARCH(1, 1)-Modell .................................................... Volatilitätsplot eines GARCH(1, 1)-Modells ................................................... Exportfenster für ein Zeitreihenmodell ............................................................

70 71 71 72 72 73 73 74 74 75 75 76 76 77 77

Bild 11.1

Modellspezifikation für stochastische Komponentenmodelle ......................... 84

Bild 13.1 Bild 13.2 Bild 13.3 Bild 13.4 Bild 13.5 Bild 13.6

Monatlicher Umsatz von Elektroenergie im Sektor Haushalte (Reihe R1) ..... Diagramme zur Residuenanalyse ..................................................................... Diagramme der Komponenten ......................................................................... Diagramme der geglätteten Residuen für Niveau und Trend ........................... Diagramme zur Vergleichsprognose mit Komponenten .................................. Punkt- und Intervallprognose am aktuellen Rand ............................................

Bild 16.1 Bild 16.2 Bild 16.3 Bild 16.4 Bild 16.5 Bild 16.6 Bild 16.7 Bild 16.8 Bild 16.9 Bild 16.10 Bild 16.11 Bild 16.12 Bild 16.13 Bild 16.14

Vorbereitung der Dateneingabe in GiveWin .................................................... 110 Abschließen der Dateneingabe in GiveWin ..................................................... 111 Datenmanipulation mit GiveWin ..................................................................... 111 Grafische Datenanalyse in GiveWin ................................................................ 112 Grafikoutput für eine Zeitreihe......................................................................... 112 Aktivieren von STAMP und Vorbereitung der Modellspezifikation ............... 113 Auswahl der Variablen ..................................................................................... 114 Auswahl der Komponenten .............................................................................. 114 Auswahl der Schätzmethode ............................................................................ 114 Erweiterte Ausgabe ......................................................................................... 115 Residuenanalyse Teil 1 ..................................................................................... 115 Residuenanlyse Teil 2 ...................................................................................... 115 Prognose Teil 1 ................................................................................................. 116 Prognose Teil 2 ................................................................................................. 116

Bild A1 Bild A2 Bild A3 Bild A4 Bild A5 Bild A7

Programmentwurf in der EViews-Umgebung .................................................. 137 Quellcode und Run-Option .............................................................................. 137 Vorbereitung des Programmstarts .................................................................... 138 Ablage von Outputdateien in einem Workfile von EViews ............................. 138 Vergleichsprognose und Ist-Werte mit dynamischen Konfidenzintervallen ... 139 Ausgabe positiver und negativer Prognosefehler ............................................. 139

86 92 92 93 94 95

Bilder- und Tabellenverzeichnis

Tabellen Tabelle 1.1

Beispiele für Zeitreihen mit zeitvariabler Varianz ...................................... 2

Tabelle 4.1 Tabelle 4.2 Tabelle 4.3 Tabelle 4.4 Tabelle 4.5 Tabelle 4.6 Tabelle 4.7

Durchschnittpreise für Elektroenergie pro Stunde in den USA und Spanien ................................................................................................. 12 Ausgewählte Finanzmarkt- und sonstige Daten .......................................... 13 Labornutzung im Fachbereich Wirtschaft der FH Stralsund ....................... 13 Monatliches Energiegeschäft im US-Bundesstaat Kalifornien ................... 14 Rohölpreise in den USA .............................................................................. 15 Erdgaspreise in den USA ............................................................................. 15 Preise für Elektroenergie in den USA ......................................................... 16

Tabelle 5.1 Tabelle 5.2 Tabelle 5.3 Tabelle 5.4 Tabelle 5.5 Tabelle 5.6 Tabelle 5.7 Tabelle 5.8

Einheitswurzeltest nach Dickey-Fuller ........................................................ 19 Einheitswurzeltest nach Phillips-Perron ...................................................... 19 Schätzung des autoregressiven Modells ...................................................... 20 Korrelogramme der quadrierten Residuen des autoregressiven Modells .... 21 Schätzung des GARCH-Modells ................................................................. 22 Korrelogramm der GARCH-Residuen ........................................................ 24 LM-Test ....................................................................................................... 25 Vergleich von Einschritt-Prognosefehlern .................................................. 27

Tabelle 6.1 Tabelle 6.2 Tabelle 6.3

Vergleich von Streumaßen für Stundenreihen ............................................. 30 Modellschätzung für die EE-Nachfrage in New England ........................... 31 Analyse- und Prognoseergebnisse für stündliche Energiepreise in den USA und Spanien.................................................................................. 32 Modellschätzung zur Reihe Goldpreis in Dollar ......................................... 36 Analyse- und Prognoseergebnisse für tägliche Finanzmarktdaten .............. 37 Modellschätzung zum Eintrittsverhalten in Haus 21 ................................... 39 Analyse- und Prognoseergebnisse für die stündliche Labornutzung im Haus 21 ........................................................................................................ 41 Analyse- und Prognoseergebnisse für die tägliche Labornutzung im Haus 21 ........................................................................................................ 42 Parameteranzahl p im Zweigleichungsmodell (ZGM) und im Eingleichungsmodell (EGM) ....................................................................... 43 Ergebnisse der Modellschätzung zum Elektroenergieumsatz in Kalifornien ................................................................................................... 45 Analyse- und Prognoseergebnisse für den monatlichen Elektroenergieumsatz und -absatz in Kalifornien ............................................................... 46 Ergebnisse der Modellschätzung zum Beispiel Erdgaspreis US-Haushalte ............................................................................................... 51 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Rohölpreisen in den USA ................................................................................... 52 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Erdgaspreisen in den USA ........................................................................... 53 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Elektroenergiepreisen in den USA ......................................... 54 Ergebnisse der Modellschätzung zum Beispiel Margarineabsatz ............... 56

Tabelle 6.4 Tabelle 6.5 Tabelle 6.6 Tabelle 6.7 Tabelle 6.8 Tabelle 6.9 Tabelle 6.10 Tabelle 6.11 Tabelle 6.12 Tabelle 6.13 Tabelle 6.14 Tabelle 6.15 Tabelle 6.16 Tabelle 7.1

Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Spanien ........................................................................................................ 57

129

130

Bilder- und Tabellenverzeichnis

Tabelle 7.2 Tabelle 7.3 Tabelle 7.4 Tabelle 9.1

Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien ............................................................................................. 57 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für New York ............................................................................................... 58 Prognoseergebnisse für stündliche Nachfrage und Preise an Elektroenergie pro Tag in den Bundesstaaten von New England ............... 59 Stärken-Schwächen-Vergleich .................................................................... 67

Tabelle 12.1 Auswahl von Zeitreihen zur Anwendung von Strukturgleichungsmodellen ...................................................................................................... 85 Tabelle 13.1 Tabelle 13.2 Tabelle 13.3 Tabelle 13.4 Tabelle 13.5 Tabelle 13.6 Tabelle 13.7 Tabelle 13.8 Tabelle 13.9 Tabelle 13.10 Tabelle 13.11

Estimation report ......................................................................................... Diagnostic summary report ......................................................................... Estimated variances of disturbances ............................................................ Estimated standard deviations of disturbances ............................................ Estimated coefficients of final state vector.................................................. Saisonausschläge ......................................................................................... Normality test for Residuals ........................................................................ Goodness-of-fit results and serial correlation statistics for residuals .......... Korrelogramm der Residuen ....................................................................... Normality tests for smoothed residuals ....................................................... 7 post-sample predictions ............................................................................

86 87 88 88 88 89 89 90 91 93 95

Tabelle 14.1 Gruppeneinteilung der untersuchten Zeitreihen .......................................... 96 Tabelle 14.2 Analyse- und Prognoseergebnisse für den monatlichen Elektroenergieumsatz und -absatz in Kalifornien .................................................. 97 Tabelle 14.3 Fallunterscheidung bei den monatlichen Erdgaspreisen ............................. 101 Tabelle 14.4 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Rohölpreisen in den USA ............................................................................ 102 Tabelle 14.5 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Erdgaspreisen in den USA ........................................................................... 103 Tabelle 14.6 Analyse- und Prognoseergebnisse von monatsdurchschnittlichen Elektroenergiepreisen in den USA ......................................... 104 Tabelle 14.7 Analyse von Wochen- und Stundendaten ................................................... 106 Tabelle 14.8 Analyse- und Prognoseergebnisse für die tägliche Labornutzung im Haus 21 ................................................................................................... 107 Tabelle 15.1 Fehlervergleich zwischen STAMP und EViews Prognosen ....................... 108 Tabelle 15.2 Prognoseergebnisse für stündliche Elektroenergiepreise pro Tag für Kalifornien ................................................................................................... 109 Tabelle 17.1 Stärken-Schwächen-Vergleich EViews 5.0 versus GiveWin/STAMP 6 ..................................................................................... 117 Tabelle A1

Programmübersicht………………………………………………………...136

Deutsch-Englische Begriffsabgrenzung

Deutsch-Englische Begriffsabgrenzung Abgrenzung deutschsprachig

Abgrenzung englischsprachig/

Preis der ISO in Cent pro KWh

Price in ISO for NP15

Preis für Absenken der Last für den Folgetag Ancillary Services: Price of Regulation in Cent pro KWh Down Day Ahead in NP15 Preis für Hochfahren der Last für den Ancillary Services: Price of Regulation Up Folgetag in Cent pro KWh Day Ahead in NP15 Preis für Absenken der Last für die Ancillary Services: Price of Regulation Folgestunde in Cent pro KWh Down Hour Ahead in NP15 Preis für Hochfahren der Last für die Ancillary Services: Price of Regulation Up Folgestunde in Cent pro KWh Hour Ahead in NP15 Ersatzmenge für die Folgestunde in KWh

Ancillary Services: Quantity of Replacement Hour Ahead

Preis für Elektroenergie in $/MWh aus der East 10 Min Spinning Reserve ($/MWH) ständig im 10-Minuten-Takt verfügbaren Kapazitätsreserve Preis für Elektroenergie in $/MWh aus der East 10 Min Non-Synchronous Reserve fallweise im 10-Minuten-Takt verfügbaren Kapazitätsreserve Preis für Elektroenergie in $/MWh aus der East 30 Min Operating Reserve ($/MWH) operativen Reserve für 30 Minuten Preis für Elektroenergie in $/MWh für New East Regulation ($/MWH) York East 1 Handelspreis in Cent pro KWh

1

Precios (cent/kWh) a efectos del articulo

Es gibt zwei Regulierungsgebiete für den Staat New York: EAST und WEST. Die Preise weisen aber im Untersuchungszeitraum keinen Unterschied aus.

131

132

Deutsch-Englische Begriffsabgrenzung

Deutsch-Englische Begriffsabgrenzung (Fortsetzung) Abgrenzung deutschsprachig

Abgrenzung englischsprachig

Umsatz Elektroenergie in TDollar: Sektor Haushalte

Residential Revenue (Thousand $)

Umsatz Elektroenergie in TDollar: Sektor Handel

Commercial Revenue (Thousand $)

Umsatz Elektroenergie in TDollar: Sektor Industrie

Industrial Revenue (Thousand $)

Umsatz Elektroenergie in TDollar: Sektor Sonstige Bereiche

Other Revenue (Thousand $)

Umsatz Elektroenergie in TDollar: Gesamt

Revenue All Sectors (Thousand $)

Absatz Elektroenergie in MWh: Sektor Haushalte

Residential Sales (MwH)

Absatz Elektroenergie in MWh: Sektor Handel

Commercial Sales (MwH)

Absatz Elektroenergie in MWh: Sektor Industrie

Industrial Sales (MwH)

Absatz Elektroenergie in MWh: Sektor Sonstige Bereiche

Other Sales (MwH)

Absatz Elektroenergie in MWh: Gesamt

Sales All Sector (MwH)

Erlöse in Dollar/KWh: Sektor Haushalte

Avg Revenue Per KWH -Residential (¢/KwH)

Erlöse in Dollar/KWh: Sektor Handel

Avg Revenue Per KWH -Commercial (¢/KwH)

Erlöse in Dollar/KWh: Sektor Industrie

Avg Revenue Per KWH -Industrial (¢/KwH)

Erlöse in Dollar/KWh: Sektor Sonstige Bereiche

Avg Revenue Per KWH -Other (¢/KwH)

Erlöse in Dollar/KWh: Gesamt

Avg Revenue Per KWH -All Sectors (¢/KwH)

Deutsch-Englische Begriffsabgrenzung

133

Deutsch-Englische Begriffsabgrenzung (Fortsetzung) Abgrenzung deutschsprachig

Abgrenzung englischsprachig

Erster Einkaufspreis für inländisches Rohöl: Crude Oil Domestic First Purchase Price: Cent per Barrel Cent per Barrel Einkaufspreis für importiertes Rohöl (incl. FOB Cost of Crude Oil Imports: Cent per Transportkosten): Cent per Barrel Barrel Einkaufspreis für Importiertes Rohöl (incl. Landed Cost of Crude Oil Imports: Cent per Sämtliche Bezugskosten2): Cent per Barrel Barrel Aufkaufpreis von Raffinerien inländisches Rohöl: Cent per Barrel

für Refiner Acquisition Cost of Crude Oil, Domestic: Cent per Barrel

Aufkaufpreis von Raffinerien importiertes Rohöl: Cent per Barrel

für Refiner Acquisition Cost of Crude Oil, Imported: Cent per Barrel

Aufkaufpreis von Raffinerien für Rohöl Refiner Acquisition Cost of Crude Oil, insgesamt: Cent per Barrel Composite: Cent per Barrel Erdgaspreis ab Förderstelle: Cent per 1000 Natural Gas Price, Wellhead Composite: cubic feet Cent per 1000 cubic feet Erdgaspreis ab Zuleitung: Cent per 1000 Natural Gas Price City Gate: Cent per 1000 cubic feet cubic feet Erdgaspreis für Abnehmer aus dem Sektor Natural Gas Price, Delivered to Consumers, Haushalte: Cent per 1000 cubic feet Residential: Cent per 1000 cubic feet Erdgaspreis für Abnehmer aus dem Sektor Natural Gas Price, Delivered to Consumers, Handel: Cent per 1000 cubic feet Commercial: Cent per 1000 cubic feet Erdgaspreis für Abnehmer aus dem Sektor Natural Gas Price, Delivered to Consumers, Industrie: Cent per 1000 cubic feet Industrial: Cent per 1000 cubic feet Erdgaspreis für Abnehmer aus dem Sektor Natural Gas Price, Delivered to Electric Energieerzeugung: Cent per 1000 cubic feet Power Sector: Cent per 1000 cubic feet Durchschnittpreis für Elektroenergie in 100 Average Retail Price of Cent per KWh: Sektor Haushalte Residential: 100 Cent per kWh

Electricity,

Durchschnittpreis für Elektroenergie in 100 Average Retail Price of Electricity, Cent per KWh: Sektor Handel Commercial: 100 Cent per kWh Durchschnittpreis für Elektroenergie in 100 Average Retail Price of Cent per KWh: Sektor Industrie Industrial: 100 Cent per kWh

Electricity,

Durchschnittpreis für Elektroenergie in 100 Average Retail Price of Electricity, Total: Cent per KWh: Gesamt 100 Cent per kWh

2

Produktpreis, Transportkosten, Zoll, Steuern, Abgaben

134

Anlagen 1 - 4

Anlage 1 Übungsaufgaben für das PC-Labor 1) Übungskomplex AR-Modelle mit GARCH-Residuen (Tool EViews) a) Platintrader von Jan 99 bis Jun 04 (1376 Tageswerte der Frankfurter Börse) -

Optionsanteil auf Aktien (OS/Aktien) ab 4.1.99 Aktienkursgewinne (Rendite) ab 5.1.99 Ziel: GARCH-Modellierung und Vergleichsprognose für die letzten 20 Werte

b) Elektroenergiehandel in New England Staaten von Nov 04 bis Jan 05 (1872 Stundenwerte der ISO NE) -

EE Verbrauch in MWh EE Durchschnittspreis in Dollar pro MWh Ziel: GARCH-Modellierung mit Spitzen Dummies und Vergleichsprognose für die letzten 168 Werte

2) Übungskomplex UCM (Tools STAMP und SPSS) Ziele: Modellierung mit Hilfe von STAMP und SPSS Vergleich der Prognose Fehler für das jeweils letzte Jahr a) Einzelhandelsindex der BRD für Bekleidung, Schuhe, Lederwaren (1994M01 – 2005M08) b) Einnahmen und Ausgaben der öffentlichen Haushalte in der BRD (Quartalsdaten vom 1991Q1 - 2005/Q1) c) Hausbaustarts in den USA, gesamt (1959M01 – 2005M09) d) Hausbaustarts in den USA, EFH (1959M01 – 2005M09) e) Preismedian bei Hausverkäufen in den USA (1968M01 – 2005M09) f) Mengen- und wertmäßiger Elektroenergieverbrauch von Haushalten in Kalifornien ( 1990M01 – 2003M08)

Anhang 1

135

Anlage 2 Funktionaler Zuwachs von EViews 6 gegenüber EViews 5 1. Excel-Dateien können per Mausklick aus dem Explorer in den EViews-Rahmen gezogen und als Workfile formatiert werden. 2. Grafiken können nunmehr in allen gängigen Ausgabeformaten incl. GIF, JPEC und PNG exportiert werden. 3. Der ARCH-LM-Test auf Heteroskedastie ist um vier weitere Testverfahren auf Varianzhomogenität ergänzt worden. Die Testverfahren sind auf ARMA-Residuen und auf GARCH-Residuen anwendbar. 4. Für ARMA-Residuen ist zusätzlich ein LM-Test auf serielle Korrelation anwendbar. 5. Der Test auf Normalverteilung für Residuen von VAR- bzw. Kointegrationsmodellen kann neben der simultanen Betrachtung von Schiefe und Windung (Jarque-Bera) auch gesondert nur als Test auf Schiefe bzw. nur als Test auf Windung (Aufspaltung nach Lütkepol) 6. Im Grafik Menü sind Quantil-Plots und Box-Plots hinzu gekommen. 7. Die Prognose Techniken sind nun auch auf Modelle mit MA-Termen anwendbar. Darüber hinaus sind zahlreiche weitere Schätz- und Testverfahren für diskrete Variable und Paneldaten verfügbar (siehe EViews 6 Getting Started, January 30, 2007).

136

Anlagen 1 - 4

Anlage 3 Programmerweiterungen für EViews (ab 5.0) In einer ersten Arbeitsetappe wurden im SS 2007 vier Zusatzprogramme für EViews 5.0 erstellt (vgl. Dorloff [2007]1) und im Lehrbetrieb während des Wintersemesters 2007/08 erprobt. Es handelt sich um Programme zur Berechnung bzw. Visualisierung • • • •

des Periodogramms und der Spektraldichtefunktion (perspc.prg) des kumulativen Periodogramms (kumper.prg) von 11 verschiedenen Fehlermaßen für die Vergleichsprognose (errors.prg) von Intervallprognose und Beobachtungsreihe im Vergleichszeitraum unter Beachtung des Vorzeichens beim Prognose Fehler (verprog.prg).

Die Programme sind in einem speziellen, unter EViews verfügbaren Visual Basic Dialekt geschrieben und auf dem Dozenten Laufwerk abgelegt. Die Eingabeparameter und Ausgabedateien weist Tabelle A1 aus. Tabelle A1 Programmübersicht Programm

Input-Output-Funktion

Input-Output-Dateien

perspc.prg

Eingabeparameter

Beobachtungsreihe Anfangszeitpunkt Endzeitpunkt

Ausgabedateien

Periodogramm (Typ: Matrix) Spektraldichtefunktion (Typ: Matrix)

Eingabeparameter

Periodogramm-Matrix Startzeitpunkt Endzeitpunkt

Ausgabedateien

Kumper (Typ: Matrix)

Eingabeparameter

Prognose Reihe Beobachtungsreihe Anfangspunkt Vergleichszeitraum Endpunkt Vergleichszeitraum

Ausgabedateien

Errors (Typ: Pool)

Eingabeparameter

Vergleichsprognose Ist-Werte Beginn Vergleichszeitraum Ende Vergleichszeitraum Varianzen der Prognose Fehler

Ausgabedateien

Progrisk (Typ: Matrix) Verprog (Typ: Matrix)

kumper.prg

errors.prg

verprog.prg

1

Dorloff, J.: Programmierung von Makros in EViews, FH Stralsund, Hausarbeit QM I, SS 07

Anhang 1

137

Der Programmaufruf in EViews erfolgt über den Menüpunkt File/Open/Programm (vgl. Bild A1) und wird mit dem Befehl RUN ausgelöst (vgl. Bild A2). Danach erscheint ein Fenster mit dem Verweis auf das Verzeichnis des Quellcodes und einem Eingabefenster für die Parameter. Bild A1 Programmaufruf in der EViews-Umgebung

Bild A2 Quellcode und Run-Option

Um die Berechnungen zu beschleunigen sollte sogleich der schnelle Abarbeitungsmodus eingestellt werden (vgl. Bild A3). Die erzeugten Ausgabedateien sind über das Arbeitsfenster von EViews aufzurufen (vgl. Bild A4).

138

Anlagen 1 - 4

Bild A3 Vorbereitung des Programmstarts

Bild A4 Ablage von Output Dateien in einem Workfile von EViews

Das Programm zur Visualisierung der Vergleichsprognosen ist inzwischen vom Autor noch einmal korrigiert worden, um die gewünschten zeitvariablen Prognose Intervalle für den GARCH-Ansatz zu erhalten. Dazu müssen nunmehr die Varianzen der Prognose Fehler für den Vergleichszeitraum eingegeben werden, welche zuvor im Untermenü Proc mit Make GARCH Variance Series als Output erzeugt worden sind. Die entsprechenden Grafiken sind in Bild A5 und Bild A6 zu sehen.

Anhang 1

Bild A5 Vergleichsprognose und Istwerte mit dynamischen Konfidenzintervallen 80 70 60 50 40 30 20 10 0 -10 1725

1750

1775

1800

PREISF INTU

1825

1850

$/MWh INTO

Bild A7 Ausgabe positiver und negativer Prognosefehler 30

20

10

0

-10

-20

-30 1725

1750

1775 RISKUP

1800

1825

RISKDOWN

1850

139

140

Anlagen 1 - 4

In einer zweiten Phase sind weitere Programmerweiterungen geplant: • Erweiterung der Datumsangaben um Stunden, • Erweiterung der Periodogrammglättung, • Erweiterung der grafischen Zeitreihenanalyse (Durchschnittskurven, Abschnittsvergleiche).

Anhang 1

Anlage 4 Hinweise auf weitere Quellen Götze, W.: Modellspezifikation und Kurzfristprognose von Elektroenergiezeitreihen auf liberalisierten Strommärkten, Vortrag auf der Tagung der GOR Arbeitsgruppe Prognose Verfahren am 5.10.2006 in Berlin (50 Folien, siehe Homepage Götze).

141