1 Berücksichtigung von Individualeekten

Hannah Schürenberg, Master Econ. Universität Duisburg-Essen, Standort Essen Fachbereich Wirtschaftswissenschaften Lehrstuhl für Internationale Wirtsch...
Author: Eva Brodbeck
2 downloads 0 Views 436KB Size
Hannah Schürenberg, Master Econ. Universität Duisburg-Essen, Standort Essen Fachbereich Wirtschaftswissenschaften Lehrstuhl für Internationale Wirtschaftsbeziehungen

Kontakt: [email protected] Tel.: 0201 183 30 10 Sprechstunde Mo 14-15h & nach Vereinbarung

Quantitative Modelle internationaler Wirtschaftsbeziehungen Panelanalyse in EViews Ein Panel ist ein Datensatz, der simultan Zeitreihen- und Querschnittsdaten für alle oder einige der Variablen enthält. D.h. die Daten werden für eine bestimmte Anzahl Merkmalsträger i=1, ... N (z.B. Länder, Haushalte, Unternehmen, Individuen, ...) und für mehrere Zeitpunkte t=1, ..., T beobachtet. Panel können eher breit (N>T) oder lang (T>N) sein. Ersteres wird bei Mikrodatensätzen vorherrschen, letzteres eher bei Makrodaten zu nden sein. Die Paneldatenanalyse hat den wesentlichen Vorteil, dass sie deutlich mehr Beobachtungen nutzen kann, als Zeitreihen- und Querschnittsanalysen, sie ist dadurch ezienter. Dies ist insbesondere relevant, falls nur sehr kurze Zeitreihen vorliegen, etwa wegen eines Strukturbruchs. Die Paneldatenanalyse trägt zudem der Heterogenität der Merkmalsträger Rechnung, indem sie es erlaubt, Individualeekte zu berücksichtigen. Nachteilig ist, dass bei der Panelanalyse groÿe Datenmengen anfallen. Auch treten Probleme auf, falls Datenpunkte fehlen (unbalanced Panel). Die Panelanalyse ist ein eher neues Gebiet der empirischen Wirtschaftsforschung. Entsprechend groÿ ist z.T. noch die Unsicherheit bzgl. der Qualität einzelner Schätzer und Tests und deren Eigenschaften.

1 Berücksichtigung von Individualeekten Es gibt eine Vielzahl möglicher Individualeekte, die im Detail in Fendel (2004) aufgelistet sind. Die wichtigsten Möglichkeiten werden hier kurz ausgeführt:

1.1 Keine Eekte Berücksichtigt man keinerlei individuelle Eekte über die Merkmalsträger oder die Zeit, so entspricht die Panelschätzung der Schätzung einer längeren Zeitreihe, die aus den Zeitreihen für die einzelnen Merkmalsträger zusammengesetzt ist. Bei dieser naiven Vorgehensweise wird ein systematischer Zusammenhang der Form:

yit = α + βXit + ut geschätzt. nommen.

α

und

β

werden somit als konstant über die Merkmalsträger und über die Zeit ange-

Übung zu Quantitative Modelle int. Wirtschaftsbeziehungen - WS 2008/2009

21. Januar 2009

1.2 Fixed eects Bei einer

Fixed-eects -Schätzung

wird der Steigungsparameter

β

über alle Merkmalsträger als

konstant angenommen, man geht jedoch von unterschiedlichen Achsenabschnitten aus:

yit = αi + βXit + ut Eine

Fixed eects -Schätzung

kommt vor allem in Frage, wenn die Daten systematisch erhoben

wurden und die Gesamtheit der Merkmalsträger abdecken. Dies ist insbesondere für Makrodaten relevant.

1.3 Random Eects Bei einer textotRandom eects-Schätzung wird davon ausgegangen, dass der systematische Teil der Schätzgleichung über die Merkmalsträger und die Zeit gleich ist, sie jedoch unterschiedlichen Störeinüssen ausgesetzt sind und daher unterschiedliche Zufallseinüsse aufweisen. Es wird daher geschätzt:

yit = α + βXit + εi + ut = α + βXit + νit Dieser Fall ist vor allem relevant, falls die Merkmalsträger zufällig aus einer Grundgesamtheit ausgewählt wurden, also etwa bei Umfragen. Dies wird vor allem für Mikrodaten relevant sein.

2 Panelschätzungen in EViews 2.1 Datenorganisation Die Paneldaten können entweder in Matrixform, oder in Form von sogenannten stacked series vorliegen. In Matrixform organisierte Daten werden wie folgt aussehen:

t/i

1

...

...

N

1

x11

...

...

xN 1

...

...

...

...

...

T

x1T

...

...

xN T

Als stacked series organisierte Daten sind wie folgt aufgebaut:

2

Übung zu Quantitative Modelle int. Wirtschaftsbeziehungen - WS 2008/2009

i

t

x

1

1

x11

1

2

x12

...

...

...

1

T

x1T

2

1

x21

..

..

..

N

1

xN 1

N

2

xN 2

...

...

...

N

T

xN T

21. Januar 2009

Die meisten Datenbanken (Eurostat, Penn World Table) liefern bereits stacked series. Falls verschiedene Datenquellen benutzt werden, oder einzelne Variablen allen Merkmalsträgern gemein sind (z.B. BIP, Wechselkurs und andere gesamtwirtschaftliche Gröÿen), so wird eine Organisation als Matrix oft einfacher sein. Für das einlesen in ein Panel-Objekt benötigt man jedoch

1 Eine Umorga-

stacked series, während ein pool-Objekt eher Daten in Matrixform erwartet.

nisation ist in EViews jedoch meist noch möglich. Wichtig ist in jedem Fall eine konsistente Benennung der Zeitreihen bereits im Datensatz. Diese sollte eine klare Benennung der Zeitpunkte im üblichen EViews-Format, eindeutige Cross-section-identiers (Merkmalsträgernamen) und einheitliche Zeitreihennamen (z.B. DI_) beinhalten. Im Optimalfall werden Zeit- und ID-Series gleich mit erstellt und eingelesen.

2.2 Panel und Pool in EViews EViews unterscheidet zwei Herangehensweisen an Paneldaten: Schätzung in einem StandardWorkle mit Hilfe eines

pool-Objektes oder Schätzen in einem Panel-Workle. Beide Vor-

gehensweisen sind für Makro-Daten geeignet und beherrschen die wesentlichen Panel-Schätzer. Dennoch gibt es Vor- und Nachteile. Nach Denition von EViews ist ein Pool eher ein langes Panel während ein Panel eher breit ist. Auch ist ein Pool gewissermaÿen ein Zwischenschritt zwischen normaler Zeitreihenschätzung und Panel und etwas leichter zu erlernen. Ein

Pool-

Objekt ist ähnliche wie ein Gruppenobjekt nur eine andere Art die Zeitreihen aufzurufen, die

sich in einem normalen Workle benden. Schätzungen sind hier nur Darstellungen des Pools, keine echten

equation-Objekte. Es empehlt sich, mit einem Pool-Objekt zu arbeiten, falls die

Daten in Matrix-Form vorliegen und zunächst umorganisiert werden sollen. Es ist auch ratsam ein das Pool-Vorgehen zu wählen, falls für einzelne Merkmalsträger zusätzlich Einzelschätzungen durchgeführt werden sollen, oder falls verschiedene Gruppen gebildet werden sollen. Zur Generierung eines Pools müssen jedoch alle cross-section-identiers einzeln aufgeführt werden. Dies ist ein zu groÿer Arbeitsaufwand falls eine groÿe Anzahl an Merkmalsträgern vorliegt.

1

Mehr zu Panel vs. Pool im nächsten Abschnitt

3

Übung zu Quantitative Modelle int. Wirtschaftsbeziehungen - WS 2008/2009

21. Januar 2009

2.3 Schätzen im Pool Zum Schätzen mit einem Pool-Objekt muss zunächst ein normales Zeitreihen-Workle mit passender Dimension angelegt werden. In dieses werden dann die in Matrixform organisierten Zeitreihen eingelesen. Es können sowohl individuelle, Merkmalsträger-abhängige Zeitreihen eingelesen werden, als auch normale Merkmalsträger-unabhängige Zeitreihen. Es wird nun über den Befehl

Object/New Object/Pool ein neues Pool-Objekt erstellt. Das Objekt ist zunächst leer und muss nun mit den cross-section-identiers gefüllt werden. Diese werden dazu einfach in der gewünschten Reihenfolge eingetragen. Sie müssen dabei genau die Zeitreihennamen widerspiegeln. Beispiel: Zeitreihen did_aus, did_aut und did_bel wurden eingelesen. Es wird somit in das PoolObjekt eingetragen: aus aut bel. Nun können die Daten über

data)

View/Spreadsheet(stacked

aufgerufen werden. Es können hier sowohl gepoolte Zeitreihen, als auch nicht gepoolte

aufgerufen werden, die letzteren werden einfach von EViews ausreichend oft untereinander gesetzt. Beispiel: did_? wäre die gepoolte Reihe, bip könnte als ungepoolte mit eingelesen werden. Nach Eingabe der gewünschten Zeitreihen erscheinen diese wie in einem Gruppenobjekt. Nach Speichern des Pool-Objektes kann dieses sofort für die Schätzung genutzt werden. Dazu wird über den Befehl

Proc/Estimate zunächst der Schätzdialog aufgerufen.

Abbildung 1: Der Schätzdialog im Pool-Objekt

Das Ergebnis wird dann im Pool-Fenster angezeigt. Bei Wahl einer Fixed-Eects-Schätzung werden auch die Individualeekte ausgewiesen. Auch hier zeigt sich, dass ein Pool nur für eine eher geringe Anzahl Merkmalsträger geeignet ist. VORSICHT: Das Schätzergebnis ist NUR eine Darstellung des Pool-Objektes, es würde verschwinden, sobald man sich etwas anderes, etwa einen Test anzeigen lieÿe. Es muss über den Befehl

Freeze gespeichert werden, wenn es erhalten

bleiben soll.

4

Übung zu Quantitative Modelle int. Wirtschaftsbeziehungen - WS 2008/2009

21. Januar 2009

2.4 Exportieren der gepoolten Zeitreihen Zur Weiterverwendung in einem Panel-Workle können die gepoolten Zeitreihen exportiert werden. Es werden dann Excel- oder Textdateien mit stacked series geschrieben. Dies ist über den Befehl

Proc/Export stacked data möglich. Nachdem ein Speicherort und -name ausgewählt

wurde, kann speziziert werden, welche Zeitreihen exportiert werden sollen. Es ist insbesondere wichtig, auch die Datums- und ID-Reihe mitzuexportieren.

Abbildung 2: Der Export von gepoolten Reihen

2.5 Erstellen eines Panel-Workles Ein Panel-Workle kann am schnellsten erstellt werden, indem ein unstructured-Workle umgewandelt wird. Dazu müssen zunächst die Daten als stacked series vorliegen. Der Datensatz muss zudem eine Datumszeitreihe und eine id-Reihe enthalten. Die IDs müssen dabei nummerisch gewählt werden, also würde bspw. eine Zeitreihe für alle australischen Beobachtungen eine 1, für alle österreichischen eine 2 usw. enthalten. Es wird nun zunächst ein

unstructured Workle mit ausreichend vielen Beobachtungen ange-

legt und in dieses die stacked series eingelesen. Wichtig ist, die Datums- und ID-Reihe dabei miteinzulesen. Nachdem das Workle zunächst gespeichert wurde, wird es im folgenden umgewandelt. Dies erfolgt über den Befehl:

Proc/Structure,Resize Current Page.

Es werden nun Frequenz und Anfangs- und Endpunkt der Zeitreihen angegeben. Auÿerdem

5

Übung zu Quantitative Modelle int. Wirtschaftsbeziehungen - WS 2008/2009

21. Januar 2009

Abbildung 3: Umwandeln in ein Panel-Workle

wird die ID-Zeitreihe und die Datumszeitreihe speziziert. EViews strukturiert daraufhin die enthaltenen Zeitreihen gemäÿ diesen Vorgaben.

2.6 Schätzen im Panel Das Panel-Workle kann nun genauso gehandhabt werden, wie ein normales Zeitreihen-Workle. D.h. über den Befehl

Quick/Estimate Equation kann nun wieder der Schätzdialog aufgeru-

fen werden, der den gleichen Aufbau besitzt, wie bei der Pool-Schätzung. Auch bleibt nun das Schätzergebnis im equation-Objekt gespeichert und geht nicht mehr verloren. Im Schätzergebnis werden allerdings die Individualeekte nicht mehr einzeln aufgeführt, sie können aber über

View/Fixed,Random Eects abgerufen werden. Auch kann über den Befehl View eine Reihe von Tests und deskriptiven Statistiken aufgerufen werden. Es wird unter Umständen passieren, das EViews die Länder-IDs mit einer groÿen Menge Nachkommastellen anzeigt. Dies kann behoben werden, indem die ID-Zeitreihe geönet wird und über

Properties die Anzahl der Dezimalstellen reduziert wird. Dann werden auch in den Schätzungen und anderen Objekten die Nachkommastellen reduziert.

Literatur [1] Fendel, Ralf (2004): Paneldatenanalyse - Teil 1: Theoretische Grundlagen. In: WiSt Heft 12/2004.

6