Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik
Prof. Dr. Isabel Schnabel Lehrstuhl f¨ ur Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universit¨ at Mainz Wintersemester 2007/2008
Vorlesung 4 13. November 2007
1 / 28
¨ II. Okonometrische Methoden II.1 Grundlagen (Wiederholung) II.2 Validit¨at einer empirischen Studie II.3 Daten II.4 Panelmethoden II.5 Instrumentvariablensch¨atzung II.6 Dynamisches Panel
2 / 28
II.5.1 Instrumentvariablensch¨atzung und TSLS
Literatur: Wooldridge, Kapitel 15 –16
Zum Teil Wiederholung aus “Empirischer Wirtschaftsforschung” (hier relativ knappe Darstellung gem¨aß Wooldridge)
Instrumentvariablensch¨ atzung (IV-Sch¨ atzung, instrumental variables / IV estimation) = Methode, konsistente Sch¨atzer zu erhalten, wenn (mindestens) ein Regressor mit dem Fehlerterm korreliert ist (Verletzung der zentralen OLS-Annahme MLR.4)
Es ist unwichtig, woher die Korrelation zwischen x und u stammt, die IV-Sch¨atzung ist unabh¨angig von der Quelle der Korrelation anwendbar
Wichtigste Anwendungen: Problem ausgelassener Variablen, Simultanit¨ atsproblem, Messfehler in erkl¨arenden Variablen 4 / 28
Problem ausgelassener Variablen und IV-Sch¨atzung
Das Auslassen einer Variablen f¨ uhrt zur Verzerrung/Inkonsistenz des OLS-Sch¨atzers, wenn 1. die ausgelassene Variable einen Einfluss auf y hat und 2. die ausgelassene Variable mit mindestens einer eingeschlossenen x-Variable korreliert ist
Das Problem ausgelassener Variablen ist eines der zentralen Probleme in der empirischen Forschung Problem kann manchmal ignoriert werden, wenn der interessierende Koeffizient in Richtung der Nullhypothese verzerrt ist und die Nullhypothese trotzdem verworfen wird (“konservative” Sch¨ atzung)
H¨aufig keine zufriedenstellende Methode
5 / 28
Weitere L¨osungsm¨oglichkeiten
1. Einschließen der ausgelassenen Variable (i. d. R. nicht m¨oglich) 2. Verwendung einer Proxy-Variable (hierzu gleich mehr)
H¨aufig sind keine geeigneten Proxy-Variablen verf¨ ugbar
3. Paneldatenmethoden (FE-Sch¨atzung, Sch¨atzung in ersten Differenzen): Man kann f¨ ur zeitkonstante unbeobachtete Variablen kontrollieren
Dies funktioniert nicht, wenn man sich f¨ ur den Effekt einer zeitkonstanten Variable interessiert Dies l¨ ost das Problem nur teilweise, wenn die ausgelassene Variable u ¨ber die Zeit variiert
4. Instrumentvariablensch¨ atzung
6 / 28
Exkurs: Proxy-Variablen
Literatur: Wooldridge, Kapitel 9.2
Idee: Ausgelassene Variable wird durch eine Proxy-Variable ersetzt, die der ausgelassenen Variable “¨ahnlich” ist Beispiel: Sch¨atzung von Renditen der Ausbildung
Problem: Man kann die F¨ahigkeiten (ability) der Personen nicht beobachten Diese F¨ahigkeiten sind jedoch vermutlich mit der Ausbildungsentscheidung korreliert → Sch¨atzer sind verzerrt/inkonsistent L¨ osungsvorschlag: Verwende statt ability den IQ als Kontrollvariable
7 / 28
Modell
Regressionsmodell: y = β0 + β1 x1 + β2 x2∗ + u
Ziel: Sch¨atzung von β1
y und x1 werden beobachtet, x2∗ hingegen nicht
Statt x2∗ verwenden wir einen Proxy x2 , f¨ ur den gilt: x2∗ = δ0 + δ2 x2 + ν2
Also: Der Zusammenhang zwischen x2∗ und x2 ist nicht exakt
δ2 ist typischerweise positiv
Wenn δ2 = 0, dann ist x2 kein guter Proxy
8 / 28
Sch¨atzung mit einer Proxy-Variablen
Wir tun so, als ob der Proxy gleich der nicht beobachteten Variable ist und regressieren y auf x1 und x2
Frage: Ergibt sich hierbei ein konsistenter Sch¨atzer f¨ ur β1 ? 2 zentrale Annahmen (zus¨atzlich zu den normalen OLS-Annahmen):
1. Cov (u, x2 ) = 0 (analog zu der Bedingung f¨ ur x2∗ in der urspr¨ unglichen Regression) ur x2 2. E (x2∗ |x1 , x2 ) = E (x2∗ |x2 ) = δ0 + δ2 x2 → Wenn man f¨ kontrolliert, dann verbessert x1 nicht die Prognose von x2∗ , Fehlerterm ν2 ist nicht mit x1 und x2 korreliert
Im Beispiel: Um ability zu prognostizieren, hilft einem die Ausbildung nicht, sofern man bereits f¨ ur den IQ kontrolliert
9 / 28
Sch¨atzung mit einer Proxy-Variablen
Einsetzen ergibt: y = β0 + β1 x1 + β2 x2∗ + u = β0 + β1 x1 + β2 (δ0 + δ2 x2 + ν2 ) + u = (β0 + β2 δ0 ) + β1 x1 + β2 δ2 x2 + (u + β2 ν2 ) = α0 + β1 x1 + α2 x2 + e
Dieses Modell erf¨ ullt unter den obigen Annahmen die zentrale OLS-Annahme MLR.4
Daher kann das Modell mit OLS gesch¨atzt werden
Sch¨atzer f¨ ur β1 ist konsistent
10 / 28
Sch¨atzung mit einer Proxy-Variablen
Sch¨atzung mit Proxy-Variablen funktioniert im Allgemeinen nicht, wenn stattdessen gilt: x2∗ = δ0 + δ1 x1 + δ2 x2 + ν2
Dann w¨ urde gelten: y = β0 + β1 x1 + β2 x2∗ + u = (β0 + β2 δ0 ) + (β1 + β2 δ1 ) x1 + β2 δ2 x2 + (u + β2 ν2 ) = α0 + α1 x1 + α2 x2 + e
Der Koeffizient von x1 entspricht nur dann β1 , wenn δ1 = 0
Aber: Verzerrung ist m¨ oglicherweise kleiner, als wenn wir das Problem ausgelassener Variablen ganz ignorieren 11 / 28
Verz¨ogerte endogene Variablen als Proxy-Variablen
Manchmal kann man f¨ ur ausgelassene Variablen “kontrollieren”, indem man den verz¨ ogerten Wert der zu erkl¨arenden Variable (yt−1 ) einschließt
Idee: Man h¨alt alle (unbeobachteten) vergangenen Faktoren konstant, die heutige Unterschiede in y erkl¨aren
Dies erfasst gleichzeitig auch Persistenzen in y
Gedankenexperiment: Welchen Effekt hat eine Erh¨ohung von x1 , wenn zwei Beobachtungssubjekte denselben Ausgangswert von y in der Vorperiode hatten?
Beachte: Das Verwenden der verz¨ ogerten endogenen Variable als Proxy funktioniert nicht bei Autokorrelation des Fehlerterms u (warum?) (Ende des Exkurses)
12 / 28
Instrumentvariablensch¨atzung
Problem: H¨aufig gibt es keine geeigneten Proxy-Variablen
Alternative: Instrumentvariablensch¨ atzung
Beachte: In diesem Fall ist die unbeobachtete Variable Teil des Fehlerterms
Wir betrachten das folgende Regressionsmodell: y = β0 + β1 x + u
Problem: Cov (x, u) = 0 → OLS-Sch¨atzer ist verzerrt/inkonsistent
Idee der IV-Sch¨atzung: Suche eine Variable z, die mit x korreliert ist, aber nicht mit dem Fehlerterm u
13 / 28
Anforderungen an Instrumentvariablen
2 zentrale Anforderungen an eine Instrumentvariable: 1. Exogenit¨ at des Instruments: Cov (z, u) = 0 2. Relevanz des Instruments: Cov (z, x) = 0
Beachte: Das Instrument darf nicht selbst in der Regression enthalten sein (sog. Ausschlussrestriktion) Annahme 1 kann im Allgemeinen nicht getestet werden, w¨ahrend man Annahme 2 in einer einfachen OLS-Regression von x auf z mit einem t-Test (F-Test) testen kann
Beachte: OLS-Sch¨atzer in einfacher Regression = Kovarianz von x und z geteilt durch die Varianz von z
14 / 28
Beispiel: Renditen der Ausbildung
Ziel: Sch¨atzung der Renditen der Ausbildung
Problem: Unbeobachtbarkeit von ability (korreliert mit Ausbildungsentscheidung) Erf¨ ullen die folgenden Variablen die beiden Bedingungen f¨ ur ein geeignetes Instrument f¨ ur die Ausbildung?
Die letzten vier Ziffern der Nummer des Personalausweises IQ Ausbildung der Eltern Anzahl der Kinder in einer Familie
15 / 28
Herleitung des IV-Sch¨atzers (1 Regressor, 1 Instrument)
Regressionsmodell: y = β0 + β1 x + u ⇒ Cov (y , z) = β1 Cov (x, z) + Cov (u, z) = β1 Cov (x, z)
bei Exogenit¨ at des Instruments
Hieraus folgt: β1 =
Cov (y , z) , Cov (x, z)
falls Cov (x, z) = 0 (Relevanz)
Allgemeines Testprinzip: Analogieprinzip (ersetze Gr¨oßen der Grundgesamtheit durch entsprechende Gr¨ oßen der Stichprobe)
Also: IV-Sch¨ atzer entspricht der empirischen Kovarianz von y und z geteilt durch die empirische Kovarianz von x und z 16 / 28
Eigenschaften des IV-Sch¨atzers
Bei G¨ ultigkeit der Instrumente ist der IV-Sch¨atzer konsistent
Aber: Er ist nicht unverzerrt, daher sind große Stichproben bei IV-Sch¨atzungen wichtig
Varianz des IV-Sch¨atzers ist umso kleiner, je gr¨oßer die Korrelation zwischen x und z ist
Sind x und z kaum korreliert, so spricht man von schwachen Instrumenten (weak instruments)
Sind x und u unkorreliert, so sollte OLS verwendet werden, da es effizienter ist
17 / 28
Schwache Instrumente (weak instruments)
2 Konsequenzen schwacher Instrumente: 1. Hohe Standardfehler der Sch¨atzer 2. Verzerrung/Inkonsistenz der Sch¨atzer
Beobachtung: Die asymptotische Verzerrung des IV-Sch¨atzers kann erheblich sein, selbst wenn die Korrelation zwischen x und u relativ klein ist, wenn auch die Korrelation zwischen x und z klein ist
Im Zweifel sollte man nur starke Instrumente verwenden Beachte: Die Berechnung des R 2 nach einer IV-Sch¨atzung ist nicht besonders sinnvoll
Varianzzerlegung funktioniert hier nicht wie zuvor, keine nat¨ urliche Interpretation des R 2 Erkl¨arungsgehalt ist naturgem¨aß nicht so groß
18 / 28
Two Stage Least Squares (TSLS)
Bislang haben wir unterstellt, dass es genau so viele Instrumente wie “endogene” x-Variablen gibt
Was macht man, wenn man mehr als ein g¨ ultiges Instrument pro endogener Variable hat?
Idee: Wir w¨ahlen die “beste” Linearkombination aller g¨ ultigen Instrumente, d. h. die Linearkombination, die am st¨arksten mit der endogenen Variable korreliert ist → Fit einer Regression der endogenen Variable auf alle Instrumente (plus den eingeschlossenen exogenen Variablen)
19 / 28
Sch¨atzung mit TSLS
2 Stufen: 1. Regressiere die endogene Variable auf die Instrumente und alle eingeschlossenen exogenen Variablen und ermittle den Fit dieser Regression
Idee: Teil von x, der mit z korreliert ist, ist laut Annahme nicht mit dem Fehlerterm u der urspr¨ unglichen Regression korreliert Grund: Exogenit¨ at von z Beachte: Je gr¨ oßer die Korrelation von x und z, desto mehr Variation von x bleibt u ¨brig (Test!)
2. Regressiere y auf den Fit aus Stufe 1 und auf die eingeschlossenen exogenen Variablen
Die sich ergebenden TSLS-Sch¨atzer sind konsistent, weil die zentrale OLS-Annahme MLR.4 per Konstruktion erf¨ ullt ist
20 / 28
Mehrere endogene Variablen
Im Falle mehrerer endogener Variablen ist TSLS vollkommen analog anwendbar
Aber: Man ben¨otigt mehr Instrumente
Bedingung (order condition): Wir ben¨ otigen mindestens so viele ausgeschlossene exogene Variablen (Instrumente) wie eingeschlossene endogene Variablen
Beachte: Hier muss f¨ ur jede endogene Variable eine erste Stufe gesch¨atzt werden
F¨ ur den Fall mit einer endogenen Variable und einem Instrument entspricht der TSLS-Sch¨ atzer dem einfachen IV-Sch¨ atzer
21 / 28
Messfehlerprobleme und IV-Sch¨atzung
IV-Sch¨atzer k¨onnen auch verwendet werden, um Messfehlerprobleme zu beheben
Wichtigster Fall: Verwendung einer zweiten Messung derselben Variable als IV
Beispiele: Auskunft u unfte durch Besch¨aftigte ¨ber Lohneink¨ und Arbeitgeber, Angabe des Haushaltseinkommens durch beide Ehepartner
Idee: Zweite Messung ist stark korreliert mit der ersten Messung, Messfehler der zwei Messungen sind jedoch unkorreliert
22 / 28
Tests
2 wichtige Tests: 1. Test auf Endogenit¨ at: Ist u ¨berhaupt eine IV-Sch¨atzung erforderlich? Ist der Fehlerterm tats¨achlich mit den x-Variablen korreliert? 2. Test u ¨beridentifizierender Restriktionen: Sind die verwendeten Instrumente exogen?
Beachte: F¨ ur beide Tests ben¨ otigen wir g¨ ultige Instrumente!
23 / 28
Test auf Endogenit¨at
2-stufiger Test: 1. Regressiere die endogene x-Variable auf alle Instrumente und eingeschlossenen exogenen Variablen und ermittle die Residuen der Regression 2. F¨ uge das Residuum aus der ersten Stufe als zus¨atzlichen Regressor in die Regression ein, sch¨atze die Regression mit OLS und teste auf Signifikanz (t-Test)
Wenn der Koeffizient des Residuums signifikant von Null verschieden ist, liegt Endogenit¨ at vor
Intuition: Die Residuen sind der Teil von x, der potentiell mit u korreliert sein k¨ onnte; ein signifikanter Effekt des Residuums deutet auf eine Korrelation zwischen x und u hin
24 / 28
Test u¨beridentifizierender Restriktionen
Frage: Wie testet man, ob die verwendeten Instrumente die Bedingung der Exogenit¨ at erf¨ ullen?
Gibt es genau so viele Instrumente wie endogene x-Variablen (exakte Identifikation), kann die Exogenit¨at der Instrumente nicht getestet werden
Gibt es mehr Instrumente als endogene x-Variablen ¨ (Uberidentifikation), kann getestet werden, ob die u ussigen Instrumente exogen sind (unter der ¨bersch¨ Annahme, dass die zur Identifikation ben¨ otigten Instrumente g¨ ultig sind, test of overidentifying restrictions)
25 / 28
Test u¨beridentifizierender Restriktionen
Vorgehensweise: 1. Ermittle das Residuum der TSLS-Sch¨atzung 2. Regressiere das Residuum auf alle (eingeschlossenen und ausgeschlossenen) exogenen Variablen und berechne das R 2 3. Teststatistik: n · R 2 ist unter H0 (Exogenit¨at der Instrumente) asymptotisch χ2 -verteilt (Anzahl der Freiheitsgrade = Anzahl der u ¨beridentifizierenden Restriktionen)
Intuition: Unter der Nullhypothese sollte das Residuum (der Sch¨atzer des St¨orterms) mit keiner der exogenen Variablen korreliert sein
26 / 28
Fazit
Die Instrumentvariablensch¨atzung erm¨ oglicht eine konsistente Sch¨atzung von Parametern, selbst wenn eine Korrelation zwischen den Regressoren und dem Fehlerterm besteht
Aber: IV-Sch¨atzung liefert nur dann zuverl¨assige Ergebnisse, wenn die Instrumente g¨ ultig sind, d. h., wenn sie relevant und exogen sind
Ansonsten ist nicht gew¨ahrleistet, dass die Ergebnisse einer IV-Sch¨atzung zuverl¨assiger sind als die der OLS-Sch¨atzung
Praxis: G¨ ultige Instrumente sind sehr schwer zu finden
Trade-off Verzerrung vs. Effizienz
27 / 28
Programm der n¨achsten Woche
II.5 Instrumentvariablensch¨atzung
Simultanit¨at: Wooldridge, Kapitel 16
II.6 Dynamisches Panel
28 / 28