Empirical Banking and Finance Vorlesung zur Volkswirtschaftspolitik

Prof. Dr. Isabel Schnabel Lehrstuhl f¨ ur Volkswirtschaftslehre, insb. Financial Economics Johannes Gutenberg-Universit¨ at Mainz Wintersemester 2007/2008

Vorlesung 4 13. November 2007

1 / 28

¨ II. Okonometrische Methoden II.1 Grundlagen (Wiederholung) II.2 Validit¨at einer empirischen Studie II.3 Daten II.4 Panelmethoden II.5 Instrumentvariablensch¨atzung II.6 Dynamisches Panel

2 / 28

II.5.1 Instrumentvariablensch¨atzung und TSLS 

Literatur: Wooldridge, Kapitel 15 –16



Zum Teil Wiederholung aus “Empirischer Wirtschaftsforschung” (hier relativ knappe Darstellung gem¨aß Wooldridge)



Instrumentvariablensch¨ atzung (IV-Sch¨ atzung, instrumental variables / IV estimation) = Methode, konsistente Sch¨atzer zu erhalten, wenn (mindestens) ein Regressor mit dem Fehlerterm korreliert ist (Verletzung der zentralen OLS-Annahme MLR.4)



Es ist unwichtig, woher die Korrelation zwischen x und u stammt, die IV-Sch¨atzung ist unabh¨angig von der Quelle der Korrelation anwendbar



Wichtigste Anwendungen: Problem ausgelassener Variablen, Simultanit¨ atsproblem, Messfehler in erkl¨arenden Variablen 4 / 28

Problem ausgelassener Variablen und IV-Sch¨atzung 

Das Auslassen einer Variablen f¨ uhrt zur Verzerrung/Inkonsistenz des OLS-Sch¨atzers, wenn 1. die ausgelassene Variable einen Einfluss auf y hat und 2. die ausgelassene Variable mit mindestens einer eingeschlossenen x-Variable korreliert ist

 

Das Problem ausgelassener Variablen ist eines der zentralen Probleme in der empirischen Forschung Problem kann manchmal ignoriert werden, wenn der interessierende Koeffizient in Richtung der Nullhypothese verzerrt ist und die Nullhypothese trotzdem verworfen wird (“konservative” Sch¨ atzung) 

H¨aufig keine zufriedenstellende Methode

5 / 28

Weitere L¨osungsm¨oglichkeiten

1. Einschließen der ausgelassenen Variable (i. d. R. nicht m¨oglich) 2. Verwendung einer Proxy-Variable (hierzu gleich mehr) 

H¨aufig sind keine geeigneten Proxy-Variablen verf¨ ugbar

3. Paneldatenmethoden (FE-Sch¨atzung, Sch¨atzung in ersten Differenzen): Man kann f¨ ur zeitkonstante unbeobachtete Variablen kontrollieren 



Dies funktioniert nicht, wenn man sich f¨ ur den Effekt einer zeitkonstanten Variable interessiert Dies l¨ ost das Problem nur teilweise, wenn die ausgelassene Variable u ¨ber die Zeit variiert

4. Instrumentvariablensch¨ atzung

6 / 28

Exkurs: Proxy-Variablen



Literatur: Wooldridge, Kapitel 9.2



Idee: Ausgelassene Variable wird durch eine Proxy-Variable ersetzt, die der ausgelassenen Variable “¨ahnlich” ist Beispiel: Sch¨atzung von Renditen der Ausbildung









Problem: Man kann die F¨ahigkeiten (ability) der Personen nicht beobachten Diese F¨ahigkeiten sind jedoch vermutlich mit der Ausbildungsentscheidung korreliert → Sch¨atzer sind verzerrt/inkonsistent L¨ osungsvorschlag: Verwende statt ability den IQ als Kontrollvariable

7 / 28

Modell 

Regressionsmodell: y = β0 + β1 x1 + β2 x2∗ + u



Ziel: Sch¨atzung von β1



y und x1 werden beobachtet, x2∗ hingegen nicht



Statt x2∗ verwenden wir einen Proxy x2 , f¨ ur den gilt: x2∗ = δ0 + δ2 x2 + ν2



Also: Der Zusammenhang zwischen x2∗ und x2 ist nicht exakt



δ2 ist typischerweise positiv



Wenn δ2 = 0, dann ist x2 kein guter Proxy

8 / 28

Sch¨atzung mit einer Proxy-Variablen 

Wir tun so, als ob der Proxy gleich der nicht beobachteten Variable ist und regressieren y auf x1 und x2



Frage: Ergibt sich hierbei ein konsistenter Sch¨atzer f¨ ur β1 ? 2 zentrale Annahmen (zus¨atzlich zu den normalen OLS-Annahmen):



1. Cov (u, x2 ) = 0 (analog zu der Bedingung f¨ ur x2∗ in der urspr¨ unglichen Regression) ur x2 2. E (x2∗ |x1 , x2 ) = E (x2∗ |x2 ) = δ0 + δ2 x2 → Wenn man f¨ kontrolliert, dann verbessert x1 nicht die Prognose von x2∗ , Fehlerterm ν2 ist nicht mit x1 und x2 korreliert 

Im Beispiel: Um ability zu prognostizieren, hilft einem die Ausbildung nicht, sofern man bereits f¨ ur den IQ kontrolliert

9 / 28

Sch¨atzung mit einer Proxy-Variablen 

Einsetzen ergibt: y = β0 + β1 x1 + β2 x2∗ + u = β0 + β1 x1 + β2 (δ0 + δ2 x2 + ν2 ) + u = (β0 + β2 δ0 ) + β1 x1 + β2 δ2 x2 + (u + β2 ν2 ) = α0 + β1 x1 + α2 x2 + e



Dieses Modell erf¨ ullt unter den obigen Annahmen die zentrale OLS-Annahme MLR.4



Daher kann das Modell mit OLS gesch¨atzt werden



Sch¨atzer f¨ ur β1 ist konsistent

10 / 28

Sch¨atzung mit einer Proxy-Variablen 

Sch¨atzung mit Proxy-Variablen funktioniert im Allgemeinen nicht, wenn stattdessen gilt: x2∗ = δ0 + δ1 x1 + δ2 x2 + ν2



Dann w¨ urde gelten: y = β0 + β1 x1 + β2 x2∗ + u = (β0 + β2 δ0 ) + (β1 + β2 δ1 ) x1 + β2 δ2 x2 + (u + β2 ν2 ) = α0 + α1 x1 + α2 x2 + e



Der Koeffizient von x1 entspricht nur dann β1 , wenn δ1 = 0



Aber: Verzerrung ist m¨ oglicherweise kleiner, als wenn wir das Problem ausgelassener Variablen ganz ignorieren 11 / 28

Verz¨ogerte endogene Variablen als Proxy-Variablen 

Manchmal kann man f¨ ur ausgelassene Variablen “kontrollieren”, indem man den verz¨ ogerten Wert der zu erkl¨arenden Variable (yt−1 ) einschließt



Idee: Man h¨alt alle (unbeobachteten) vergangenen Faktoren konstant, die heutige Unterschiede in y erkl¨aren



Dies erfasst gleichzeitig auch Persistenzen in y



Gedankenexperiment: Welchen Effekt hat eine Erh¨ohung von x1 , wenn zwei Beobachtungssubjekte denselben Ausgangswert von y in der Vorperiode hatten?



Beachte: Das Verwenden der verz¨ ogerten endogenen Variable als Proxy funktioniert nicht bei Autokorrelation des Fehlerterms u (warum?) (Ende des Exkurses)

12 / 28

Instrumentvariablensch¨atzung 

Problem: H¨aufig gibt es keine geeigneten Proxy-Variablen



Alternative: Instrumentvariablensch¨ atzung



Beachte: In diesem Fall ist die unbeobachtete Variable Teil des Fehlerterms



Wir betrachten das folgende Regressionsmodell: y = β0 + β1 x + u



Problem: Cov (x, u) = 0 → OLS-Sch¨atzer ist verzerrt/inkonsistent



Idee der IV-Sch¨atzung: Suche eine Variable z, die mit x korreliert ist, aber nicht mit dem Fehlerterm u

13 / 28

Anforderungen an Instrumentvariablen



2 zentrale Anforderungen an eine Instrumentvariable: 1. Exogenit¨ at des Instruments: Cov (z, u) = 0 2. Relevanz des Instruments: Cov (z, x) = 0

 

Beachte: Das Instrument darf nicht selbst in der Regression enthalten sein (sog. Ausschlussrestriktion) Annahme 1 kann im Allgemeinen nicht getestet werden, w¨ahrend man Annahme 2 in einer einfachen OLS-Regression von x auf z mit einem t-Test (F-Test) testen kann 

Beachte: OLS-Sch¨atzer in einfacher Regression = Kovarianz von x und z geteilt durch die Varianz von z

14 / 28

Beispiel: Renditen der Ausbildung



Ziel: Sch¨atzung der Renditen der Ausbildung



Problem: Unbeobachtbarkeit von ability (korreliert mit Ausbildungsentscheidung) Erf¨ ullen die folgenden Variablen die beiden Bedingungen f¨ ur ein geeignetes Instrument f¨ ur die Ausbildung?



   

Die letzten vier Ziffern der Nummer des Personalausweises IQ Ausbildung der Eltern Anzahl der Kinder in einer Familie

15 / 28

Herleitung des IV-Sch¨atzers (1 Regressor, 1 Instrument) 

Regressionsmodell: y = β0 + β1 x + u ⇒ Cov (y , z) = β1 Cov (x, z) + Cov (u, z) = β1 Cov (x, z)



bei Exogenit¨ at des Instruments

Hieraus folgt: β1 =

Cov (y , z) , Cov (x, z)

falls Cov (x, z) = 0 (Relevanz)



Allgemeines Testprinzip: Analogieprinzip (ersetze Gr¨oßen der Grundgesamtheit durch entsprechende Gr¨ oßen der Stichprobe)



Also: IV-Sch¨ atzer entspricht der empirischen Kovarianz von y und z geteilt durch die empirische Kovarianz von x und z 16 / 28

Eigenschaften des IV-Sch¨atzers



Bei G¨ ultigkeit der Instrumente ist der IV-Sch¨atzer konsistent



Aber: Er ist nicht unverzerrt, daher sind große Stichproben bei IV-Sch¨atzungen wichtig



Varianz des IV-Sch¨atzers ist umso kleiner, je gr¨oßer die Korrelation zwischen x und z ist



Sind x und z kaum korreliert, so spricht man von schwachen Instrumenten (weak instruments)



Sind x und u unkorreliert, so sollte OLS verwendet werden, da es effizienter ist

17 / 28

Schwache Instrumente (weak instruments) 

2 Konsequenzen schwacher Instrumente: 1. Hohe Standardfehler der Sch¨atzer 2. Verzerrung/Inkonsistenz der Sch¨atzer



Beobachtung: Die asymptotische Verzerrung des IV-Sch¨atzers kann erheblich sein, selbst wenn die Korrelation zwischen x und u relativ klein ist, wenn auch die Korrelation zwischen x und z klein ist



Im Zweifel sollte man nur starke Instrumente verwenden Beachte: Die Berechnung des R 2 nach einer IV-Sch¨atzung ist nicht besonders sinnvoll







Varianzzerlegung funktioniert hier nicht wie zuvor, keine nat¨ urliche Interpretation des R 2 Erkl¨arungsgehalt ist naturgem¨aß nicht so groß

18 / 28

Two Stage Least Squares (TSLS)



Bislang haben wir unterstellt, dass es genau so viele Instrumente wie “endogene” x-Variablen gibt



Was macht man, wenn man mehr als ein g¨ ultiges Instrument pro endogener Variable hat?



Idee: Wir w¨ahlen die “beste” Linearkombination aller g¨ ultigen Instrumente, d. h. die Linearkombination, die am st¨arksten mit der endogenen Variable korreliert ist → Fit einer Regression der endogenen Variable auf alle Instrumente (plus den eingeschlossenen exogenen Variablen)

19 / 28

Sch¨atzung mit TSLS 

2 Stufen: 1. Regressiere die endogene Variable auf die Instrumente und alle eingeschlossenen exogenen Variablen und ermittle den Fit dieser Regression   

Idee: Teil von x, der mit z korreliert ist, ist laut Annahme nicht mit dem Fehlerterm u der urspr¨ unglichen Regression korreliert Grund: Exogenit¨ at von z Beachte: Je gr¨ oßer die Korrelation von x und z, desto mehr Variation von x bleibt u ¨brig (Test!)

2. Regressiere y auf den Fit aus Stufe 1 und auf die eingeschlossenen exogenen Variablen 

Die sich ergebenden TSLS-Sch¨atzer sind konsistent, weil die zentrale OLS-Annahme MLR.4 per Konstruktion erf¨ ullt ist

20 / 28

Mehrere endogene Variablen 

Im Falle mehrerer endogener Variablen ist TSLS vollkommen analog anwendbar



Aber: Man ben¨otigt mehr Instrumente



Bedingung (order condition): Wir ben¨ otigen mindestens so viele ausgeschlossene exogene Variablen (Instrumente) wie eingeschlossene endogene Variablen



Beachte: Hier muss f¨ ur jede endogene Variable eine erste Stufe gesch¨atzt werden



F¨ ur den Fall mit einer endogenen Variable und einem Instrument entspricht der TSLS-Sch¨ atzer dem einfachen IV-Sch¨ atzer

21 / 28

Messfehlerprobleme und IV-Sch¨atzung



IV-Sch¨atzer k¨onnen auch verwendet werden, um Messfehlerprobleme zu beheben



Wichtigster Fall: Verwendung einer zweiten Messung derselben Variable als IV



Beispiele: Auskunft u unfte durch Besch¨aftigte ¨ber Lohneink¨ und Arbeitgeber, Angabe des Haushaltseinkommens durch beide Ehepartner



Idee: Zweite Messung ist stark korreliert mit der ersten Messung, Messfehler der zwei Messungen sind jedoch unkorreliert

22 / 28

Tests



2 wichtige Tests: 1. Test auf Endogenit¨ at: Ist u ¨berhaupt eine IV-Sch¨atzung erforderlich? Ist der Fehlerterm tats¨achlich mit den x-Variablen korreliert? 2. Test u ¨beridentifizierender Restriktionen: Sind die verwendeten Instrumente exogen?



Beachte: F¨ ur beide Tests ben¨ otigen wir g¨ ultige Instrumente!

23 / 28

Test auf Endogenit¨at 

2-stufiger Test: 1. Regressiere die endogene x-Variable auf alle Instrumente und eingeschlossenen exogenen Variablen und ermittle die Residuen der Regression 2. F¨ uge das Residuum aus der ersten Stufe als zus¨atzlichen Regressor in die Regression ein, sch¨atze die Regression mit OLS und teste auf Signifikanz (t-Test)



Wenn der Koeffizient des Residuums signifikant von Null verschieden ist, liegt Endogenit¨ at vor



Intuition: Die Residuen sind der Teil von x, der potentiell mit u korreliert sein k¨ onnte; ein signifikanter Effekt des Residuums deutet auf eine Korrelation zwischen x und u hin

24 / 28

Test u¨beridentifizierender Restriktionen



Frage: Wie testet man, ob die verwendeten Instrumente die Bedingung der Exogenit¨ at erf¨ ullen?



Gibt es genau so viele Instrumente wie endogene x-Variablen (exakte Identifikation), kann die Exogenit¨at der Instrumente nicht getestet werden



Gibt es mehr Instrumente als endogene x-Variablen ¨ (Uberidentifikation), kann getestet werden, ob die u ussigen Instrumente exogen sind (unter der ¨bersch¨ Annahme, dass die zur Identifikation ben¨ otigten Instrumente g¨ ultig sind, test of overidentifying restrictions)

25 / 28

Test u¨beridentifizierender Restriktionen



Vorgehensweise: 1. Ermittle das Residuum der TSLS-Sch¨atzung 2. Regressiere das Residuum auf alle (eingeschlossenen und ausgeschlossenen) exogenen Variablen und berechne das R 2 3. Teststatistik: n · R 2 ist unter H0 (Exogenit¨at der Instrumente) asymptotisch χ2 -verteilt (Anzahl der Freiheitsgrade = Anzahl der u ¨beridentifizierenden Restriktionen)



Intuition: Unter der Nullhypothese sollte das Residuum (der Sch¨atzer des St¨orterms) mit keiner der exogenen Variablen korreliert sein

26 / 28

Fazit 

Die Instrumentvariablensch¨atzung erm¨ oglicht eine konsistente Sch¨atzung von Parametern, selbst wenn eine Korrelation zwischen den Regressoren und dem Fehlerterm besteht



Aber: IV-Sch¨atzung liefert nur dann zuverl¨assige Ergebnisse, wenn die Instrumente g¨ ultig sind, d. h., wenn sie relevant und exogen sind



Ansonsten ist nicht gew¨ahrleistet, dass die Ergebnisse einer IV-Sch¨atzung zuverl¨assiger sind als die der OLS-Sch¨atzung



Praxis: G¨ ultige Instrumente sind sehr schwer zu finden



Trade-off Verzerrung vs. Effizienz

27 / 28

Programm der n¨achsten Woche



II.5 Instrumentvariablensch¨atzung 



Simultanit¨at: Wooldridge, Kapitel 16

II.6 Dynamisches Panel

28 / 28