¿Porque paneles? Modelos lineales para datos en paneles

Econometria de Datos en Paneles Walter Sosa-Escudero Universidad de San Andres

Agosto de 2011

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

¿Porque paneles?

Ejemplo (Cronwell y Trumbull): Determinantes del crimen y = g(I), y = crimen, I = variables de justicia criminal. Corte transversal: (yi , Ii ) para varias regiones i = 1, . . . , n I resulta ‘muy importante’ Critica: I capta el efecto de otros efectos regionales, que tambien son determinantes del crimen.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

En terminos econometricos Existe una variable omitida y relacionada positivamente con I. El estimador de MCO que regresa y en I es sesgado (hacia arriba) Solucion? ‘Controlar’ por esta varaible omitida.

Paneles al rescate: una solucion simple sin tener que incorporar nuevas variables

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Datos en paneles

Una base de datos en panel contiene informacion para varios individuos (empresas, paises, etc.) en el tiempo. El aspecto fundamental es esta bidimensionalidad de los datos. Ejemplos: PSID: 6500 familias desde 1968. La EPH tiene una estructura de panel rotativo.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Ventajas

Control de ‘heterogeneidades no observables’ Con N individuos y T periodos podriamos estimar N modelos de series de tiempo y T modelos de corte transversal. Las ventajas de disponer de un panel tienen que ver con la posibilidad de agregar esta informacin de alguna manera. Ejemplo: yit = x0it β + uit Supone que el modelo lineal subyacente es el mismo para todos los individuos y periodos. Mayor informacion sobre un mismo parametro. Mayor eficiencia.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Desventajas

No siempre es posible agregar informacion temporal y de corte transversal (pueden ser ms observaciones pero de poblaciones heterogeneas). Los paneles son costosos de implementar y administrar. Problemas de selectividad: auto-seleccion, no respuesta, ”attrition”. Dimension temporal corta

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

El Modelo El modelo basico es: yit = x0it β + uit uit = µi + δt + it i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variables explicativas, incluyendo una constante. El termino de error incluye tres componentes, que representan las tres posibles fuentes de variabilidad no observable. Supondremos δt = 0 y que it satisface todos los supuestos clasicos.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Caso mas simple: µi = 0

En este caso, uit = it satisface todos los supuestos del teorema de Gauss-Markov: E(it ) = 0  2 σ si i = h y t = s E(it ehs ) = 0 si i 6= h o t 6= s El estimador de MCO es MELI. La estructura de panel no agrega informacion

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

En terminos matriciales Y = Xβ + u YN T ×1 , XN T +×K , apilando las observaciones por individuo, primero ordenadas temporalmente. Entonces: βˆM CO = (X 0 X)−1 X 0 Y

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

El estimador de efectos fijos

yit = x0it β + µi + it Las realizaciones de µi pueden ser estimadas con un panel (no con un corte transversal!). Puede ser visto un modelo lineal en donde cada individuo tiene su propia ordenada al origen: yit = µi + β1 +β2 x2,it + · · · + βK xK,it + it | {z } El modelo se puede estimar usando N − 1 variables binarias por individuo, para evitar la ‘trampa de variables binarias’.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

En terminos matriciales Y = Xβ + Dµ + u Y es N T × 1, X es N T × K, X incluye el intercepto. D es una matriz de N − 1 variables binarias por individuo.  1N

  ≡ 

1 1 .. . 1

   , 



1N

0

···

  Z=  

0 .. .

1N

0 .. .

0

0

···

Walter Sosa-Escudero

0 .. . .. . 1N

      N T ×(N −1)T

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Reescribamos el modelo como: ˙ +u Y = Xβ + Dµ + u = Xδ con X˙ ≡ [X D] y δ ≡ [β 0 µ0 ]0 . Entonces, el estimador de efectos fijos es:   βˆEF ˆ ˙ −1 X˙ 0 Y δEF = = (X˙ 0 X) µ ˆEF que no es otra cosa que un estimador de MCO agregando N − 1 variables binarias por individuo.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Efectos fijos y transformacion ‘within’ Comencemos con el modelo yit = x0it β + µi + it Tomando promedios por individuo: y¯i = x ¯0i β + µi + ¯i Restando yit − y¯i = (xit − xi )0 β + it − ¯i o ∗ yit = xit ∗0 β + ∗it

con m∗it ≡ mit − m ¯ i , m = y, x, . Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Resultado: βˆEF = (X ∗0 X ∗ )−1 X ∗0 Y ∗ (Prueba: Teorema de Frisch,Waugh, Lovell)

Existen dos formas identicas de computar βˆEF . Regresar Y en X y las variables binarias por individuo. βˆEF son los coeficientes estimados para X. En dos pasos: 1) Expresar las variables en desvios con respecto a la media por individuo. 2) MCO en base a estos desvios.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Terminologia:

Modelo within yit − y¯i = (xit − xi )0 β + it − ¯i

Modelo between y¯i = x ¯0i β + µi + ¯i

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Propiedades de βˆEF Es insesgado (X y Dµ son exogenas con respecto a ). Es consistente, cuando N o T → ∞. Importante: la insesgadez y consistencia de βˆEF no presupone que X y Dµ son ortogonales (puede haber correlacion entre X y Dµ

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Efectos fijos y control de heterogeneidades no observables Supongamos que el modelo es yit = x0it β + zi0 δ + µi + it zi no es observable, pero esta correlacionada con xit .

La transformacion within de este modelo es ∗ yit = xit ∗0 β + ∗it

La tranformacion within elimina cualquier variable que no varia en el tiempo (zi y µi ): estimar por efectos fijos permite ‘controlar’ por la presencia de zi . Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Es relevante notar que sin datos de panel, no podriamos haber dado cuenta de zi (que no sea incluyendola en el nodelo. Con datos de corte transversal el modelo es yi = x0i β + zi0 δ + µi + i , de modoe que omitir zi conduce a sesgos. Observar que la tranformacion within es inaplicable (trivialmente cero).

Este es el sentido en el cual la disponibilidad de paneles permite controlar por variables omitidas que no varian en el tiempo.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Una exploracion grafica

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Verbalizacion Y = tasa de criminalidad X = ineficiencia del sistema judicial (mas ineficiente, mas criminalidad). Dos regiones Determinante omitido del crimen, a que varia solo por region y correlacionado (positivamete) con la ineficiencia judicial: densidad poblacional.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

El estimador de efectos aleatorios El modelo es el mismo yit = x0it β + µi + it En terminos matriciales Y = Xβ + Dµ +  Si Dµ es ortogonal a X, y si E(µi |X) = 0, entonces, el estimador de MCO que regresa Y en X es insesgado. Es decir, si Dµ es ortogonal a X, la omision de las variables binarias no sesga al estimador de MCO.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Efectos fijos vs aleatorios

Discusion muy extra˜ na. Es mas una cuestion de tratamiento Y = Xβ + Dµ +  Efectos fijos (controla por Dµ) Y = Xβ + Dµ +  Efectos aleatorios (trata a Dµ como variable omitida) Y = Xβ + Dµ + 

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Y = Xβ + Dµ +  Y = Xβ + u,

u ≡ Dµ + 

Problema: u no satisface los supuestos clasicos, aun cuando Dµ y  por separado lo hagan. Prueba simple: supuestos clasicos por separado (esperanza nula, no correlacion ni heterocedasticidad), ademas, no correlacion entre Dµ y . Entonces V (u) = V (Dµ + ) = DV (µ)D0 + V () = σµ2 + σ2 IN T que no es un escalar por la matriz identidad (los elementos fuera de la diagonal no son cero). Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Intuicion: uit = µi + it Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos ‘comparten’ µi : la presencia permanente de µi hace que la especificacion de efectos aleatorios induzca autocorrelacion. Si bien MCO es insesgado, no es eficiente, por la presencia de autocorrelacion. Eficiente? Minimos cuadrados generalizados.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

MCG para efectos aleatorios Consideremos un modelo lineal basico: Y = X 0β + u en donde valen todos los supuestos clasicos, salvo que: V (u) = Ω Ω es una matriz simetrica y positiva definida (permite, potencialmente, autocorrelacion y heterocedasticidad). Teorema (Aitken): el MELI de β es: βˆM CG = (X 0 Ω−1 X)−1 X 0 Ω−1 Y

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

En nuestro caso V (u) = σµ2 DD0 + σ2 IN T ≡ Ω(θ) con θ0 = (σµ2 , σ2 )0 La implementacion de MCG requiere primero estimar θ (los componentes de varianzas). Estimador de efectos aleatorios: estimador MCG.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Resumen

Y = Xβ + Dµ +  X ⊥ Dµ: MCO, EF, EA y between son todos consistentes parar β. EA es eficiente. X ¬⊥ Dµ: solo EF es consistente para β. La practica gravita mayoritariamente a EF.

Walter Sosa-Escudero

Econometria de Datos en Paneles

¿Porque paneles? Modelos lineales para datos en paneles

Test de Hausman H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ Test de Hausman: bajo H0 H = (βˆEA − βˆEF )0 (ΩEF − ΩEA )−1 (βˆEA − βˆEF ) ∼ χ2 (K) Rechazar si H es significativamente distinto de cero. Intuicion: bajo H0 , βˆEA y βˆEF son consistentes, H deberia ser peque˜ no. Bajo HA , solo βˆEF es consistente, H deberia ser alto. Permitiria, bajo H0 , explotar las ganancias de eficiencia de estimar por EA.

Walter Sosa-Escudero

Econometria de Datos en Paneles