Espacialidad y sus retos

Espacialidad y sus retos Daniel A. Rodríguez, Ph.D. University of North Carolina, Chapel Hill [email protected] www.planning.unc.edu/index.php?option=com...
23 downloads 0 Views 2MB Size
Espacialidad y sus retos Daniel A. Rodríguez, Ph.D. University of North Carolina, Chapel Hill [email protected] www.planning.unc.edu/index.php?option=com_content&view=article&id=51&Itemid=16

Resumen de temas • Introducción a la autocorrelación espacial • Diagnóstico – Visual (variograma, rezagos residuales) – Estadístico (I de Moran, C de Geary, Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial – Modelo de error espacial – Modelo de rezago espacial

1

Relaciones espaciales • Primera ley de la geografía de Tobler – Observaciones que están más cercanas (en el espacio) son más parecidos entre si, que observaciones que están más alejadas

Fuente: Wilson 2008

Autocorrelación espacial • Definición formal – Observaciones exhiben autocorrelación espacial si sabiendo el valor de un parámetro de interés en un sitio permite la predicción del mismo parámetro en otro sitio – Necesitamos información sobre la localización de nuestras observaciones • Geografía importa!

2

Por qué ocurre? 1. Dependencia espacial – Correlación espacial • Lo que explica una observación (la causa) en algún sitio, también explica observaciones en sitios contiguos – Estatus socio-económico, cobertura policial y seguridad

Por qué ocurre? – Causalidad espacial • Algo un algún sitio causa o explica observaciones contiguas – Falta de mantenimiento y seguridad

– Solución: estimar modelos que tengan esto en cuenta

3

Por qué ocurre? 2. Interacción espacial – Cambio de régimen en el espacio (promedio y dispersión varían) • Movimiento de información, personas o bienes explican el fenómeno – Apertura de líneas de transporte masivo y seguridad – Mercado inmobiliario cambia por barrio

– Solución: Utilizar variables tipo dummy para estabilizar el proceso

Ejemplos • • • • •

Seguridad Precios del suelo Calidad de la vivienda Concentración de la pobreza Demanda por vivienda específica – De interés social, de lujo, o nueva

• Calidad ambiental y polución – Muestras de aire y agua

4

Cuál es la consecuencia de la dependencia espacial de datos ? • Supuestos de regresión lineal sobre error • Está distribuido normalmente y es homoskedástico 

Se supone que está distribuido normalmente por el teorema del limite central (porque la variable dependiente “Y” viene de una muestra aleatoria, y el error no está relacionado con ninguna variable independiente) 



Puede generar sesgo en los parámetros (debido a la falta de independencia) y errores estándares pequeños (heteroskedasticidad) Reduce tamaño efectivo de la muestra

Ejemplos teóricos

Fuente: Layne, tomado de Wilson 2008

5

Opciones prácticas • Controlar por el efecto que genera la autocorrelación espacial – Econometría espacial

• Evitarlo – Diseño muestral

Resumen de temas • Introducción a la autocorrelación espacial • Diagnóstico – Visual (variograma, rezagos residuales) – Estadístico (I de Moran, C de Geary, Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial – Modelo de error espacial – Modelo de rezago espacial

6

Cómo se diagnostica? • Visualmente, inspeccionando residuales – Variograma – Gráficas de residuos contra los propios datos pero desplazados (o rezagados) en el espacio

• Tests estadísticos de los residuales – I de Moran – Tests de multiplicadores de Lagrange (LM) robustos

Variograma • Se calcula para los residuales de una regresión lineal (Y-Yhat) – También se puede calcular para la variable dependiente (Y) y variables independientes (X) si se quiere como método descriptivo

• Para un rango del rezago h, el variograma se define como la diferencia media cuadrada de los valores que tienen una separación dentro de ese rango

7

Rezagos espaciales • Un rezago espacial es una variable que promedia los valores de observaciones vecinas – Valor de cada vecina es multiplicado por un peso y el producto sumado – El rango h en el variograma define cuales observaciones vecinas se tienen en cuenta

Matriz de proximidad • Es una función que define como están distanciados espacialmente los datos – Clave para la estimación de rezagos espaciales • Suponga que tiene 6 observaciones, y sabe sus localizaciones en el espacio (lat y long) 1 2 4 5 3

6

• La manera mas sencilla de mostrar distancias es con una tabla de 6 x 6 (también llamada matriz)

8

Matriz de proximidad ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

• Resume 30 pares de puntos (6 x 5) • Distancia entre una observación y ella misma es 0 • Es una tabla o matriz simétrica • Se usa para construir los rezagos

Matriz de proximidad ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

• Definamos rezagos h (arbitrarios), y contemos cuantos pares hay para cada h h

# de pares 

0‐5

6

5‐10

10

10‐15

14

9

Variograma • Para un rango de rezago h, el variograma se define como la diferencia media cuadrada de los valores que están separados en ese rango – Usualmente para valores estandarizados (normal estándar)

h 0‐5 5‐10 10‐15

Promedio de  diferencias

# de pares  6 10 14

2 8 9

Variograma • Se grafica h (eje X) contra el promedio de diferencias (eje Y)

Valor Gama

Variograma empirical del residuales

1.8 1.6 1.4 1.2 1 0.8 0.6 0.4 0.2 0

Umbral o “sill”

RANGO

0

1

2

3

4

5

6

7

8

Distancia (km)

10

Variograma –otro ejemplo

Fuente: SAS

Gráficas de residuales • Recorderis: Gráficas de residuos vs. Xs para detectar heteroskedasticidad • Sugerencia es similar aquí  utilizar residuales para diagnosticar problema • Residuales vs. residuales rezagados – Es decir graficar el valor de cada residual i vs. un valor promedio de residuales vecinos

11

Ejemplo: grafica de residuales

Matriz de contigüidad ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

• Matriz de contigüidad – Definamos con un 1 los rezagos si los vecinos están a una distancia h de 3km o menos, o sino 0

12

Matriz de contigüidad ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

• Definamos con un 1 los rezagos si los vecinos están a una distancia h de 7km o menos, o sino 0

Matriz de contigüidad • Hay otras maneras de definir contigüidad – 1/Distancia ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

13

Matriz de contigüidad • Hay otras maneras de definir contigüidad – 1/Distancia2 ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

Matriz de contigüidad • Hay otras maneras de definir contigüidad – K-vecinos mas cercanos ID

1

2

3

4

5

6

1

0

11.72

12.38

11.26

9.37

12.23

2

11.72

0.00

1.33

6.99

13.24

1.12

3

12.38

1.33

0

6.18

12.93

0.22

4

11.26

6.99

6.18

0

7.53

6.27

5

9.37

13.24

12.93

7.53

0

12.94

6

12.23

1.12

0.22

6.27

12.94

0

14

Grafica de residuales Normal estandar de los residuales

Matriz de contiguidad, banda de 7km

Matriz de contiguidad estandarizada, banda de 7km

• Objetivo: crear rezago de residuales, con la matriz de contigüidad estandarizada y los residuales – Multiplicar cada residual i por la fila i de la matriz de contigüidad estandarizada

Grafica de residuales

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

• Para observación 1: 1.2187*0 + -0.355*0 + 1.0236*0 + 0.3859*0 + -0.239*0 + -.9585*0 = 0

15

Grafica de residuales

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

• Observación 2: 1.2187*0 + -0.355*0 + 1.0236*0.33 + 0.3859*0.33 + -0.239*0 + .9585*0.33 = 0.789

Grafica de residuales

Normal estandar de los residuales

Matriz de contiguidad estandarizada, banda de 7km

• Observación 3: 1.2187*0 + -0.355*0.33 + 1.0236*0 + 0.3859*0.33 + -0.239*0 + .9585*0.33 = 0.33

16

Grafica de residuales

Ejemplo: grafica de residuales

17

Ejemplo: grafica de residuales

Repetir mismo ejercicio pero con un rezago de banda de 5km Matriz de contiguidad estandarizada, banda de 5km

18

Resumen de temas • Introducción a la autocorrelación espacial • Diagnóstico – Visual (variograma, rezagos residuales) – Estadístico (I de Moran, C de Geary, Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial – Modelo de error espacial – Modelo de rezago espacial

Tests estadísticos para diagnosticar autocorrelación espacial • I de Moran para los residuales – Valores entre 1 y -1 – 1 significa autocorrelación positiva • Valores cercanos similares

– -1 significa autocorrelación negativa • Valores lejanos similares

– 0 significa que no hay autocorrelación

19

Tests estadísticos para diagnosticar autocorrelación espacial • I de Moran para los residuales – Tests global de autocorrelación – Calculado con software (stata, SAS, GeoDa, Matlab) – Significancia estadística determinada en relación a una distribución aleatoria hipotética • Qué tan desviada está nuestra muestra en comparación a una que no tiene autocorrelación espacial? Fotheringham, A. S., C. Brunsdon, and M. Charlton. 2000. Quantitative Geography: Perspectives on Spatial Data Analysis. London, UK: Sage.

Tests estadísticos para diagnosticar autocorrelación espacial • C de Geary para los residuales – Valores entre 0 y 2 – 1 significa que no hay autocorrelación espacial – Mayor que 1 indica autocorrelación positiva – Menor que 1 indica autocorrelación negativa Geary, R. 1954. The contiguity ratio and statistical mapping. The Incorporated Statistician 5: 115–145.

20

Tests estadísticos para diagnosticar autocorrelación espacial • Tests de multiplicadores de Lagrange – Robustos y no robustos – Sugiero utilización de los tests robustos • En Stata, GeoDA, R • Determinan qué tipo de ecuación espacial se debe utilizar

Anselin, L., A. K. Bera, R. Florax, and M. J. Yoon. 1996. Simple diagnostic tests for spatial dependence. Regional Science and Urban Economics 26: 77–104

Resumen de temas • Introducción a la autocorrelación espacial • Diagnóstico – Visual (variograma, rezagos residuales) – Estadístico (I de Moran, C de Geary, Multiplicadores de Lagrange)

• Opciones para incorporar autocorrelación espacial – Modelo de error espacial – Modelo de rezago espacial

21

Pasos a seguir Estimar modelo mínimos cuadrados

Diagnosticar multicolinealidad, heteroskedasticidad y dependencia espacial

Si es necesario, usar econometria espacial

Pasos para diagnosticar y remediar autocorrelación espacial

Fuente: GeoDA Workbook

22

Ejemplo • Información de ciudad de Columbus, Ohio – Seguridad f(ingresos y valor de propiedad) • Seguridad (hurtos vehiculares y robos a viviendas por 1000 residentes)

Diagnóstico de residuales • Pedazo de matriz de contigüidad, estandarizada

23

Ejemplo • Descripción espacial de variables

Ejemplo • Diagnóstico de autocorrelación

24

Si hay autocorrelación, qué hacer? • Dos posibilidades – Modelo de error espacial – Modelo de rezago espacial

Modelo de error espacial

• W es una matriz espacial de pesos (o de contigüidad, estandarizada) • Error f(error vecinos) • Implica que el error estándar estimado es mas bajo de lo que realmente es – Sesgo a mostrar significancia, cuando no la hay

25

Modelo de rezago espacial • W es una matriz espacial de pesos (o de contigüidad, estandarizada) • Implicaciones – Posible sesgo en coeficientes estimados (en cualquier dirección –no se sabe a priori) – El error estándar estimado puede ser mas bajo de lo que realmente es (sesgo a mostrar significancia, cuando no la hay)

De nuevo el ejemplo de la seguridad en Columbus • Diagnóstico de autocorrelación

26

Ejemplo

Ejemplo -comparación

27

Ejemplo --Bogotá • Examinar efecto de expansiones del BRT en propiedades que ya tenían acceso al BRT • Efecto de red, o indirecto • Economía urbana sugiere que las mejoras en accesibilidad se capitalizan en el valor del suelo

Efectos de red

28

Bogotá Troncal, Fase 1 (12/99)

Transmilenio: Avenida Caracas Fuente: TransMilenio S.A.

Bogotá Troncal, Fase 2 –Av. Americas (02/03)

Transmilenio: Avenida de Las Americas Fuente: TransMilenio S.A.

29

Datos • Incluir propiedades residenciales a 1 km del troncal • 2,976 propiedades residenciales en venta entre 2000 & 2006 • Variable dependiente, precio al que se ofrece

Variables independientes de interés

Con servicio de troncal a 1km?

Atributos Estructurales

Atributos de Vecindarios

Año de venta (variables dummy, 0106)

Seis variables dummy: = 1 si predio tenía troncal antes de 2003 y fue anunciado en el año 200X

Controles

= 0 si no

30

Datos • Incluir propiedades residenciales a 1 km del troncal • 2,976 propiedades residenciales en venta entre 2000 & 2006 • Variable dependiente, precio al que se ofrece

Resultados OJO: Hacer doble click en tabla para mirarla en WORD

31

Anuncio extension

Inauguración extension

Anuncio extension

Inauguración extension

32

Libros recomendados • Anselin, L. 1988. Spatial Econometrics: Methods and Models. Dordrecht: Kluwer Academic. • Bivand, R.S., E.J. Pebesma, and V. Gómez-Rubio. 2008. Applied spatial data analysis with R. New York, NY: Springer.

33