Tema 6: Modelos Log-Lineales para tablas de Contingencia

Tema 6: Modelos Log-Lineales para tablas de Contingencia Introducci´ on Habitualmente, se suelen estudiar las tablas de contingencia calculando estad´...

Author: María del Carmen Cordero Ruiz

2 downloads 0 Views 250KB Size

Report

Download PDF

Recommend Documents

Tema 2: Tablas de Contingencia

Tema B6. Tablas de contingencia. Ejemplo

Tablas de contingencia

Tablas de Contingencia

TABLAS DE CONTINGENCIA

TEMA 6. MODELOS DE MERCADO

Tema 4.2: Tablas de Mortalidad

Contrastes de la bondad del ajuste y tablas de contingencia

Tema 9. Modelos de equilibrio de cartera

Tema 10 Modelos de ciclo de equilibrio

Modelos de probabilidad. Modelos de probabilidad. Modelos de probabilidad. Proceso de Bernoulli. Objetivos del tema:

2006 Access Tema 2. Tablas

Tema 4. MODELOS DE DISTRIBUCIONES DISCRETOS

MODELOS DE COMPETENCIA IMPERFECTA TEMA 2: OLIGOPOLIO

Tema 5: Modelos Discretos de Canal

TEMA 5. TIPOS O MODELOS DE MERCADO

Plan de Contingencia. para. Emergencias Externas

TABLAS DE PUNTUACION PARA PRUEBAS COMBINADAS

Tema 1 MODELOS DISCRETOS MATRICIALES

TEMA 3: Probabilidad. Modelos. Probabilidad

Secuencia para trabajar las tablas de multiplicar

Tema 6. Programas nutricionales para el colectivo de ancianos

BASES DE DATOS TEMA 2 MODELOS DE DATOS

Tema 6: Modelos Log-Lineales para tablas de Contingencia Introducci´ on Habitualmente, se suelen estudiar las tablas de contingencia calculando estad´ısticos del tipo χ2 para contrastar independencia entre las variables. Cuando hay m´as variables involucradas, una posibilidad es repetir el an´alisis por pares para las distintas sub-tablas y determinar las interacciones o asociaciones entre las variables. Pero otra alternativa posible es aplicar modelos log–lineales, que son un caso particular de los GLM para datos distribu´ıdos como una distribuci´on multinomial o como una Poisson. Los modelos log–lineales se usan para analizar la relaci´on entre dos, tres o m´as variables categ´oricas en una tabla de contingencia. Todas las variables que se analizan se consideran como variables respuesta, es decir, no se hace distinci´on entre variables independientes y dependientes. Es por ello que en estos modelos solo se estudia asociaci´on entre las variables. Los modelos se representan mediante las frecuencias esperadas y se tienen en cuenta las asociaciones o interacciones entre las variables. Los patrones de asociaci´on entre las variables pueden describirse en t´erminos de los odds y las razones de odds. Se parte de una tabla de contingencia I × J en la que se estudian n individuos. Cuando las respuestas son independientes, las probabilidades conjuntas de cada casilla πij se obtienen como el producto de las marginales de filas y columnas πij = πi+ · π+j para i = 1, . . . , I, j = 1, . . . , J. Las probabilidades πij son los par´ametros de una distribuci´on multinomial, pero los modelos loglineales usan frecuencias esperadas µij = nπij en lugar de las probabilidades πij . Tambi´en se pueden considerar distribuciones de Poisson con valores esperados µij . Asumiendo independencia, se tiene que µij = nπi+ π+j para todo i y j. 1

Modelos loglineales de independencia para tablas de contingencia Dado que µij = nπi+ π+j para todo i y j, si se toman logaritmos: log (µij ) = log(n) + log (πi+ ) + log (π+j ) = Y λ + λX i + λj Y donde se denomina a λX i el efecto fila, λj el efecto columna. Este modelo se denomina

loglineal de independencia. La interpretaci´on de los par´ametros es m´as sencilla para respuestas binarias. Por ejemplo, en el modelo de independencia para una tabla I × 2, donde las columnas corresponden a la respuesta Y , en cada fila i el logit de πi para Y = 1 es µi1 πi = log = log(µi1 ) − log(µi2 ) = log 1 − πi µi2 Y X Y Y Y = λ + λX i + λ1 − λ + λi + λ2 = λ1 − λ2 lo cual no depende de i, es decir, el logit de Y no depende del nivel de X (de la fila), lo que corresponde al caso simple en que logit(πi ) = cte. As´ı, la probabilidad de clasificar algo en una columna particular es constante a lo largo de las filas. Identificabilidad y Restricciones sobre los par´ ametros En una tabla de 2 × 2, por ejemplo, el modelo de independencia especifica 5 par´ametros y por lo tanto es redundante. Como en el caso de los modelos ANOVA, se pueden imponer restricciones para los par´ametros para evitar resundancias entre ellos. Por ejemplo, se puede imponer que para el primer nivel de cada variable el par´ametro sea 0 o bien se puede imponer que la suma de los par´ametros correspondientes a una variable sea 0. Por ejemplo, en una tabla 2 × 2: X λX = 0 1 + λ2

λY1 + λY2

= 0

y se cumple que la diferencia entre dos efectos principales es la misma. Ejemplo Se tiene una muestra de personas en donde se les ha preguntado si cre´ıan en la vida despu´es de la muerte. El n´ umero de personas que respond´ıa s´ı fue 1339 de entre 1639 de raza blanca, 260 de entre 315 de raza de color y 88 de 110 clasificadas como otros. 2

Se usa un modelo loglineal de independencia sobre la correspondiente tabla 3 × 2 y se fija un nidel de los efectos en 0.

Raza