STATGRAPHICS – Rev. 9/14/2006

Tablas de Contingencia Resumen El procedimiento Tablas de Contingencia esta diseñado para analizar y mostrar datos de frecuencia contenidos en tablas cruzadas. Tales datos son frecuentemente coleccionados como el resultado de un examen. Estadísticas son construidas para cuantificar el grado de asociación entre filas y columnas, y pruebas son corridas para determinar si hay o no una dependencia estadística significante entre la clasificación de las filas y la clasificación de las. Las frecuencias son desplegadas ambas en forma tabular y gráficamente como un diagrama de barras, grafico de mosaico, o diagrama tridimensional. Para datos que aun no han sido tabulados, use el procedimiento Tabulación Cruzada, el cual crea salidas similares de los datos de respuesta.

Ejemplo StatFolio: contingency.sgp Datos del Ejemplo: El archivo opinion.sf6 contiene los resultados de un sondeo de opinión para n = 200 personas, 107 hombres y 93 mujeres, se les pidió expresar su opinión acerca de si estaban de acuerdo o no con una declaración. La tabla de abajo muestra los resultados de esta encuesta: Response (Respuesta) Totalmente en Desacuerdo Desacuerdo Sin Opinión Acuerdo Totalmente en acuerdo

© 2005 por StatPoint, Inc.

Men (Hombre) 5 20 12 50 20

Women (Mujer) 17 28 3 35 10

Tablas de Contingencia - 1

STATGRAPHICS – Rev. 9/14/2006

Entrada de Datos La caja de dialogo de entrada especifica las columnas que contienen los datos en la tabla.



Columnas: Dos o más columnas numéricas correspondiendo a las columnas de la tabla.



Etiquetas: Etiquetas opcionales que serán asignadas a cada fila de la tabla. Las etiquetas de las columnas son automáticamente generadas de los nombres de las columnas.



Puntuación de Filas: Columna numérica opcional con puntuaciones asociados a cada fila o fila. Estas puntuaciones son usadas cuando se generan ciertas estadísticas de resumen y pruebas. Si no se especifican, las puntuaciones filas serán construidos automáticamente usando un algoritmo basado en su orden y los totales de la fila.



Puntuación de Columnas: Columna numérica opcional con puntuaciones que son asociados con cada columna. Si no se especifican, las puntuaciones de columna serán construidos automáticamente usando un algoritmo basado en su orden y los totales de la columna.



Selección: Selección de un subconjunto de los datos.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 2

STATGRAPHICS – Rev. 9/14/2006

Resumen del Análisis El Resumen del Análisis muestra el número de filas y columnas, tan bien como la suma de las frecuencias en todas las celdas de la tabla. Tablas de Contingencia Column variables: Men Women Número de Observaciones: 200 Número de filas: 5 Número de columnas: 2

Tabla de Frecuencias La Tabla de Frecuencias muestra la frecuencia de ocurrencia de cada par de valores en las variables filas y columnas, junto con otra información como se definió en la caja de dialogo Opciones del Panel. Tabla de Frecuencias Men 5 2.50% Disagree 20 10.00% No opinion 12 6.00% Agree 50 25.00% Agree strongly 20 10.00% Total por Columna 107 53.50% Contenido de las celdas: Frecuencia Observada Porcentaje de la tabla Disagree strongly

Women 17 8.50% 28 14.00% 3 1.50% 35 17.50% 10 5.00% 93 46.50%

Total por Fila 22 11.00% 48 24.00% 15 7.50% 85 42.50% 30 15.00% 200 100.00%

La muestra consiste de r = 5 filas por c = 2 columnas. Incluidos en la tabla están: •

Frecuencia Observada: Las celdas en la parte principal de la tabla contienen Oij, la frecuencia introducida por el fila i y la columna j.



Porcentaje de la Tabla: Debajo de las celdas de frecuencias están los porcentajes que cada celda representa de la tabla completa.



Total de Filas: La columna de hasta la derecha contiene los totales de los filas Ri: c

Ri = ∑ Oij

(1)

j =1



Total de Columnas: el fila de hasta abajo contiene el total de las columnas Cj:

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 3

STATGRAPHICS – Rev. 9/14/2006 r

C j = ∑ Oij

(2)

i =1



Total de la Tabla : La esquina inferior derecha contiene la suma de todas las frecuencias: r

c

n = ∑∑ Oij

(3)

i =1 j =1

Por ejemplo, 5 hombres “Están en desacuerdo fuertemente” con la declaración que se les propuso.

Opciones del Panel Información adicional puede ser adherida a cada celda de la tabla usando Opciones del Panel :



Porcentajes de la Tabla: El porcentaje de cada celda es con respecto a el total de toda la tabla, definido por 100



n

%

(4)

Porcentajes de Fila: El porcentaje de cada celda es con respecto a su fila y es definido por 100



Oij

Oij Ri

%

(5)

Porcentajes de Columna: El porcentaje de cada celda es con respecto a su columna y es definido por Oij (6) 100 % Cj

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 4



STATGRAPHICS – Rev. 9/14/2006 Frecuencia Esperada: Eij, el numero esperado de veces que el fila i habría aparecido junto con la columna j en le archivo de datos si las clasificaciones del fila y la columna fueron independientes: Eij =



Ri C j

(7)

n

Desviaciones: La diferencia entre lo esperado y las frecuencias esperadas:

Oij − Eij •

(8)

Valores Chi-Cuadrada: La contribución de cada celda a la estadística chi-cuadrada, usada para probar independencia entre los filas y las columnas:

(O

ij

− Eij )

2

(9)

Eij •

Residuos Ajustados: Una forma de estandarizar residuos calculados dividiendo cada desviación de la celda por un estimador de su error estándar:

ε ij =

(O

ij

− Eij )

⎛ R ⎞⎛ C j E ij ⎜1 − i ⎟⎜⎜1 − n ⎠⎝ n ⎝

(10)

⎞ ⎟⎟ ⎠

Ejemplo – Información adicional sobre hombre-totalmente en acuerdo Tabla de Frecuencias Men Women Agree strongly 20 10 10.00% 5.00% 66.67% 33.33% 18.69% 10.75% 16.05 13.95 3.95 -3.95 0.97 1.12 1.57 -1.57 Total por Columna 107 93 53.50% 46.50% Contenido de las celdas: Frecuencia Observada Porcentaje de la tabla Porcentaje de la fila Porcentaje de la columna Fecuencia Esperada Frecuencia Observada - experada Contribución a la chi-cuadrada Residuos Ajustados

Total por Fila 30 15.00%

200 100.00%

De los 20 hombres que respondieron estar totalmente de acuerdo: © 2005 por StatPoint, Inc.

Tablas de Contingencia - 5

STATGRAPHICS – Rev. 9/14/2006 10.00% de el total de n = 200 entrevistados 66.67% de todos los 30 hombres que están totalmente de acuerdo 18.69% de todos los 107 hombres Las clasificaciones de los filas y columnas fueron independientes, el número esperado de hombre quienes están totalmente de acuerdo es 16.05, para una desviación de 13.95. En los cálculos de la estadística de prueba Chi-cuadrada, descrita abajo, estas celdas adhieren un total de 0.97 a esta estadística 0.97. Los residuales ajustados indican que es numero observado de entrevistados en esta celda es de 1.57 desviaciones estándar de su valor esperado.

Diagrama de Barras Una manera común para mostrar los datos es usando un diagrama de barras múltiple. Diagrama de Barras

Men Women

Disagree strongly Disagree No opinion Agree Agree strongly 0

10

20

30

40

50

frecuencia

La altura de cada barra en la grafica anterior representa el número de entrevistados en cada celda de la tabla.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 6

STATGRAPHICS – Rev. 9/14/2006 Opciones del Panel



Tipo de Grafico: Las barras pueden estar conglomeradas como se muestra en el ejemplo o apiladas una sobre otra.



Escala: Si la escala del eje muestra las frecuencias Oij o el porcentaje dado por

pij = 100

Oij n

%



Dirección: Si las barras se extienden horizontal o verticalmente.\



Línea Base: El valor sobre el cual las barras se extienden.

© 2005 por StatPoint, Inc.

(11)

Tablas de Contingencia - 7

STATGRAPHICS – Rev. 9/14/2006 Ejemplo – Diagrama de barras apiladas horizontal por porcentaje Diagrama de Barras 50 Men Women

porcentaje

40 30 20 10 0 Disagree strongly Disagree

No opinion

Agree

Agree strongly

Ejemplo – Diagrama de barras conglomeradas con una línea base de 5% Diagrama de Barras 50 Men Women

frecuencia

40 30 20 10 0 Disagree strongly Disagree

© 2005 por StatPoint, Inc.

No opinion

Agree

Agree strongly

Tablas de Contingencia - 8

STATGRAPHICS – Rev. 9/14/2006

Grafico de Mosaico Una interesante variación del diagrama de barras es si lo ancho y la altura de cada barra son escalados para representar las frecuencias de las celdas con entrevistados en la tabla. Gráfico de Mosaicos Disagree strongly Disagree

Men Women

No opinion

Agree

Agree strongly

En este grafico el tamaño de cada fila es proporcional a su total de fila Ri. El ancho de cada barra dentro de cada fila es proporcional a la frecuencia de cada celda dentro de esa fila. Esto resulta en barras cuyas áreas son proporcionales a la frecuencia en una celda particular. En los datos del ejemplo, la barra mas grande corresponde a hombres que respondieron “Acuerdo”.

Opciones del Panel



Dirección: la orientación de las barras.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 9

STATGRAPHICS – Rev. 9/14/2006

Diagrama Tridimensional Todas las celdas de frecuencias pueden también ser representadas usando barras verticales.

Gráfico de Rascacielos

50

30 20 10 Men Agree strongly

Agree

No opinion

Women Disagree

0

Disagree strongly

frecuencia

40

Opciones del Panel



Gráfico: escalando para el eje vertical.

Pruebas de Independencia Una pregunta común acerca de los datos en una tabla es si los filas y columnas son o no independientes, es decir el hecho que un objeto caiga en un fila particular no afecta la probabilidad de que caiga en una columna dada. En el ejemplo actual. Independencia implicaría que ambos géneros responden similarmente a la declaración propuesta. STATGRAPHICS puede realizar cualquiera de 5 pruebas diferentes, dependiendo de lo fijado en la caja de dialogo Opciones del Panel. Cada una de las pruebas sigue las siguientes hipótesis: Hipótesis Nula: las clasificaciones de las columnas y filas son independientes Hipótesis Alt.: las clasificaciones de las columnas y filas no son independientes

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 10

STATGRAPHICS – Rev. 9/14/2006 Asociada a cada prueba esta un P-Valor. P-valores pequeños (menos que 0.05 si se esta operando en un nivel de confianza de 5%) permiten rechazar la hipótesis nula, implicando una dependencia significante entre las columnas y los filas.

Prueba Chi-cuadrada La prueba mas común para independencia es la prueba chi-cuadrada. Esta prueba compara las frecuencias esperadas y observadas calculando: r

c

χ = ∑∑ 2

(O

− Eij )

2

ij

(12)

Eij

i =1 j =1

STATGRAPHICS despliega los resultados de esta prueba y su correspondiente P-valor: Pruebas de Independencia Prueba Estadístico Chi-Cuadrada 18.369

Gl 4

Valor-P 0.0010

El P-valor es calculando comparando la estadística de prueba a una chi-cuadrada con (r-1)(c-1) grados de libertad. P-valores pequeños (menos de 0.05 si se opera en un nivel de confianza de 95%) indican una dependencia significativa entre las filas y columnas. El P-Valor en la tabla anterior claramente muestra que el tipo de auto y el número de pasajeros que transportan no son independientes. Si el valor esperado Eij en cualquier celda es menor que 5, una advertencia será desplegada. En tales casos, el cálculo de la estadística Chi-cuadrada puede no estar bien representada por una distribución chi-cuadrada. Es particularmente serio si cualquier valor esperado es menor que 2. Cuando esto ocurre, se debería reconsiderar combinar clases que no contienen muchos datos. Prueba de Razón de Verosimilitud Una prueba alternativa a la chi-cuadrada es la prueba de razón de verosimilitud. Esta estadística de prueba esta dada por (para este caso) r c ⎛ Oij G 2 = 2∑∑ Oij log⎜ ⎜E i =1 j =1 ⎝ ij

Pruebas de Independencia Prueba Estadístico Razón de Verosimilitud 19.116

⎞ ⎟ ⎟ ⎠

(13)

Gl 4

Valor-P 0.0007

Esta estadística también es comparada con una distribución chi-cuadrada con (r-1)(c-1) grados de libertad.

Chi-cuadrada con corrección Yates En el caso de tablas de dos por dos solamente, una versión modificada de la prueba chi-cuadrada puede ser realizada usando la corrección de Yates para continuidad:

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 11

r

c

χ 2 = ∑∑

(O

ij

− Eij − 0.5

STATGRAPHICS – Rev. 9/14/2006

)

2

(14)

Eij

i =1 j =1

Por ejemplo, suponga que los resultados de la encuesta fueron condensados a una tabla de 2 por 2 combinando clases como sigue: Respuesta Hombre Acuerdo o 70 totalmente en acuerdo Desacuerdo o 25 totalmente en desacuerdo

Mujer 45

45

La prueba podría entonces ser aplicada, con los siguientes resultados. Pruebas de Independencia Prueba Chi-cuadrada con corrección de Yates

Estadístico 10.038

Gl 1

Valor-P 0.0015

La estadística de prueba es comparada con una distribución chi-cuadrada con 1 grado de libertad. Una vez más, el resultado es altamente significante.

Prueba Exacta de Fisher Para tablas de 2 por 2 en las cuales la suma de los conteos n no excede 100, la prueba de exacta de Fisher puede ser realizada. Ambas pruebas de dos colas (en cuál no se especifica la dirección de la asociación por adelantado) y una prueba de una cola (en la cual el investigador espera una asociación en una dirección particular) es realizada. Una salida típica de esta prueba es mostrada abajo: Pruebas de Independencia Prueba Prueba Fisher de exactitud

Valor-P Unilateral 0.0138

Valor-P Bilateral 0.0185

Para una prueba de dos colas, el P-valor es calculado sumando las probabilidades hipergeométricas de todas las tablas posibles con los mismos totales de filas y columnas como la tabla observada, y cuyas probabilidades sean menores o iguales que la tabla observada. Para una prueba de una cola, el P-valor es calculado sumando las probabilidades de todas las tablas en las cuales la frecuencia O1,1 es menor o igual que la de la tabla observada . (Nota: si es necesario las columnas y filas son reordenado tal que O1,1 sea la frecuencia mas pequeña en la tabla antes de que el P-valor de una cola sea calculado).

Prueba de Tendencia Lineal Si ambas columnas y filas son ordinales, i.e., tienen un orden natural, entonces una prueba puede ser corrida para determinar si existe o no una tendencia significante dentro de la tabla. La prueba es realizada primero definiendo puntuaciones para cada categoría. Para los datos del ejemplo, las puntuaciones podrían ser definidas como: © 2005 por StatPoint, Inc.

Tablas de Contingencia - 12

STATGRAPHICS – Rev. 9/14/2006 Respuesta Totalmente en Desacuerdo Desacuerdo Sin Opinión Acuerdo Totalmente en acuerdo Género Hombre Mujer

Puntuación -2 -1 0 1 2

Puntuación 1 2

Dadas los puntuaciones filas u1 ≤ u2 ≤ … ≤ ur y las puntuaciones columnas v1 ≤ v2 ≤ … ≤ vc, la suma de los productos cruzados es dada por r

c

T = ∑∑ u i v j Oij

(15)

i =1 j =1

El resultado es estandarizado para crear una correlación r sobre una escala de –1 a 1. La correlación más grande, es la relación lineal más fuerte entre las columnas y filas. Para probar la hipótesis de independencia, la prueba estadística M 2 = (n − 1)r 2

(16)

es comparada con una distribución chi-cuadrada con 1 grado de libertad. La salida de la prueba en los datos del ejemplo es mostrada abajo:

Pruebas de Independencia Prueba Prueba de Tendencia Lineal Puntuación Fila Disagree strongly Disagree No opinion Agree Agree strongly

Correlación -0.2481

Puntuación -2.0 -1.0 0.0 1.0 2.0

Columna Men Women

Valor-P 0.0005

Puntuación 1.0 2.0

La tabla muestra: •

Correlación – El valor calculado de r. Una correlación negativa tal como la observada anteriormente indica una asociación negativa entre las puntuaciones. En la tabla de la muestra, mujeres, quienes han estado dando arbitrariamente la más alta puntuación, tienden a acordar menos con la declaración.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 13





STATGRAPHICS – Rev. 9/14/2006 Valor-P – Prueba la significancia estadística de la correlación comparando una versión normalizada de la estadística de prueba con una distribución chi-cuadrada con un grado de libertad. Detalles pueden ser encontrados en Agresti (2002). Puntuación – Las puntuaciones para cada categoría.

Los datos de la muestra exhiben una correlación altamente significante. Opciones del Panel



Prueba – el tipo de prueba que será realizada.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 14

STATGRAPHICS – Rev. 9/14/2006

Resumen Estadístico Varias estadísticas pueden también ser calculadas midiendo los grados de asociación entre filas y columnas. Resúmen Estadístico Estadístico Lambda Coef. de Incertidumbre Somer's D Eta

Simétrico 0.0962 0.0451 -0.2100

Estadístico Coef. De Contingencia Cramer's V Gamma Condicional Pearson's R Kendall's Tau b Kendall's Tau c

Valor 0.2900 0.3031 -0.3497 -0.2337 -0.2136 -0.2560

Con Filas Dependientes 0.0000 0.0335 -0.2573 0.2337

Con Columnas Dependientes 0.2151 0.0692 -0.1774 0.3031

Valor-P

Gl

0.0009 0.0010

198

Las siguientes estadísticas son calculadas: •

Lambda - Una escala de 0 a 1, esta estadística mide la relativa mejora en predecir columnas de filas o viceversa. En el ejemplo anterior, conociendo la respuesta nos ayuda a predecir el género respondiente, pero conociendo el género respondiente no nos ayuda a predecir la respuesta (ya que el más grande porcentaje de hombres y mujeres están en el fila “Acuerdo”).



Coeficiente de Incertidumbre - Una escala de 0 a 1, esta estadística mide la reducción proporcional en la incertidumbre sobre los valores de la variable fila o columna conociendo la otra. En el ejemplo, la reducción en incertidumbre es alrededor de 4.5%.



Somer’s D - Esta estadística varia de -1 a +1 y es basada en el numero de pares de observaciones concordantes o discordantes. Un par concordante es en el cual las dos variables (fila y columna) tienen el mismo ranking relativo (mas grande que o menos que). Un par discordante es aquel en el que las dos variables tienen ranking opuesto. Una variable (fila y columna) se considera independiente, mientras que la otra es considerada ser una variable dependiente. Ambas variables deben ser ordinales. Una corrección es hecha para ambas en la variable dependiente. En este caso, la asociación es negativa.



Eta - Esta estadística varía de -1 a +1. Cuando es cuadrada, Eta representa la proporción de variación en la variable dependiente que puede ser explicada por conocimiento de la variable independiente. Esto es apropiado solamente cuando la variable dependiente es de tipo intervalo y la variable independiente es nominal u ordinal. Cuando realizamos una tabulación cruzada de los datos numéricos, Yi es igual al valor numérico asignado a la columna o fila dependiente. De otra manera, Yi es igual al número de columna o fila. Ya que ninguna fila o columna corresponde a una variable de intervalo en el ejemplo actual, esta estadística no significa nada.



Coeficiente de Contingencia- Esta estadística mide el grado se asociación entre los valores de las variables fila y columna en una escala de 0 a 1, es basada en la prueba estadística usual chi-cuadrada. Esta no puede en general alcanzar el valor 1 para todas las tablas.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 15

STATGRAPHICS – Rev. 9/14/2006 •

Cramer’s V - Esta estadística mide el grado de asociación entre los valores de las variables fila y columna en una escala de 0 a 1, es basada en la prueba estadística usual chi-cuadrada. A diferencia de la estadística coeficiente de contingencia, esta puede alcanzar el valor 1 para todas las tablas.



Gamma Condicional - Esta estadística varía de -1 a +1 y es basada en el número de pares concordantes y discordantes. Ambas variables deben de ser ordinales. Ninguna corrección es hecha para ambas.



R de Pearson- - Esta estadística mide el grado se asociación entre los valores de las variables fila y columna usando el coeficiente de correlación ordinario. Esta estadística varía de -1 a +1 y es relevante solamente si ambas variables son del tipo intervalo. Valores de filas y columnas son asignadas a cada observación en una forma similar a la descrita para la estadística eta. Si n > 2 y |R| no es igual a 1, un P-valor es probado para probar la hipótesis nula de que la correlación es igual a 0.



Tau b de Kendall - Esta estadística varia de -1 a +1 y es basada en el numero de pares concordantes y discordantes, donde 1 corresponde a una concordancia completa y -1 corresponde a un desacuerdo completo. Ambas variables deben ser ordinales. Una corrección es hecha para los lazos por pares.



Tau c de Kendall - Esta estadística es similar a tau b de Kendall excepto en su manejo de los lazos.

Note que no todas las estadísticas son relevantes para todos los tipos de datos.

Razón de Momios Una manera usual de observar tablas de 2 por 2 cuando un factor corresponde a la ocurrencia o a la no ocurrencia de evento es a través de la razón de momios o riesgo relevante del evento. Por ejemplo, Agresti (2002) presenta los siguientes datos de un estudio la efectividad de la aspirina en la prevención de ataques al corazón: Tratamiento Placebo Aspirina

Ataque del corazón No Ataque del corazón 189 10,845 104 10,933

La tabla muéstralos resultados de un estudio de n = 22,071 individuos. Para esta tabla, STATGRAPHICS genera la siguiente salida: Momios y Riesgo Relativo Momios Numerador Denominador Aspirina Placebo

Momios 0.545835

95% LCI 0.429041

95% LCS 0.694424

Los momios de un evento son definidos como la probabilidad de un evento dividida por la probabilidad de que el evento no ocurra En los datos del ejemplo, los momios de tener un ataque al corazón como una función del tratamiento que fue dado, son estimados: © 2005 por StatPoint, Inc.

Tablas de Contingencia - 16

STATGRAPHICS – Rev. 9/14/2006 Placebo:

n11 189 = = 0.01743 n12 10,845

(17)

Aspirin:

n21 104 = = 0.00951 n 22 10,933

(18)

La razón de momios es la razón de estos dos números:

θˆ =

n11 n 22 = 1.832 n12 n 21

(19)

Esto implica que los momios de un ataque al corazón son de alrededor de un 83% mas alto para aquellos que tomaron el placebo que la aspirina. STATGRAPHICS también muestra un intervalo de confianza para la razón de momios, calculado del logaritmo inverso de: log θˆ ± zα / 2

1 1 1 1 + + + n11 n12 n21 n22

(20)

En los datos del ejemplo, ya que el intervalo de confianza del 95% esta completamente encima de 1, nosotros podemos establecer con 95% de confianza que el momio de un ataque al corazón para aquellos que tomaron placebo es más grande que el momio para los que tomaron aspirina. Opciones del Panel



Desplegar: Si se muestra la razón de momios o el riesgo relativo del evento.



Fila para denominador: De las 2 filas, cual fila debería ser usado como el denominador de la razón.



Nivel de Confianza: el porcentaje que será usado para el nivel del intervalo de confianza.

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 17

STATGRAPHICS – Rev. 9/14/2006 Ejemplo: Riesgo Relativo En lugar de usar la razón de momios, la verosimilitud de un evento puede ser comparada usando el riesgo estimado. Por ejemplo, el riego o probabilidad estimada de un ataque al corazón para los dos grupos es: Placebo: pˆ 1 =

n11 189 = = 0.01713 n11 + n12 11,034

(21)

Aspirin: pˆ 2 =

n21 104 = = 0.00942 n21 + n22 11,037

(22)

La razón de estas dos cantidades es llamada riesgo relativo: r=

pˆ 1 0.01713 = = 1.82 pˆ 2 0.00942

(23)

STATGRAPHICS muestra este estimador junto con un intervalo de confianza: Momios y Riesgo Relativo Riesgo Relativo Numerador Denominador Placebo Aspirina

Riesgo Relativo 1.8178

95% LCI 1.43303

95% LCS 2.30589

El intervalo de confianza es basado en: log r ± zα / 2

1 − pˆ 1 1 − pˆ 2 + pˆ 1 (n11 + n12 ) pˆ 2 (n21 + n 22 )

© 2005 por StatPoint, Inc.

(24)

Tablas de Contingencia - 18

STATGRAPHICS – Rev. 9/14/2006 Cálculos Lambda ⎛ c ⎞ ⎜ ∑ O* j − R* ⎟ ⎜ ⎟ j =1 ⎝ ⎠ Filas dependientes: λ = n − R*

(25)

⎞ ⎛ r ⎜ ∑ Oi* − C* ⎟ ⎠ Columnas dependientes: λ = ⎝ i =1 n − C*

(26)

r ⎛ c ⎞ ⎜ ∑ O* j + ∑ Oi* − R* − C* ⎟ ⎜ ⎟ j =1 i =1 ⎝ ⎠ Simetría: λ = 2n − R* − C*

(27)

donde

Oi* =frecuencia mas grande en la fila i O*j = frecuencia mas grande en la columna j R* = fila mas grande total C* = columna mas grande total

Coeficiente de Incertidumbre

Filas dependientes: U =

U ( X ) + U (Y ) − U ( XY ) U(X )

Columnas dependientes: U =

U ( X ) + U (Y ) − U ( XY ) U (Y )

⎡U ( X ) + U (Y ) − U ( XY ) ⎤ Simetría: U = 2⎢ ⎥ U ( X ) + U (Y ) ⎣ ⎦

(28)

(29)

(30)

donde r

U ( X ) = −∑ i =1

c

U (Y ) = −∑ j =1

Ri ⎛R ⎞ log⎜ i ⎟ n ⎝ n⎠

(31)

⎛Cj log⎜⎜ n ⎝ n

(32)

Cj

⎞ ⎟⎟ ⎠

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 19

STATGRAPHICS – Rev. 9/14/2006 r

c

U ( XY ) = −∑∑ i =1 j =1

⎛ Oij log⎜⎜ n ⎝ n

Oij

⎞ ⎟⎟ para Oij > 0 ⎠

(33)

D de Somer

Siendo P el número de pares concordantes y Q el número de pares discordantes: Filas dependientes: D =

2( P − Q)

(34)

c

n − ∑C 2

j =1

Columnas dependientes: D =

2 j

2( P − Q) r

n −∑R 2

i =1

Simetría: D =

(35)

2 i

4( P − Q) ⎛ 2 c 2⎞ ⎛ 2 2⎞ ⎜ n − ∑ Ri ⎟ + ⎜⎜ n − ∑ C j ⎟⎟ i =1 j =1 ⎠ ⎝ ⎝ ⎠ r

(36)

Eta

η = 1−

SSW SS T

(37)

Donde SST es el total de la suma de cuadrados corregidos para Y cuando a cada observación i, i=1,2,…n, es asignado un valor Yi, y SSW es la suma de cuadrados dentro de las categorías de la variable independiente. Coeficiente de Contingencia

C=

χ2

(38)

χ2 +n

V de Cramer

Para una tabla de 2-por-2: V =

χ2 n

(39)

Usando el valor corregido de χ2. Para otras tablas:

© 2005 por StatPoint, Inc.

Tablas de Contingencia - 20

STATGRAPHICS – Rev. 9/14/2006

χ

V =

2

(40)

n[min(r , c) − 1]

Gamma Condicional

γ =

( P − Q) P+Q

(41)

R de Pearson

El P-valor es calculado como la probabilidad de exceder

t= R

n−2 1− R2

(42)

usando una distribución t de Student con n - 2 grados de libertad.

Tau b de Kendall

τ=

2( P − Q)

(43)

⎛ 2 c 2⎞ ⎛ 2 2⎞ ⎜ n − ∑ Ri ⎟ ⎜⎜ n − ∑ C j ⎟⎟ i =1 j =1 ⎠⎝ ⎝ ⎠ r

Si n >10, un P-valor es calculado como la probabilidad de dos colas de una normal estándar excediendo z=

( P − Q)

(44)

d donde

d=

c r ⎤ 1 ⎡ 2 2 ( ) ( ) − + − − + − n n 2 n 5 C C 2 C 5 Ri2 − Ri (2 Ri + 5)⎥ ⎢ ∑ ∑ j j j 18 ⎣ j =1 i =1 ⎦

(

)

(

)

(

)

⎡ c ⎤⎡ r ⎤ 2 2 ( ) C C C 2 − − ⎢∑ j ⎥ ⎢∑ Ri − Ri (Ri − 2 )⎥ j j j =1 ⎦ ⎦ ⎣ i =1 +⎣ 2 9 n − n (n − 2 )

(

)

(

(

© 2005 por StatPoint, Inc.

)

)

Tablas de Contingencia - 21

STATGRAPHICS – Rev. 9/14/2006 ⎡ ⎤ 2 2 ⎢∑ C j − C j ∑ Ri − Ri ⎥ j =1 i =1 ⎦ +⎣ 2 2 n −n c

(

) ( ( ) r

)

(45)

Tau c de Kendall

τ=

2 min(r , c)( P − Q) [min(r , c) − 1]n 2

© 2005 por StatPoint, Inc.

(46)

Tablas de Contingencia - 22