PRACTICA 7

ENLACE PERMANENTE A ESTA TIRA: HTTP://ES.XKCD.COM/STRIPS/ CORRELACION/

EJERCICIOS RESUELTOS

EJERCICIO 1 Se consideran los puntajes de un grupo de niños de 5 to grado en una Prueba de Autoconcepto de Piers-Harris (PRUEBA1) y en el Inventario de Autoestima de CooperSmith (PRUEBA2), obteniéndose: PRUEBA1 PRUEBA2

8 8 12 12 16 16 20 20 24 24 8 6 6 10 8 14 14 12 16 12

a) Confeccione el diagrama de dispersión. b) Determine, mediante un coeficiente adecuado, el grado de ajuste del modelo lineal a los datos. Interprete su resultado. c) Determine, mediante un coeficiente adecuado, el grado y sentido de la asociación lineal entre ambas variables. Interprete su resultado. d) Halle la recta de regresión para predecir el puntaje en PRUEBA2, a partir del puntaje obtenido en PRUEBA1. Represente gráficamente. e) Prediga el puntaje en PRUEBA2 para un niño que obtuvo 10 puntos en PRUEBA1. Resolución: a) Los datos del ejercicio están cargados en un archivo Statistix disponible en la página Web (Práctica 7 - Ejercicio Resuelto 1.sx). Para confeccionar el diagrama de dispersión seguir el siguiente camino desde el Menú en StatisticsSummary StatisticsScatter Plot. Indicar el nombre de las variables que se ubicarán, respectivamente, en el eje de abscisas y en el de ordenadas. Oprimir OK y resulta el gráfico solicitado. Los títulos pueden ser editados. 100

Diagrama de dispersión

Puntaje en el Inventario de Autoestima

16

14

12

10

8

6 8

12

16

20

24

Puntaje en la Prueba de Autoconcepto

b) Para conocer el grado de ajuste del modelo lineal a los datos se debe calcular el Coeficiente de Determinación r2. Este coeficiente indica qué proporción de la variabilidad de los puntajes en PRUEBA2 es explicada por la relación lineal con los puntajes en PRUEBA1. El Coeficiente de Determinación se encuentra como R-Squared en la siguiente salida computacional obtenida desde el Menú en Statistics Linear ModelsLinear Regression habiendo especificado que PRUEBA2 es la variable dependiente y PRUEBA1 es la variable independiente. Statistix 8.0 Puntajes de niños de 5to grado en pruebas de Autoconcepto y Autoestima Unweighted Least Squares Linear Regression of PRUEBA2 Inventario de Autoestima Predictor Variables Constant PRUEBA1

Coefficient 3.00000 0.47500

R-Squared Adjusted R-Squared Source Regression Residual Total

DF 1 8 9

Cases Included 10

Std Error 2.12662 0.12531

0.6423 0.5976 SS 72.200 40.200 112.400

T 1.41 3.79

Puntaje en

P 0.1960 0.0053

Resid. Mean Square (MSE) Standard Deviation MS 72.2000 5.0250

Missing Cases 0

101

F 14.37

P 0.0053

5.02500 2.24165

Luego, el 64,23% de la variabilidad en los puntajes de PRUEBA2 está explicado por la relación lineal con los puntajes en PRUEBA1. Puede sostenerse que el grado de ajuste del modelo del modelo lineal a los datos es del 64,23%. El porcentaje restante de la variabilidad de los puntajes en PRUEBA2 es explicado por el conjunto de fuentes fortuitas de variación. c) El grado y el sentido de la relación lineal está dado por el coeficiente de correlación lineal r de Pearson. Para su obtención desde el Menú en: Statistics Linear ModelsCorrelations (Pearson) indicar las variables PRUEBA1 y PRUEBA2. La salida correspondiente es: Correlations (Pearson)

PRUEBA2

PRUEBA1 0.8015

Cases Included 10

Missing Cases 0

Como el coeficiente de correlación lineal r de Pearson vale 0,8015 puede afirmarse que el sentido de la relación lineal es directo o positivo, es decir que, en general, a los niños de puntaje bajo en la PRUEBA1 les corresponde puntaje bajo en PRUEBA2, a los de puntajes medios en PRUEBA1 les corresponde puntaje medio en PRUEBA2, y a los de puntaje alto en la PRUEBA1 les corresponde puntaje alto en la PRUEBA2. Respecto de la valoración de la intensidad, hay que responder con cautela. Es verdad que la intensidad de la relación lineal entre dos variables es más alta cuanto más próximo a 1 sea r , y que en este caso (0,8015) podría decirse que es relativamente alta, pero hay que tener presente que la intensidad de la relación lineal puede ser valorada con mayor certeza si se considera el coeficiente de determinación r2. Nota: en los casos que el coeficiente de correlación lineal es menor o igual que 0,7, las fuentes fortuitas de variación explican la variabilidad de los puntajes en mayor proporción que el modelo lineal. d) La recta de regresión pedida es: PRUEBA2' = a + b.PRUEBA1. La ordenada al origen (a) y la pendiente de la recta de regresión (b) se pueden ubicar en la salida presentada en el inciso b). Donde dice Constant figura el valor de la ordenada al origen y donde dice PRUEBA1 está el valor de la pendiente de la recta de regresión. Luego: PRUEBA2’ = 3 + 0,475*PRUEBA1

102

La expresión de la recta de regresión también figura en la salida de su representación gráfica. Para obtenerla, en el Menú, desde la pantalla que contiene la salida con el análisis de Regresión lineal mencionada en el inciso b), ir a ResultsPlotsSimple Regression Plot. Ahí se lee que la recta de regresión para predecir el puntaje en la PRUEBA2 conocido el puntaje en la PRUEBA1 es PRUEBA2 = 3 + 0,475*PRUEBA1 En realidad, para un valor dado de la variable independiente, en este caso PRUEBA1, esta transformación proporciona el valor pronosticado o estimado para PRUEBA2, por eso se indica: PRUEBA2’ = 3 + 0,475*PRUEBA1

PRUEBA2 Inventario de Autoestima

16

14

12

10

8

6 8

12

16

20

24

PRUEBA1 Prueba de Autoconcepto PRUEBA2 = 3.0000 + 0.4750 * PRUEBA1

En este gráfico se visualizan también las bandas de confianza que contienen a la recta de regresión. El concepto y uso de estas bandas no se incluyen en el presente curso. e) Para el niño que obtuvo 10 puntos en PRUEBA1 se predice el puntaje 7,75 en PRUEBA2. Este valor puede obtenerse directamente a partir de la recta de regresión o bien con el programa Statistix. *Si PRUEBA1=10 resulta PRUEBA2' =3 + 0,475*10 = 7,75 luego PRUEBA2’ = 7,75 * Statistix permite predecir el puntaje pedido desde el Menú correspondiente a la salida con el análisis de regresión (Coefficient Table) en ResultsPrediction. En el cuadro que dice Predictor Value colocar 10 y se obtiene:

103

Predicted/Fitted Values of PRUEBA2 Lower Predicted Bound Predicted value Upper Predicted Bound SE (Predicted Value)

2.0579 7.7500 13.442 2.4684

Unusualness (Leverage) Percent Coverage Corresponding T

0.2125 95.0 2.31

Lower Fitted Bound Fitted Value Upper Fitted Bound SE (Fitted Value)

5.3671 7.7500 10.133 1.0334

Predictor Values: PRUEBA1 = 10.000

luego PRUEBA2’ = 7,75 EJERCICIO 2 Doscientos niños de la escuela elemental se clasificaron en forma cruzada de acuerdo con el nivel socioeconómico y la presencia o ausencia de cierto defecto de pronunciación. Los resultados fueron los siguientes:

Defecto de pronunciación

Ausente Presente

Nivel Socioeconómico Bajo Medio 20 62 20 38 40 100

Alto 48 12 60

130 70 200

¿Son compatibles estos datos con la hipótesis de que el defecto de pronunciación no está relacionado con el Nivel Socioeconómico? Resolución La prueba Chi cuadrado de Independencia permite estudiar la relación entre dos variables de nivel nominal y responder la pregunta planteada. En este caso, Presencia de Defecto de pronunciación es de este nivel, y Nivel Socioeconómico, medida en el nivel ordinal, también puede ser tratada como del nivel nominal por la jerarquía de los niveles de medición. Nota: En Tabullo (2004) se presenta una manera sencilla de cargar los datos y realizar el análisis pedido (figura como opción 2). Otra manera igualmente sencilla de cargar los datos en Statistix es definir las variables Presencia del Defecto de Pronunciación (0: Ausente, 1: Presente), Nivel Socioeconómico (1: Bajo, 2: Medio y 3: Alto) y Frec (donde se asienta la frecuencia de la celda). Ver archivo (Práctica 7 - Ejercicio Resuelto 2.sx disponible en la Web). Resulta así la tabla Presencia 0 0 0 1 1 1

Nivel_Soc 1 2 3 1 2 3

104

Frec 20 62 48 20 38 12

HIPOTESIS NULA: Las variables son independientes. (O sea en términos de las variables del problema se sostiene que el defecto de pronunciación no está relacionado con el grupo socioeconómico al que pertenece). HIPOTESIS ALTERNATIVA: Las variables no son independientes. (O sea en términos de las variables del problema se sostiene que el defecto de pronunciación está relacionado con el grupo socioeconómico al que pertenece). Desde el Menú en: Statistics Association Tests Chi-Square Test señalar que los datos están cargados de manera categórica y ubicar a Frec, Presencia y Niv_Soc como Count Variable, Row Variable y Column Variable respectivamente y oprimir OK. Resulta la salida que está a continuación: Chi-Square Test for Heterogeneity or Independence for Frec = Presencia Nivel_Soc Nivel_Soc Presencia Bajo Medio Alto +-----------+-----------+-----------+ Ausente Obs | 20 | 62 | 48 | Expected | 26.00 | 65.00 | 39.00 | Cell Chi-Sq | 1.38 | 0.14 | 2.08 | +-----------+-----------+-----------+ Presente Obs | 20 | 38 | 12 | Expected | 14.00 | 35.00 | 21.00 | Cell Chi-Sq | 2.57 | 0.26 | 3.86 | +-----------+-----------+-----------+ 40 100 60 Overall Chi-Square P-Value Degrees of Freedom

130

70

200

10.29 0.0058 2

El estadístico de prueba tiene distribución Chi-cuadrado, con (nº de filas-1).(nº de columnas -1) gl = (2-1).(3-1) gl= 2gl. El valor observado del estadístico de prueba es 10,29 y le corresponde un valor-p= 0,0058. O sea que con un nivel de significación del 5% o aún bastante menor, se rechaza la hipótesis de independencia de las variables. Conclusión Con un nivel de significación del 5% se puede concluir que los datos no son compatibles con la hipótesis de que el defecto de pronunciación no está relacionado con el grupo socioeconómico. Son ‘demasiados’ los niños de nivel socioeconómico bajo en los que el defecto de pronunciación está presente y ‘demasiados’ los niños de nivel socioeconómico alto en los que el defecto está ausente (demasiado para que pueda sostenerse la hipótesis de independencia). EJERCICIO 3 Se ha solicitado al Psicólogo X y al Psicólogo Y que ordenaran seis candidatos a un puesto a una empresa, según el perfil de cada uno. Los candidatos se representan con A, B, C, D, E y F. Las ordenaciones obtenidas han sido las siguientes: 105

Psicólogo X Psicólogo Y

A 3 1

B 4 4

C 2 3

D 1 2

E 5 5

F 6 6

Mida el grado de concordancia entre los rangos asignados por los dos psicólogos. Resolución Como se desea estudiar la concordancia entre dos ordenaciones por rango, se calcula el coeficiente de correlación de rango de Kendall.



NI NI

donde N es la cantidad de concordancias, I es la cantidad de inversiones, N + I es la cantidad total de comparaciones. Sabiendo que si hay n elementos el número total de comparaciones es:

n.(n  1) NI 2 En este problema: n = 6, luego N  I 

6.5  15 , es decir, es posible realizar 15 comparaciones. 2

Para calcular el número de inversiones hay varias maneras:  Reordenar los candidatos para que la ordenación por rangos del Psicólogo X aparezca en el orden natural ( D C A B E F) e indicar los rangos de dichos sujetos para el Psicólogo Y. Contar el número de intersecciones que resultan al unir los rangos iguales:

Psicólogo X Psicólogo Y

D

C

A

B

E

F

1 2

2 3

3 1

4 4

5 5

6 6

hay dos intersecciones que provienen de ordenaciones opuestas:  para el Psicólogo Y el sujeto A está antes que D mientras que, para el para el psicólogo X está D antes que A.  para el Psicólogo Y el sujeto A está antes que C, mientras que para el psicólogo X está C antes que A. 106

luego el número de inversiones es 2 o sea: I = 2 , luego como N + I = 15 resulta que N = 13

 Otra forma de calcular el número de inversiones y no inversiones consiste en escribir todos los pares ordenados de sujetos correspondientes al criterio de cada uno de los psicólogos -indicando, por ejemplo, con el par ordenado DE que el sujeto D está antes que E-, así resulta: Psicólogo X

Psicólogo Y

DC DA DB DE DF CA CB CE CF AB AE AF BE BF EF

AD AC AB AE AF DC DB DE DF CB CE CF BE BF EF

las concordancias son: DC,DB,DE,DF,CB,CE,CF,AB,AE,AF,BE,BF,EF las inversiones son: DA y CA luego I = 2 y N = 13 Obtenido el número de inversiones y no inversiones calculamos el valor del coeficiente de correlación de rango (tau) de Kendall:



13  2 11   0, 73 13  2 15

Conclusión Se detecta una correlación positiva entre las ordenaciones de los dos psicólogos

EJERCICIO 4 Para investigar el efecto de fumar sobre la actividad física, se clasificaron 24 personas según sus hábitos de fumar y se los sometió a la prueba conocida como ergómetro de la bicicleta, registrándose el tiempo en minutos hasta la máxima absorción de oxígeno. Los resultados fueron:

No fumadores 12,8 13,5 11,2

Fumadores moderados 10,9 11,1 9,8

107

Grandes fumadores 8,7 9,3 7,5

a) Indique las variables que intervienen en el problema y la escala de medición que le corresponde a cada una. b) Evalúe la correlación entre las variables con un coeficiente adecuado. Resolución a) Las variables que intervienen son:  "Hábito de fumar", medida con una escala ordinal.  "Tiempo (en minutos) hasta la máxima absorción de oxígeno", medida con una escala de cocientes o razones. b) El coeficiente adecuado es la razón de correlación 2 (Eta cuadrado). Dado que este coeficiente se utiliza para estudiar la correlación entre una variable cualitativa, medida en el nivel nominal, y otra cuantitativa, medida en el nivel intervalar. Por la jerarquía de los niveles de medición, están dadas las condiciones de aplicabilidad de dicho coeficiente. La salida que proporciona el programa es: One-Way AOV for Tiempo by Hábito de Fumar Source DF SS MS Hábito de Fumar 2 24.0200 12.0100 Error 6 5.4400 0.9067 Total 8 29.4600 Grand Mean 10.533

F 13.2

P 0.0063

CV 9.04

Bartlett's Test of Equal Variances Cochran's Q 0.5110 Largest Var / Smallest Var 2.8367

Chi-Sq 0.43

Component of variance for between groups Effective cell size

DF 2

P 0.8054

3.70111 3.0

HabitoF Mean No fumador 12.500 Fum.Mod. 10.600 Gdes.Fum 8.500 Observations per Mean 3 Standard Error of a Mean 0.5497 Std Error (Diff of 2 Means) 0.7775

luego 2=

24.02 , luego 2= 0.8153 29.46

Conclusión El 81,53 % de la variabilidad total entre todas las observaciones es explicada por la variabilidad entre los grupos según el hábito de fumar. Luego se concluye que existe una correlación alta entre el tiempo (en minutos) hasta la máxima absorción de oxígeno y el hábito de fumar.

108

EJERCICIOS PROPUESTOS (Las respuestas se pueden encontrar en la página Web de la Cátedra) EJERCICIO 1 Un psicólogo desea relacionar los puntajes en un test de Inteligencia (X), con los puntajes de otro que mide el conformismo (Y). Administró ambos tests a un grupo de sujetos y obtuvo: X Y

6 8

10 1

5 11

8 5

8 4

7 6

9 3

4 11

7 6

4 12

a) Confeccione el diagrama de dispersión. b) Determine mediante un coeficiente adecuado el grado y el sentido de la relación lineal entre ambas variables. Interprete el resultado. c) Determine mediante un coeficiente adecuado el grado de ajuste del modelo lineal a los datos. Interprete el resultado. d) Halle la recta de regresión para predecir el puntaje en el test de inteligencia conocido el puntaje obtenido en el test de conformismo. Obtenga la representación gráfica. e) Prediga el puntaje en la prueba de inteligencia de Pablo que obtuvo 2 en la prueba de conformismo. EJERCICIO 2 Se consideran los resultados obtenidos por un grupo de jóvenes al administrarles dos veces una misma prueba de Razonamiento Lógico, mediando un tiempo determinado entre ambas ocasiones (Técnica del Test-Retest). Test Retest

3 4

3 5

4 5

6 7

7 7

8 9

8 10

a) Evalúe mediante un coeficiente adecuado que parte de la variabilidad del puntaje en el Retest es explicado por la variabilidad de los puntajes del Test, si se aplica el modelo de regresión lineal. b) Ezequiel obtuvo 5 en el Test y no pudo asistir el día que se administró el Retest. Haga una predicción del puntaje de Ezequiel en el Retest. c) Recientemente le informaron a Hernán que obtuvo 8 en el Retest pero que extraviaron su puntaje en el Test. Haga una predicción del puntaje de Hernán en el Test. EJERCICIO 3 A cincuenta niños de 3er grado, elegidos aleatoriamente dentro de un determinado Distrito Escolar les fueron administradas dos pruebas: una de dibujo y otra de imaginación creadora. Con esos pares de valores se calcularon las rectas de regresión, a saber: Regresión del puntaje en dibujo sobre el de imaginación creadora: Y' = -10 + 1,95*X 109

Regresión del puntaje en imaginación creadora sobre el de dibujo: X' = 7,09 + 0,3759*Y a) ¿Qué puntaje en dibujo puede esperarse de un niño cuyo puntaje en imaginación creadora fue 7?. b) ¿Qué porcentaje de la variabilidad del puntaje en dibujo es explicado por el de imaginación creadora? c) ¿Cuál es el sentido de la relación entre estas variables? Justifique su respuesta. EJERCICIO 4 Se desea relacionar el factor primario B del cuestionario de personalidad de Cattell (X), que mide la inteligencia práctica, con el test de inteligencia general B-70 (Y). Los puntajes observados en una muestra de treinta adultos fueron: Y 3

0

0

2

2

4

2

1

2

6

3

0

1

4

3

2

1

0

1 2 3 4 5 X a) Halle las distribuciones marginales, sus medias y sus desviaciones típicas. b) Halle la media y la desviación estándar de la distribución condicional de Y dado X= 4. c) Halle la ecuación de ambas rectas de regresión. d) Calcule el coeficiente de correlación lineal r de Pearson.

EJERCICIO 5 En una investigación llevada a cabo en una empresa, se decidió analizar diversos factores de la vida cotidiana de sus empleados, que se presumía estaban relacionadas con el nivel de estrés de los mismos. La empresa tenía la hipótesis de que aquellos empleados con mayor cantidad de años en el puesto estarían más seguros en el mismo y, por lo tanto, tendrían un nivel menor de estrés que aquellos sujetos que habían ingresado últimamente. Para verificarla se recogieron los siguientes datos obtenidos de una muestra correctamente escogida: Sujeto 1 2 3 4 5 6 7

X1 1 3 4 10 5 3 5

X2 70 60 50 30 80 90 70

Sujeto 8 9 10 11 12 13 14

X1 8 9 5 1 1 4 5

X1: años de antigüedad en la empresa 110

X2 60 89 90 80 80 50 45

Sujeto 15 16 17 18 19 20

X1 2 3 2 5 7 6

X2 30 80 30 50 70 30

X2: nivel de estrés a) ¿Cuál es el tamaño de la muestra? b) ¿Se confirma la hipótesis de los investigadores acerca de la relación inversa entre el nivel de estrés y la antigüedad en la empresa? Fundamente la respuesta. c) Obtenga el diagrama de dispersión que representa a la información suministrada. d) Halle la ecuación de la recta de regresión de “nivel de estrés” sobre “años de antigüedad en la empresa”. e) Prediga el nivel de estrés de un sujeto que hace 4 años que trabaja en la empresa. f) Dé una interpretación del valor R-Squared que proporciona la salida del programa.

EJERCICIO 6 Un sindicato entiende que la cantidad de horas diarias trabajadas influye en el nivel de estrés de los trabajadores. A mayor cantidad de horas trabajadas mayor nivel de estrés. Para sostener esa hipótesis el sindicato utilizó los siguientes datos obtenidos de una muestra de trabajadores correctamente escogida. Sujeto 1 2 3 4 5 6 7

X1 6 8 6 10 10 12 8

X2 70 60 50 30 80 90 70

Sujeto 8 9 10 11 12 13 14

X1 10 12 10 13 10 8 6

X2 60 89 90 80 80 50 45

Sujeto 15 16 17 18 19 20

X1 4 8 4 8 10 4

X2 30 80 30 50 70 30

X1: cantidad de horas diarias trabajadas X2: nivel de estrés a) ¿Cuál es el tamaño de la muestra? b) Mediante un coeficiente adecuado investigue si existe relación lineal entre el nivel de estrés de los trabajadores y la cantidad de horas trabajadas. En caso de existir esa relación, indique que sentido e intensidad tiene. c) Obtenga el diagrama de dispersión que representa a la información suministrada. d) Halle la ecuación de la recta de regresión de “nivel de estrés” sobre “cantidad de horas diarias trabajadas”. e) Prediga el nivel de estrés de un trabajador del que sólo se sabe que trabaja 10 horas diarias. f) Dé una interpretación del valor R-Squared que proporciona la salida del programa.

EJERCICIO 7 En una investigación, un grupo de estudiantes fue interrogado sobre varios Particularmente respondieron varias preguntas relativas al hábito de fumar: 111

tópicos.

A. ¿Qué restricción a fumar establecería en lugares públicos cerrados como aulas, colectivos o teatros? A1: Prohibiría fumar. A2: Permitiría fumar sólo en áreas especialmente destinadas para ello. A3: Permitiría fumar sin ningún tipo de restricción. B. ¿Fuma usted? B1: Si. B2: No. La variable de actitud A permitió clasificar a los estudiantes en tres clases A 1, A2 y A3 y la variable de hábito B en las dos clases B 1 y B2 sugeridas en el contexto. Los resultados se muestran en la siguiente tabla.

B1 B2

A1 3 34

A2 33 110

A3 25 29

a) Halle las dos distribuciones marginales. b) Halle todas las distribuciones condicionales. c) Estudie la asociación entre las variables de actitud y de hábito presentadas en el problema. La salida que proporciona el programa es: Chi-Square Test for Heterogeneity or Independence for 1 = B A A B A1 A2 A3 +-----------+-----------+-----------+ B1 Observed | 3 | 33 | 25 | Expected | 9.65 | 37.28 | 14.08 | Cell Chi-Sq | 4.58 | 0.49 | 8.48 | +-----------+-----------+-----------+ B2 Observed | 34 | 110 | 29 | Expected | 27.35 | 105.72 | 39.92 | Cell Chi-Sq | 1.61 | 0.17 | 2.99 | +-----------+-----------+-----------+ 37 143 54 Overall Chi-Square 18.32 P-Value 0.0001 Degrees of Freedom 2 Cases Included 234

61

173

234

Missing Cases 0

EJERCICIO 8 Alumnos egresantes del Ciclo Medio de Enseñanza, fueron encuestados sobre la actividad que pensaban desarrollar cuando terminaran el colegio, indicando si pensaban: 1. Estudiar solamente. 112

2. Estudiar y trabajar. 3. Trabajar solamente. Los jóvenes fueron clasificados por la actividad elegida y el sexo, observándose:

SEXO

1 22 13

Femenino Masculino

ACTIVIDAD 2 3 116 7 62 5

¿Son compatibles estos datos con la hipótesis de que la actividad elegida no está relacionada con el sexo? EJERCICIO 9 Un psicólogo se propone indagar la modalidad de trabajo de los profesionales de la salud mental en relación a las distintas etapas vitales de los pacientes. Para ello suministra una encuesta anónima a 100 pacientes de distintos terapeutas siendo una de las preguntas: ¿Alguna vez su terapeuta le ha propuesto incluir en una sesión de su tratamiento a algún familiar? (Nota: en caso de que el paciente no estuviera en condiciones de responder se efectúa la pregunta a la persona que lo acompaña al tratamiento)

Respuesta a la pregunta

SI NO TOTAL

Niñez 17 8 25

Etapa vital del paciente Adolescencia Adultez 5 5 15 35 20 40

Vejez 13 2 15

Total 40 60 100

¿A qué conclusión llegarán los psicólogos con relación a la asociación entre estas dos variables? Utilice un nivel de significación del 1% para responder.

EJERCICIO 10 En el artículo de Marincovich et.al (2001) se estudió, entre otras variables, la interrelación entre la Capacidad Intelectual (CI) y el Alcoholismo Familiar. Se tomó una muestra representativa de escolares de la Región Metropolitana de Chile pertenecientes a la Educación Media y a la Educación Básica con edades de 5 a 18 años. La Capacidad Intelectual se determinó mediante el Test de Matrices Progresivas de Raven, estableciendo los siguientes rangos: R I, R II, R III, R IV, R V. Donde al Rango I = Intelectualmente superior; R II = Superior al término medio; R III = Término medio; R IV = Inferior al término medio; R V = Intelectualmente deficiente. La información recogida se muestra en la siguiente tabla de frecuencias. Analice la asociación entre estas variables.

113

Alcoholismo Familiar SI NO 8 49 40 134 106 268 67 109 22 32 243 592

Rango I II III IV V Total

TOTAL 57 174 374 176 54 835

EJERCICIO 11 Un especialista en didáctica jerarquiza siete cuestiones de máxima a mínima complejidad según las funciones del pensamiento supuestamente involucradas en ellas. Para comprobar si su criterio se ajusta a la realidad toma estas cuestiones a un grupo de alumnos y quedan reordenadas según la cantidad de respuestas correctas para cada una. Los resultados fueron: Rango Profesor Alumnos

1 A A

2 B B

3 C C

4 D D

5 E G

6 F F

7 G E

Evalúe la concordancia entre el profesor y los alumnos con un coeficiente adecuado, y formule una conclusión.

EJERCICIO 12 Tres psicólogos entrevistaron a cinco jóvenes aspirantes a un cargo de Maestra Jardinera y las ordenaron según la presumible aptitud de cada una para el empleo. Las tres ordenaciones fueron:

Psicólogo A Psicólogo B Psicólogo C

Gabriela 5 5 4

Julieta 1 4 2

Karina 3 1 3

Luciana 4 3 5

Mariana 2 2 1

¿Cuál es el par de psicólogos que evidencia mayor concordancia entre ellos según el orden que les asignaron a las aspirantes?

EJERCICIO 13 El coeficiente de ordenación por rangos entre 'Eficiencia' y 'Cumplimiento' en un grupo de 40 personas dio 0,8. ¿Cuántas inversiones hubo en dicho grupo? EJERCICIO 14 Un grupo de investigadores especializados en psicología comunitaria piensan que probablemente existe una relación entre el nivel socioeconómico de las familias y el cumplimiento con el plan de vacunación obligatorio hacia los niños. Tomaron una muestra 114

de 200 familias residentes en la Ciudad Autónoma de Buenos Aires (CABA) y relevaron la información de interés. Las variables y sus valores fueron codificados y volcados en la matriz de datos que se presenta a continuación: C: Cumplimiento con el plan de vacunación N Nivel Socioeconómico 1. Cumplen 1. Alto 2. No cumplen 2. Medio 3. Bajo Estudie la asociación entre las variables y ponga a prueba la hipótesis de los investigadores. Sujeto

C

N

Sujeto

C

N

Sujeto

C

N

Sujeto

C

N

Sujeto

C

N

Sujeto

C

N

1

1

1

35

1

1

69

1

2

103

2

1

137

2

2

171

2

2

2

1

1

36

1

1

70

1

2

104

2

1

138

2

2

172

2

2

3

1

1

37

1

1

71

1

2

105

2

1

139

2

2

173

2

2

4

1

1

38

1

1

72

1

2

106

2

1

140

2

2

174

2

2

5

1

1

39

1

1

73

1

2

107

2

1

141

2

2

175

2

2

6

1

1

40

1

1

74

1

2

108

2

1

142

2

2

176

2

2

7

1

1

41

1

1

75

1

2

109

2

1

143

2

2

177

2

2

8

1

1

42

1

1

76

1

2

110

2

1

144

2

2

178

2

3

9

1

1

43

1

1

77

1

2

111

2

1

145

2

2

179

2

3

10

1

1

44

1

1

78

1

2

112

2

1

146

2

2

180

2

3

11

1

1

45

1

1

79

1

2

113

2

1

147

2

2

181

2

3

12

1

1

46

1

2

80

1

2

114

2

1

148

2

2

182

2

3

13

1

1

47

1

2

81

1

2

115

2

2

149

2

2

183

2

3

14

1

1

48

1

2

82

1

2

116

2

2

150

2

2

184

2

3

15

1

1

49

1

2

83

1

3

117

2

2

151

2

2

185

2

3

16

1

1

50

1

2

84

1

3

118

2

2

152

2

2

186

2

3

17

1

1

51

1

2

85

1

3

119

2

2

153

2

2

187

2

3

18

1

1

52

1

2

86

1

3

120

2

2

154

2

2

188

2

3

19

1

1

53

1

2

87

1

3

121

2

2

155

2

2

189

2

3

20

1

1

54

1

2

88

1

3

122

2

2

156

2

2

190

2

3

21

1

1

55

1

2

89

1

3

123

2

2

157

2

2

191

2

3

22

1

1

56

1

2

90

1

3

124

2

2

158

2

2

192

2

3

23

1

1

57

1

2

91

1

3

125

2

2

159

2

2

193

2

3

24

1

1

58

1

2

92

1

3

126

2

2

160

2

2

194

2

3

25

1

1

59

1

2

93

1

3

127

2

2

161

2

2

195

2

3

26

1

1

60

1

2

94

1

3

128

2

2

162

2

2

196

2

3

27

1

1

61

1

2

95

1

3

129

2

2

163

2

2

197

2

3

28

1

1

62

1

2

96

1

3

130

2

2

164

2

2

198

2

3

29

1

1

63

1

2

97

1

3

131

2

2

165

2

2

199

2

3

30

1

1

64

1

2

98

1

3

132

2

2

166

2

2

200

2

3

31

1

1

65

1

2

99

1

3

133

2

2

167

2

2

32

1

1

66

1

2

100

1

3

134

2

2

168

2

2

33

1

1

67

1

2

101

1

3

135

2

2

169

2

2

34

1

1

68

1

2

102

1

3

136

2

2

170

2

2

115

EJERCICIO 15 Se ha afirmado que el consumo excesivo de televisión atenta contra la creatividad en el juego de los niños. En la siguiente tabla aparecen la cantidad de horas diarias que están frente al televisor un grupo de niños previa clasificación según su creatividad: No creativos 5 5 6 7

Poco creativos 3 4 5

Muy creativos 1 1 0 1 2 0

Evalúe la relación entre ambas variables mediante un coeficiente adecuado y exprese su conclusión respecto de la afirmación inicial.

EJERCICIO 16 En un hospital mental privado se quiere saber si hay relación entre la duración del período de internación de pacientes y el trastorno diagnosticado. Para ello se dispone de información sobre los últimos dieciocho pacientes tratados. Los datos en términos de categoría de diagnóstico y semanas de internación son los siguientes:

Nro 1 2 3 4 5 6

C 1 2 2 3 3 1

D 7 11 8 10 12 6

Nro 7 8 9 10 11 12

C 3 2 1 3 1 3

D 10 9 5 11 5 12

Nro 13 14 15 16 17 18

C 3 2 3 2 1 1

D 8 12 10 10 4 3

Donde: Nro: número de paciente

C: categoría de diagnóstico

1: trastornos afectivos 2: trastornos cognitivos 3: trastornos por drogas

D: duración de la internación ¿Qué se puede decir sobre esa posible relación a partir del cálculo del coeficiente 

EJERCICIO 17 Las siguientes son variables y maneras de medirlas: 116

Ansiedad

Medida según el criterio de psicólogos clínicos que asigna la posición 1 hasta la posición n a un grupo de n sujetos.

C.I.

Medido con la prueba de Stanford-Binet.

Habilidad Manual

Medida según el criterio de un evaluador que ordena los trabajos realizados por n personas bajo determinada consigna desde “el mejor” hasta “el peor”.

Nota Promedio Obtenida Medida de acuerdo con los criterios usuales en la en la Escuela Media enseñanza media. Preferencia Política

Medida clasificando a las personas en Justicialista, Radical, Socialista, ....., según el partido político de su preferencia.

Sexo

Medida clasificando a las personas en varón, mujer.

Explique el método adecuado para estudiar la relación entre las siguientes variables: a) Preferencia Política y Sexo. b) Ansiedad y Habilidad Manual. c) C.I. y Nota Promedio en la Escuela Media. d) C.I. y Preferencia Política.

EJERCICIO 18 ¿Cuál de las siguientes expresiones es la única correcta? El coeficiente de determinación r²… : a) ...puede tomar cualquier valor positivo. b) ...indica el grado de ajuste del modelo lineal a los datos. c) ...indica el sentido de la relación entre dos variables cuantitativas. d) ...cuantifica el grado de ajuste del modelo normal a los datos.

EJERCICIO 19 Una sola de las siguientes opciones es la correcta. Encuéntrela. Cuando la relación lineal entre dos variables cuantitativas es perfecta: a) las dos rectas de regresión son coincidentes. b) las rectas de regresión son diferentes y paralelas. c) las rectas de regresión son diferentes pero no paralelas. d) las dos rectas de regresión resultan ser perpendiculares.

117

EJERCICIO 20 Una sola de las siguientes opciones es la correcta. Encuéntrela. El signo del coeficiente de correlación lineal r de Pearson: a) es igual al signo de la media de la variable independiente. b) coincide con el signo de la ordenada al origen de la recta de regresión. c) es igual al signo de la pendiente de la recta de regresión. d) siempre es positivo. EJERCICIO 21 ¿Cuál de las siguientes afirmaciones es la única correcta?. La prueba ChiCuadrado de independencia requiere: a) que las variables tengan distribución normal. b) que las variables tengan distribución binomial. c) que las variables sean independientes. d) que las variables estén medidas con una escala nominal. EJERCICIO 22 Una sola de las siguientes opciones es la correcta. Encuéntrela. La distribución Chi cuadrado modeliza a: a) una variable contínua. b) dos variables cualitativas. c) la asociación entre dos variables. d) la independencia entre dos variables. EJERCICIO FINAL Continúe con la construcción del glosario de los términos estadísticos contenidos en el cuento “Como transformarse en un estudiante de Psicología y no desencadenarse en el intento” (Fridman, 2015), tal como se explica en el Ejercicio Final de la Práctica 1.

Referencias Bibliográficas Fridman, C. A. (2015). Como transformarse en un estudiante de Psicología y no desencadenarse en el intento. En Materiales para la Cursada. Documento interno de la Cátedra I de Estadística. Facultad de Psicología, Universidad de Buenos Aires. Marincovich, D. I., Sparosvich H.F., Marincovich R.I. (2001). Estudio de la capacidad intelectual (Test de matrices progresivas de Raven) en escolares chilenos de 5 a 18 años. II. Interrelaciones con factores socioeconómicos, socioculturales, familiares, de exposición a medios de comunicación de masas, demográficos y educacionales. Revista de Psicología General y Aplicada, Julio 2001, 54 (3), 443465. Tabullo, A. J. (2004). Tutorial. Buenos Aires: Tekné.

118