PRACTICA 4 ¿Has oído ese chiste de estadísticos? Probablemente… El 20 por ciento de las personas muere a causa del tabaco. Por lo tanto, el 80 por ciento de las personas muere por no fumar. Así que queda demostrado que no fumar es peor que fumar

EJERCICIOS RESUELTOS

EJERCICIO 1 Según los registros históricos de un hospital el 20% de los pacientes tratados en el Servicio de Psiquiatría son psicóticos. Considere la variable “Cantidad de pacientes psicóticos entre los ocho que asistirán al Servicio de Atención Psiquiátrica de dicho hospital” y que el modelo binomial la explica convenientemente: a) ¿Cuáles son los parámetros de esa distribución binomial? ¿Cuál es su media? ¿Cuál es su desvío estándar? b) Construya una tabla de tres columnas. En la primera, coloque los valores de la variable, en la segunda, la probabilidad que el modelo le asigna a cada uno y, en la tercera, las correspondientes probabilidades acumuladas. c) Caracterice la asimetría de la distribución. d) i. ¿Cuál es la probabilidad de que haya menos de tres psicóticos? ii. Calcule la probabilidad de que ninguno sea psicótico. iii. Calcule la probabilidad de que alguno sea psicótico. iv. Calcule la probabilidad de que haya mayoría, pero no totalidad, de psicóticos. v. ¿Qué cantidad como máximo de psicóticos entre los ocho debe haber para que la probabilidad de que vayan no exceda 0,6? vi. ¿Cuál es la probabilidad de que, como máximo, tres pacientes no sean psicóticos? Resolución: a) La información de los registros históricos del hospital sobre el diagnóstico de un paciente que se atiende en el Servicio de Psiquiatría da lugar a considerar una variable Bernoulli cuyos dos valores son ‘Psicótico’ y ‘no Psicótico`. Esto es, la variable Bernoulli del problema es “Diagnóstico de un paciente tratado en el Servicio de Psiquiatría del hospital” con valores Psicótico-no Psicótico. Si se considera como éxito que el paciente sea psicótico resulta que la probabilidad de éxito es 0,20. La variable en estudio es X: “Cantidad de pacientes psicóticos entre los ocho que asistirán al Servicio de Atención Psiquiátrica de dicho Hospital”. Esta variable se puede considerar binomial con parámetros n = 8 y p = 0,2. El éxito es que el paciente psiquiátrico sea psicótico, corresponde a uno de los dos valores posibles de una variable Bernoulli. De la Bernoulli se

51

hacen ocho observaciones; una por cada paciente, se supone, bajo las condiciones de estabilidad e independencia. Por eso el modelo binomial es apropiado para la variable X. Los valores de la variable X posibles de ser observados son nueve: 0, 1, 2, 3, 4, 5, 6, 7 y 8. Conocidos n y p pueden calcularse la media y la varianza de la distribución binomial. Efectivamente, la media de la distribución binomial es µ = n.p y la varianza es 2 =n.p.(1-p). Luego, µ = 8.0,2 o sea µ = 1,6. Además como 2 =8.0,2.0,8 o sea 2 = 1,28, resulta  = 1,1314. b) La tabla con las probabilidades pedidas se obtiene en Excel. Para ello ir a funciones estadísticas, buscar la distribución binomial y considerar: “x” número de éxitos. “n” número de ensayos. “p” probabilidad de éxito. “Acumulado” indicando con 0 ó FALSO si buscamos la probabilidad puntual, y con 1 ó VERDADERO si buscamos la probabilidad acumulada hasta el valor indicado en la columna “x”. “Binomial” la probabilidad buscada según los datos indicados en la fila correspondiente. Los valores de esta columna serán los que obtenemos usando la función estadística correspondiente en el Excel. Para X=0 que está en la celda A2, la probabilidad puntual se obtiene insertando la función DISTR.BINOM especificando que n=8, p=0,2 y Acumulado es ‘0’, así resulta =DISTR.BINOM.N(A2;8;0,2;0). La probabilidad resultante es 0,16777216 ajustada a cuatro cifras decimales queda 0,1678. Estirando hacia abajo del vértice inferior derecho de la celda B2 se completa la columna de probabilidades puntuales. Por su parte, la probabilidad acumulada para X=0 se obtiene insertando la función DISTR.BINOM especificando que n=8, p=0,2 y Acumulado es ‘1’, así resulta =DISTR.BINOM.N(A2;8;0,2;1). La probabilidad resultante es 0,16777216 ajustada a cuatro cifras decimales queda 0,1678. Estirando hacia abajo del vértice inferior derecho de la celda C2 se completa la columna de probabilidades acumuladas. Así resulta la tabla pedida:

X 0 1 2 3 4 5 6 7 8

Probabilidad 0,1678 0,3355 0,2936 0,1468 0,0459 0,0092 0,0011 0,0001 0,0000

52

Probabilidad Acumulada 0,1678 0,5033 0,7969 0,9437 0,9896 0,9988 0,9999 1,0000 1,0000

c) La distribución binomial presentada es asimétrica positiva. Las probabilidades mayores corresponden a los valores bajos de la variable y los valores altos son poco probables. Si se calcula el índice de asimetría (α3) de esta distribución resulta:

3 

1 2 p np(1  p)

α3 = (1-2.0,2)/1,1314=0,5303 valor que da cuenta de presencia de asimetría positiva. d) i.

Se pide el cálculo de la probabilidad de obtener menos de tres éxitos: P(X70) = 1 - P(X  70) = 1- 0,0228 = 0,9772 EL 97,72% de los sujetos tienen un CI superior a 70. iv. Para obtener el porcentaje de sujetos con un CI comprendido entre 100 y 120 debemos calcular la diferencia entre la probabilidad acumulada hasta 120 y la probabilidad acumulada hasta 100, para luego multiplicar por 100 esa diferencia. Esas probabilidades acumuladas se calculan con Excel. Los resultados aparecen en las filas que se muestra a continuación donde también está calculada, en la columna encabezada con “Cálculos adicionales”, la diferencia que necesitamos.

P(100  X  120)  P(100  X  120)  P(X  120)  P(X  100)  0,9088 - 0,5000 = 0,4088 Según el modelo normal el 40,88% de los sujetos de esa población tienen un CI entre 100 y 120. v. Para obtener el porcentaje de sujetos con un CI comprendido entre 90 y 110 se procede como en el caso anterior. Luego

55

P(90  X  110)  P(90  X  110)  P(X  110)  P(X  90)  0,7475 - 0,2575 = 0,4950 El 49,5% de los sujetos de esa población tienen un CI entre 90 y 110. b) Se trata de encontrar el valor de la variable, que llamamos C, que es superado por el 10% de las observaciones poblacionales. En símbolos, buscamos C tal que tal que P(X>C) = 0,10. Hasta C se acumula una probabilidad de 0,9, es decir P(X  C) = 0,90. El problema ahora es: dada una probabilidad encontrar el valor de la variable hasta el que se acumula esa probabilidad. Es el problema inverso al tratado en los puntos anteriores, por eso vamos a usar la función del Excel nombrada DIST.NORM.INV. Esta función calcula el valor de la variable correspondiente a la probabilidad acumulada que le indiquemos. Debemos proporcionarle la media, el desvío y la probabilidad acumulada, que en la tabla está colocada en la columna encabezada “Normal”. Pedimos al programa que coloque el valor de la variable buscado en la columna encabezada “x”.

x 119,22

media 100

desvío normal 15 0,9

Luego el CI = 119,22 es superado por el 10% de las observaciones poblacionales. c) Los límites de la interquintila central son la segunda quintila c2 y la tercera quintila c3. Como P(c2  X  c3 ) = 0,20 es P(X  c2 ) = 0,40 y P(X  c3 ) = 0,60. Para encontrar c2 y c3 se procede como en la parte b). Se arma la tabla con la información necesaria y le pedimos al programa que coloque los valores buscados en la columna encabezada “x”, mediante la función Excel DIST.NORM.INV. x 96,20 103,80

media 100 100

desvío normal 15 0,4 15 0,6

Los límites de la interquintila central son: c2 = 96,20 y c3 = 103,80.

EJERCICIOS PROPUESTOS (Las respuestas se pueden encontrar en la página Web de la Cátedra) EJERCICIO 1 Para resolver este ejercicio tenga en cuenta la información presente en el artículo “Estilos del Sentido Del Humor. Un estudio transcultural en población adulta según género” (Cayssials, Danna y Pérez, 2006).

56

A un Laboratorio de la Risa que preparan unos especialistas sobre Psicología y Humor asistirán seis sujetos entre los 800 que respondieron a la Escala sobre el Sentido del Humor. Considere la variable “cantidad de mujeres entre los seis que asistirán al Laboratorio de la Risa” y que el modelo binomial la explica convenientemente: a) ¿Cuáles son los parámetros de esa distribución binomial? ¿Cuál es su media? ¿Cuál es su desvío estándar? b) Construya una tabla de tres columnas. En la primera, coloque los valores de la variable, en la segunda, la probabilidad que el modelo le asigna a cada uno y, en la tercera, las correspondientes probabilidades acumuladas. c) i. ¿Cuál es la probabilidad de que la mitad de los sujetos que vayan sean mujeres? ii. Calcule la probabilidad de que a lo sumo vayan cinco mujeres. iii. Calcule la probabilidad de que por lo menos vayan dos mujeres. iv. ¿Qué cantidad como máximo de mujeres entre los seis debe haber para que la probabilidad de que vayan no exceda 0,15? EJERCICIO 2 Estudios realizados en Alemania indican que el 25% de la población padece un ligero miedo a que se rían de ellos. Considere la variable “Cantidad de personas que padecen un ligero miedo a que se rían de ellas entre doce elegidas al azar de la población alemana” y que el modelo binomial la explica convenientemente. a) Construya una tabla. En la primera columna coloque los valores de la variable, en la segunda, la probabilidad que le corresponde a cada valor y, en la tercera, las probabilidades acumuladas. b) Utilice la tabla construida para calcular la probabilidad de encontrar en la muestra: i. exactamente una persona que padezca un ligero miedo a que se rían de ella. ii. a lo sumo dos personas que padezcan un ligero miedo a que se rían de ellas. iii. más de una persona que padezca un ligero miedo a que se rían de ella. iv. por lo menos dos personas que padezcan un ligero miedo a que se rían de ellas. c) Obtenga la media y el desvío de la variable considerada. d) Indique que tipo de asimetría presenta la variable y cuál es su moda.

EJERCICIO 3 Remítase al ejercicio 9 de la práctica 1 y responda: a) ¿Qué modelo explica el comportamiento de la variable identificada en el punto b del ejercicio mencionado? b) Considere un grupo de 16 nutricionistas elegidos al azar. En cada uno de los incisos siguientes defina la variable Binomial con la que responderá lo solicitado. i. ¿Cuál es la probabilidad de que alguno no recomiende comida baja en calorías? ii. ¿Cuál es la probabilidad de que por los menos 8 nutricionistas recomienden comida baja en calorías?

57

iii. ¿Cuál es la probabilidad de que entre 9 y 12 nutricionistas recomienden comida baja en calorías? c) Especifique el valor de los parámetros de las variables definidas en b). Calcule la media y la varianza de cada una de ellas. EJERCICIO 4 Se conoce, por los datos registrados en el hospital XX, que los pacientes que recurren al servicio, en su cuarta parte consultan por adicciones. Se estima que durante la semana próxima concurrirán al servicio 20 pacientes. Mencione la variable Bernoulli presente en este ejercicio y defina la variable binomial con la que responderá los siguientes incisos. a) ¿Cuál es la probabilidad que entre 7 y 13 pacientes consulten por adicciones? b) ¿Cuál es la probabilidad que, como máximo, cinco pacientes lo hagan por otras cuestiones? c) ¿Cuál es la probabilidad que todos ellos consulten por adicciones? EJERCICIO 5 En un servicio de psicopatología, de un centro público de salud mental, se conoce que, la quinta parte de los pacientes abandona el tratamiento antes de culminar el número de sesiones establecidas por el psicólogo. El próximo mes iniciarán su tratamiento 30 pacientes elegidos al azar. Mencione la variable Bernoulli presente en este ejercicio y defina la variable binomial en la que se basará para calcular la probabilidad de: a)…retener a todos los pacientes hasta la culminación de sus sesiones? b)…que abandone, antes de cumplir con todas sus sesiones, alguno de esos pacientes? c)…que cumpla con todas sus sesiones alguno de esos pacientes? d)…que culmine con sus sesiones a lo sumo la tercera parte de los pacientes? EJERCICIO 6 Las calificaciones de un examen de admisión se distribuyen normalmente con media 62 y desvío estándar 5. Son admitidos quienes obtienen por lo menos 65 puntos. Halle: a) el porcentaje de admitidos. b) la probabilidad de que un estudiante obtenga menos de 56 puntos. EJERCICIO 7 La edad de los empleados de cierta empresa sigue una distribución aproximadamente normal con media 38,5 años y desvío estándar 3 años. En esa empresa se quiere aplicar una técnica para hacer uso del sentido del humor como reforzador motivacional. a) Por resultados obtenidos en otras empresas, parecería que las personas menores de 40

años tienen mejor disponibilidad y buena predisposición para aceptar esta técnica. ¿Qué porcentaje de empleados de esta empresa tienen menos de 40 años?

58

b) La contracara de lo antedicho lleva a suponer que las personas de más edad presentarían

mayor resistencia a la aplicación de la nueva técnica. Por ello, se desea convocarlos a un espacio de trabajo diferenciado. Por limitaciones logísticas se invitará solamente al 13% de los empleados de más edad. ¿A partir de qué edad serán convocados? EJERCICIO 8 Suponga que el modelo de variable normal de media 28 y desvío estándar 7 explica razonablemente la distribución de las puntuaciones en el estilo de humor Agresividad en la población de donde se obtuvo la muestra analizada en el artículo de Cayssials y otros (2006): a) Indique el porcentaje de sujetos de la población que obtendría puntuaciones en Agresividad i. menores que 32. ii. mayores que 30. iii. entre 20 y 34. b) ¿Cuál es el puntaje máximo que limitaría al 15% de los menores puntajes en Agresividad? c) ¿Qué puntuaciones se ubicarían en el segundo intercuartil? d) Si el 28% de la población superara cierto puntaje ¿de qué puntaje se trataría?

EJERCICIO 9 Las puntuaciones que obtienen los alumnos de tercer grado de las escuelas públicas de la Ciudad Autónoma de Buenos Aires en una prueba de rendimiento estandarizada se distribuyen normalmente con una media de 13 puntos y un desvío de 2 puntos. A una de estas escuelas se incorporaron recientemente alumnos que pertenecen a uno de los pueblos originarios del norte de la República Argentina. Administrada la prueba a tales niños se observó que la mayor de las puntuaciones logradas era superada por el 60% de las puntuaciones del estándar. Los maestros opinaron que este resultado era debido a que el proceso de adaptación no había concluido. ¿Cuál es la mayor puntuación obtenida por los mencionados alumnos?

EJERCICIO 10 El tiempo de reacción ante un estímulo se distribuye normalmente con media 8 segundos y desvío estándar 1,2 segundos. Un psicólogo opina que hay que preocuparse por el grupo de las personas con reacción lenta definido como el de los que tardan tiempos mayores y conforman el 20% del total. ¿Cuál es el tiempo de reacción a partir del cual hay que preocuparse?

EJERCICIO 11 Cumplido un plan de alfabetización para adultos de un barrio de la ciudad de Buenos Aires se observó, sobre los integrantes de una muestra altamente representativa de esa población, la variable “Cantidad de palabras de un determinado texto leídas correctamente”. Las observaciones produjeron una media de 45 palabras y un desvío de 8 palabras. Los alfabetizadores tenían como expectativa que el 80% de los adultos pueda leer correctamente

59

entre 30 y 55 palabras y querrían desarrollar un plan de alfabetización complementario para aquellos que no puedan leer correctamente por lo menos 30 palabras del texto. Los alfabetizadores se proponen encuestar a los adultos del grupo que más palabras leen y conforman el 10% del total de ellos. Considere que el modelo normal es adecuado para el tratamiento de la variable en cuestión y que los resúmenes producidos por el grupo representativo pueden operar como sus parámetros. a) ¿Fue satisfecha la expectativa de los alfabetizadores? b) ¿A qué porcentaje de la población estaría dirigido el plan de alfabetización complementario? c) ¿Cuál es el número esperado mínimo de palabras que leen correctamente las personas que podrían ser encuestadas de acuerdo con los criterios establecidos por los alfabetizadores? EJERCICIO 12 Suponemos que las puntuaciones obtenidas por la operacionalización de la participación en clase de los 20584 alumnos de séptimo grado de escuelas estatales de la ciudad de Buenos Aires en 2012 se distribuyeron de manera aproximadamente normal de media 80 y desvío 151. Se considera que los alumnos con una participación escasa (puntuaciones que están 1,5 desvíos por debajo de la media) no alcanzan aprendizajes significativos; por otro lado, los alumnos con una excesiva participación (puntuaciones que superan a la media en más de 1,5 desvíos) limitan la beneficiosa interacción entre los miembros del grupo. a) Si los alumnos con participación extrema (ya sea escasa o excesiva) hubieran sido entrevistados con el fin de mejorar su actuación en clase. ¿Cuántos alumnos de séptimo grado de las escuelas estatales de la ciudad de Buenos Aires de 2012 habrían sido entrevistados? b) Si se considera que la participación eficaz en clase es la de los alumnos cuyas puntuaciones corresponden al 20% central de la distribución. ¿Entre qué puntuaciones extremas habrán estado las de los alumnos de séptimo grado de las escuelas estatales de la ciudad de Buenos Aires de 2012 con participación eficaz? EJERCICIO 13 A 2.500 estudiantes de Psicología seleccionados de facultades de todo el país se les evaluó su CI. Si suponemos que podemos aplicar el modelo de distribución normal con media µ=100 y desvío típico σ=6, obtenga: a) El CI del estudiante que es superado por 1.500 estudiantes. b) El CI que es segundo cuartil. c) La cantidad de alumnos que superan al estudiante cuyo puntaje es 82. 1

Datos ficticios sobre la participación en clase de los alumnos de séptimo grado de escuelas estatales de la ciudad de Buenos Aires de 2012. La cantidad de alumnos es real. Fuente: Gerencia Operativa de Investigación y Estadística (Ministerio de Educación, GCBA), Relevamiento Anual 2012 (datos a Set.2013). https://equidadycalidadeducativa.buenosaires.gob.ar/investigacion/

60

EJERCICIO 14 Los tiempos que emplean ciertos estudiantes en resolver una serie de problemas de razonamiento lógico se distribuyen en forma aproximadamente normal con una media de 1 hora y una desviación estándar de 5 minutos. Se desea clasificar a estos estudiantes en tres categorías. En la categoría A, que es la de los más rápidos, habría que ubicar al 20% de ellos. En la B, que es la categoría intermedia habría que ubicar al 50%. El resto integraría la categoría C de los más lentos. ¿Cuáles son los tiempos topes de cada categoría?

EJERCICIO 15 La oficina de personal de una clínica privada tiene como misión reclutar enfermeros de ambos sexos con los más altos puntajes en el estilo de humor Mejoramiento Personal (MP). El perfil buscado es que oscilen entre los 25 y 35 años de edad y con título habilitante. Según datos históricos se sabe que el 40% de los enfermeros con ese perfil presentan altos puntaje en tal estilo de humor. Considere la variable “Cantidad de enfermeros entrevistados con alto puntaje en estilo de humor MP entre los seis que asistirán el día lunes a la oficina de personal de la clínica privada” y que el modelo binomial lo explica convenientemente. a) ¿Cuál es la variable Bernoulli en que se basa la binomial presentada en el enunciado? ¿Cuál de sus valores se considera como éxito en este caso? b) ¿Cuáles son los parámetros de esa distribución binomial? ¿Cuál es su media? ¿Cuál es su desvío estándar? ¿Qué tipo de asimetría presenta la distribución? c) A continuación se presenta la distribución de probabilidades de la variable binomial mencionada. x 0 Probabilidad 0.0467

1 0.1866

2 0.3110

3 0.2765

4 0.1382

5 0.0369

6 ……….

Complete la tabla y responda: i. ¿Cuál es la probabilidad de que menos de la mitad de los enfermeros entrevistados por la oficina de personal presente alto puntaje estilo de humor MP? ii. ¿Cuál es la probabilidad de que a lo sumo tres presenten alto puntaje en tal estilo de humor? iii. ¿Cuál es la probabilidad de que por lo menos dos presenten alto puntaje en el estilo MP?

EJERCICIO 16 Solo una de las siguientes cuatro opciones es verdadera, encuéntrela: Un modelo de variable es: a) una distribución de frecuencias absolutas observadas. b) una distribución de frecuencias porcentuales acumuladas. c) una distribución de frecuencias relativas teóricas. d) una distribución de frecuencias relativas observadas.

61

EJERCICIO 17 Solo una de las siguientes cuatro opciones es verdadera, encuéntrela: El modelo de variable Bernoulli indica que: a) la probabilidad de éxito varía. b) la variable puede tomar solo dos valores. c) el éxito sucede al fracaso. d) sus valores son equiprobables.

EJERCICIO 18 Solo una de las siguientes cuatro opciones es verdadera, encuéntrela: Una variable Binomial supone: a) que la probabilidad de éxito permanece constante. b) que a cada fracaso le sigue un éxito. c) repetir indefinidamente un ensayo. d) que sus valores conforman un intervalo real.

EJERCICIO 19 Solo una de las siguientes cuatro opciones es verdadera, encuéntrela: El modelo de variable Normal supone que: a) la distribución de sus valores es bimodal. b) el conjunto de valores que distan de la media más de tres desvíos se presenta con probabilidad 0,0027. c) el conjunto de todos sus valores es acotado. d) la correspondiente curva de densidad tiene asimetría positiva.

EJERCICIO 20 Responda “verdadero” si la proposición es siempre verdadera. Si la proposición no es siempre verdadera, sustituya las palabras en negrita por palabras que la hagan siempre verdadera. a) La variable binomial es una variable discreta. b) El conjunto de valores de una variable binomial es acotado. c) La distribución de una variable binomial con probabilidad de éxito p=0,3242 es simétrica. d) La suma de las probabilidades asociadas a todos los valores de una variable binomial es dependiente del número de ensayos de Bernoulli que se repiten. e) La variable binomial es adecuada para modelizar el número de alumnos de una comisión de trabajos prácticos que regularizarán la materia. f) La probabilidad de que una variable binomial de parámetros n y p tome el valor cero es (1-p)n.

62

EJERCICIO 21 Responda “verdadero” si la proposición es siempre verdadera. Si la proposición no es siempre verdadera, sustituya las palabras en negrita por palabras que la hagan siempre verdadera. a) La curva normal (gaussiana) es simétrica respecto de cero. b) El área total bajo la curva de densidad de cualquier variable normal es uno. c) La probabilidad de que la variable normal estándar tome el valor 1 es dos tercios. d) La probabilidad de que una variable normal de media µ y desviación estándar σ tome un valor del intervalo (µ-σ , µ+σ) es dos tercios. e) La moda y la mediana de una variable normal de media µ son ambas iguales a µ. f) La probabilidad asignada por la distribución normal a un intervalo de longitud determinada aumenta con la distancia del intervalo a la media µ.

EJERCICIO FINAL Continúe con la construcción del glosario de los términos estadísticos contenidos en el cuento “Como transformarse en un estudiante de Psicología y no desencadenarse en el intento” (Fridman, 2015), tal como se explica en el Ejercicio Final de la Práctica 1.

Referencias bibliográficas Cayssials A., Danna A., y Pérez, M. (2006). Estilos del Sentido del Humor. Un Estudio Transcultural en Población Adulta según Género. Memorias de las XIII Jornadas de Investigación, Segundo Encuentro de Investigadores en Psicología del Mercosur, 3, 3233. Fridman, C. A. (2015). Como transformarse en un estudiante de Psicología y no desencadenarse en el intento. En Materiales para la Cursada. Documento interno de la Cátedra I de Estadística. Facultad de Psicología, Universidad de Buenos Aires.

63