UNIVERSIDAD DE VALPARAÍSO Ingeniería Civil, primer semestre 2016

GUIA N°1: Estadistica descriptiva. EJERCICIO 1 Clasificar cada una de las siguientes variables: si es cualitativa (nominal u ordinal) o cuantitativa (discreta o continua) a) Distancia diaria recorrida por cada estudiante para ir de su casa a la universidad. b) Nivel educacional. c) Tiempo que requiere un estudiante para responder a un examen. d) Llamadas que llegan a la central telefónica en un día. e) Marcas de refresco. f) Color del cabello de las estudiantes que toman el curso de bioestadística en el segundo semestre. g) Temperatura promedio diaria. h) Grado alcanzado en la institución de Carabineros. i) Número de acciones vendidas en un día en la Bolsa de Valores. j) Empresa de celulares elegida por los consumidores.

EJERCICIO 2 Se ha hecho un estudio para determinar la preferencia de una marca especial de detergente por parte de las amas de casa. La obtención de la muestra se realizó llamando a teléfonos red fija en la región metropolitana. De la guía telefónica, se llamó al primer y último número de cada página impar. a) ¿Quiénes constituyen la población? b) ¿Qué tipo de muestreo se realizó? Fundamente.

EJERCICIO 3 En la región de Antofagasta, ha ocurrido un derrame de petróleo frente a las costas de Tocopilla. Frente a esto, diversas autoridades han requerido la ayuda de ingenieros ambientales para poder medir las consecuencias en la fauna de esta catástrofe. Para ello, se requiere monitorear a los animales de las distintas especies presentes en ese lugar (lobos marinos, pelícanos, gaviotas, etc.) a) Indique claramente quienes constituyen la población. b) ¿Qué tipo de muestreo propone usted para poder analizar de la mejor manera las distintas especies presentes en el lugar? Fundamente.

EJERCICIO 4 La siguiente tabla indica los pesos de alumnos de 50 alumnos de la carrera de Medicina que cursan tercer año: Clase Marca de Frecuencia Frecuencia Frecuencia Frecuencia clase absoluta absoluta relativa relativa acumulada acumulada 45 – 47,5 0,04 5 19 0,38 45 72,5 0,08 1 a) Complete la tabla de frecuencias. b) Responde verdadero o falso según corresponda. Justifique las falsas:

1. El 76% de los alumnos pesan entre 60 y 65 kg. 2. 19 alumnos pesan entre 55 y 65 gr. 3. El 24% de los pesos de los alumnos varía entre 50 y 60 kg. 4. 45 personas pesan a lo mas 70 kg. 5. El 90% de los alumnos de la carrera de medicina pesa entre 45 y 70 kg. 6. 12 alumnos pesan como mínimo 65 kg. 7. 38 alumnos pesan a lo más 60 kg. 8. El 14% de los alumnos pesan entre 65 y 70 kg. c) Calcular la clase modal, la media, la varianza de la variable peso.

EJERCICIO 5 El siguiente gráfico muestra el número semanal de minutos que pasan viendo la televisión estudiantes de secundaria. Observe detenidamente la información que entrega:

300

400

500

600

700

800

900

1000

1100

1200

a) b) c) d)

Colóquele un título adecuado al gráfico. ¿Qué nombre lleva este tipo de gráfico? Lleve los datos del gráfico a una tabla de frecuencias. Responda las siguientes preguntas: 1. ¿Cuántos alumnos ven a lo mas 600 minutos de televisión? 2. ¿Cuántos alumnos ven más de 900 minutos de televisión? 3. ¿Qué porcentaje de alumnos ven entre 500 y 800 minutos de televisión? 4. ¿Qué proporción de alumnos ven a lo más 500 minutos de televisión? 5. Si un estudio revela que los alumnos no deben ver más de 700 minutos semanales de televisión, ¿qué porcentaje de alumnos sobrepasan lo permitido? e) Calcular la clase modal, la media, la varianza de la variable minutos semanales viendo televisión.

EJERCICIO 6 Se seleccionaron de un proceso de fabricación, aleatoriamente 12 baterías y se llevó a cabo una prueba para determinar la duración de éstas. Los siguientes datos representan el tiempo de duración, en horas, para las 12 baterías: 48,8 49,3 52,5 52,7 53,1 54,9 56,8 57,3 58,1 58,7 58,9 59,0 a) Calcular la media, la varianza, la mediana, la moda, los cuartíles b) Calcule el coeficiente de variación.

EJERCICIO 7 Una empresa realiza un estudio de la resistencia de un tipo de cuerda. En la siguiente tabla se resumen los resultados obtenidos al medir la resistencia, en Kg, para 100 cuerdas fabricadas en la empresa bajo las mismas condiciones y los mismos materiales. Resistencia (Kg) Clase

Marca de clase ci

160-170

Frec. Absoluta ni

195

a. b. c. d. e.

Frec. Relativa fi 0.03

24

Frec. Rel. Acumulada Fi

11

0.16

235 -

Total

Frec. Abs. Acumulada Ni

0.23 0.66

92

Completar la tabla de frecuencias. Calcular el porcentaje de cuerdas cuya resistencia está comprendida entre 180 y 210 Kg. Encuentre los percentiles 10 y 50. Calcule la resistencia media muestral de las cuerdas. Grafique el Histograma de Frecuencias Relativas y el Polígono de Frecuencia Relativas.

EJERCICIO 8 Los datos siguientes representan en centímetros las longitudes de 50 máquina. 4.15 4.27 4.62 4.68 4.68 4.80 4.86 4.92 4.98 5.27 5.33 5.33 5.33 5.39 5.45 5.51 5.51 5.57 5.63 5.74 5.86 5.86 5.86 6.02 6.02 6.04 6.10 6.66 6.75 6.92 6.98 6.98 7.10 7.14 7.22 7.22 7.70 7.94

artículos producidos por una 5.15 5.63 6.33 7.30

5.15 5.63 6.66 7.38

5.27 5.63 6.66 7.54

a) Construya una tabla de frecuencias completa para los datos. b) Construir el histograma asociado. c) Si el 25% de los artículos de menor longitud y el 75% de los artículos de mayor longitud son considerados defectuosos por el Departamento de Control de Calidad, ¿entre qué longitudes los artículos serán considerados aceptables? EJERCICIO 9 Los siguientes datos indican el número de trabajadores que faltan a una empresa en 50 días de trabajo:

a) b) c) d) e)

13 8 3 10 7

5 19 11 11 29

13 21 19 3 12

37 12 6 6 9

10 11 15 10 10

16 7 10 4 8

2 7 14 6 20

11 9 10 32 15

6 16 7 9 5

Construir una tabla de frecuencias. Graficar su correspondiente histograma y polígono de frecuencias. Graficar el diagrama acumulativo de frecuencias relativas. Trazar la ojiva. Calcular la media muestral, mediana, moda, varianza, desviación estándar y cuartiles.

12 18 24 12 17

EJERCICIO 10 Los siguientes datos corresponden al número de vehículos particulares que pasaron por cierta arteria de la provincia de Valparaíso durante cada uno de los días del mes de marzo.

a) b) c) d) e)

130 128 153 118 137

125 112 145 163 129

157 159 127 141 175

138 148 119 151

170 136 143 169

137 173 120 136

160 158 148 119

Elaborar una tabla de frecuencias de 7 intervalos. Durante cuantos días el transito de autos fue superior a 148 vehículos. ¿Qué porcentaje de días el número de vehículos fue mayor a 129 y menor a 168? Graficar; histograma, polígono de frecuencia. Calcular , mediana, moda, desviación estándar, desviación media, rango intercuartil.

EJERCICIO 11 Considere los siguientes datos que representan a estatura de un grupo de estudiantes, 1.65, 1.67, 1.82, 1.68, 1.58, 1.63, 1.75, 1.81, 1.68, 1.75, 1.82, 1.80, 1.51, 1.76, 1.92, 1.65, 1.88, 1.69, 1.70, 1.63.

a) Usando las clases [1.50 , 1.60), [1.60 , 1.70) … [1.90 , 2.00), construya una tabla de frecuencias y dibuje un histograma. b) Calcule la media, la mediana y determine por observación la clase modal. c) ¿Qué medida de tendencia central representa mejor la muestra, de acuerdo a los resultados obtenidos? EJERCICIO 12 Un negocio de venta (en miles de pesos) de ropa para adultos, dispone de dos establecimientos en Santiago. El gerente de este negocio, quiere hacer un aná lisis descriptivo de las ventas por cliente, en cada uno de sus dos locales y hacer comparaciones que permitan tomar algunas decisiones referentes a ofertas u otros. Las ventas por clientes tomadas de un registro en cada uno locales son: Local A Local B

42 36

56 102 56 59 58 36

80 23

96 69

78 85

96 78

56 102

23 123

36 45

45 88

89 60

99 56

102 45

a) Calcule la media, la mediana y la moda para las ventas, en cada uno de los locales. ¿En cuá l de los locales las ventas son mejores? Justifique su respuesta. b) Se quiere categorizar a los clientes segú n sus compras, tomando como una sola muestra las ventas de los dos locales. La categorizació n se quiere hacer de la siguiente forma: Categorı́a C, al 25% de los clientes con compras má s bajas. Categorı́a B, al siguiente 50% de los clientes con compras má s altas. Categorı́a A, el resto. Dé aproximaciones de los lı́mites de cada una de las categorı́as.

EJERCICIO 13 Un estudio publicado en Chemosphere (Febrero 2003) tuvo como objetivo conseguir información acerca de los niveles de fondo de la sustancia tóxica bifenilo policlorado (PCB) en muestras de suelo del Reino Unido. La concentración de PCB se mide en 0,0001 gramos por kilogramo se suelo. En una primera instancia se observaron 50 muestras con las que se obtuvieron las siguientes estadísticas: ; . Posteriormente, por alguna razón, se sabe que se han eliminado dos valores se ; . la muestra original de manera que las nuevas estadísticas quedan como: Determine los dos valores que se han eliminado.

EJERCICIO 14 Reconstruya una tabla de frecuencias de variable continua, formada por 5 intervalos de clase de amplitud constante igual a 10, a partir de la siguiente información: x = 70,N 3 = 12,N 5 = 20, f1 = 0.15, f 2 = 0.25, f 4 = 0.30 . EJERCICIO 15 El Banco Crédito Internacional (BCI) quiere analizar el tiempo de espera para los clientes que asisten a sus sucursales en Santiago diferenciando dos turnos: M, turno de mañana (9 a 12) y T, turno de tarde (12 a 14). Para cada turno, M y T, se recogió en un día cualquiera, información referente al tiempo de espera (en minutos) de 3.000 clientes y 2.700 clientes respectivamente. Se entiende por tiempo de espera el tiempo que se demora un cliente en entrar y salir del banco. Se obtuvo la siguiente información: TURNO M

Media Mediana Moda Desviación Estándar Varianza muestral Rango Mínimo Máximo Q1 Q3

10.25 10.28 10.1 2.22 4.93 16.05 2.69 18.75 6.92 13.58

TURNO T

Media Mediana Moda Desviación Estándar Varianza muestral Rango Mínimo Máximo Q1 Q3

7.60 7.69 3.74 3.83 14.7 13.35 1.0 14.35 1.16 13.43

a) Construya un diagrama de caja (o boxplot). b) ¿Cuál es la forma de la distribución de los tiempos de espera en cada turno? c) Basándose en estos resultados, si usted fuera cliente de este banco, ¿en qué horario iría a hacer sus trámites bancarios en alguna sucursal del BCI en Santiago? Justifique su respuesta. EJERCICIO 16 Se tiene una muestra de 15 datos que corresponden a la presión de rotura (en Pascal) de una herramienta de uso masivo en una cierta constructora: 10,2; 14,1; 14,4; 14,4; 14,4; 14,5; 14,5; 14,6; 14,7; 14,7; 14,7; 14,9; 15,1; 15,9; 16,4 A partir de estos datos se obtuvo el siguiente resumen: datos Media Mediana Moda Desviación estándar Varianza de la muestra Rango Mínimo Máximo Q1 Q3 Cuenta

14,5 14,6 14,4 1,33363092 1,77857143 6,2 10,2 16,4 14,4 14,9 15

a) Construya un diagrama de caja (o boxplot). b) Según el criterio del diagrama de caja, ¿existen valores atípicos (outliers) en los datos? Si existen, indique cuáles son y de qué tipo. c) Que se puede decir sobre la simetría o asimetría de los datos?

Calificaciones en física

EJERCICIO 17 La tabla siguiente muestra las distribuciones de frecuencias de las calificaciones finales de matemática y física: 90 -99 80 -89 70 -79 60 -69 50 -59 40 -49 Total

40 -49 1 3 3 7

Calificaciones en matemática 50 -59 60 -69 70 -79 80 -89 90 -99 2 4 4 1 4 6 5 5 10 8 1 4 9 5 2 6 6 2 5 4 15 25 23 20 10

Total 10 16 24 21 17 12 100

Refiérase a la tabla y determine: a) El número de estudiantes que obtuvieron calificaciones de 70-79 en matemática y 80-89 en física. b) El porcentaje de estudiantes con calificaciones en matemática por debajo de 70. c) El número de estudiantes que obtuvieron una calificación de 70 o más en física y menos de 80 en matemática. d) El porcentaje de estudiantes que pasaron al menos una de las materias, considerando que la mínima calificación para pasar es 60. e) ¿Cree usted que existe una relación entre las calificaciones obtenidas por los estudiantes en ambas asignaturas? ¿Cuál es aquel valor? ¿Es el resultado obtenido lógico para usted? Fundamente. f) Obtenga a partir de la tabla dada las tablas marginales tanto para matemática como para física. g) A partir de las tablas obtenidas en el punto anterior, calcule la varianza y desviación estándar de las calificaciones en matemática, la varianza y desviación estándar de las calificaciones en física, y la covarianza. ¿Qué indica esta última medida?

Nivel Educacional

EJERCICIO 18 La tabla siguiente muestra las distribuciones de frecuencias del nivel educacional y opinión sobre el matrimonio: Opinión sobre matrimonio Mala Regular Buena Muy Buena Total Preparatoria 72 25 112 98 307 Secundaria

Profesional Total

65

20

187

75

50

a) Calcular las frecuencias relativas marginales. b) Calcular las frecuencias relativas condicionales. c) Son las variables independientes?

30

90

120

295

305

463

1030

103

245

428