Unidad seis

Matemática

Estadística descriptiva

Presentación

L

as Estadísticas son tan antiguas como las sociedades humanas. Cuenta el historiador Herodoto (siglo 5, A.C.) que él pudo verificar junto a los sacerdotes egipcios, la existencia de datos estadísticos, referentes al pueblo egipcio que se remontaban hasta una antigüedad de 10,000 años. Durante el apogeo del Imperio Romano se elegía dos censores, para un período de cinco años. Las atribuciones de éstos, según Marco Tulio Cicerón (siglo 1, A.C.), eran las siguientes: “Que cuenten el pueblo según la edad, número de hijos, de esclavos y rentas; que velen por la conservación de los templos, los caminos, las aguas, el tesoro, los impuestos; que distribuyan las diferentes partes del pueblo en tribus; que las repartan por caudales, edades y órdenes”. Para poder cumplir con todas las atribuciones asignadas, los censores debían organizar y llevar a cabo una recopilación general de información, llamada censo, a todo lo largo y ancho del Imperio. Como consecuencia de uno de estos censos el nacimiento de Jesucristo ocurrió en Belén; porque José y María habían ido a dicha ciudad para ser censados en tiempos del emperador Augusto César.

MATEMÁTICA • UNIDAD SEIS

71

En el mundo moderno y especialmente en los países llamados desarrollados, las estadísticas demográficas y económicas, juegan un papel fundamental para llevar adelante, de manera exitosa, los planes de desarrollo social. Queda claro que actualmente la información recopilada es enorme y se hace necesaio sintetizarla para poder interpretarla más fácilmente. Este es precisamente el propósito de la disciplina matemática que se conoce con el nombre de Estadística Descriptiva, la cual se encarga de resumir y describir un conjunto de datos estadísticos. ■

72

MATEMÁTICA • PRIMERO DE BACHILLERATO

Objetivos

Al finalizar esta unidad tu deberás ser capaz de: Uno. Explicar el objeto de estudio de la Estadística

Descriptiva y el de la Estadística Inferencial. Dos. Organizar datos en bruto, por medio de un cuadro

de distribución de frecuencias absolutas y relativas. Tres. Graficar adecuadamente información estadística. Cuatro. Analizar e interpretar la información

presentada por medio de gráficos. Cinco. Explicar la utilidad o importancia de las medidas de

tendencia central y de dispersión en el análisis estadístico. Seis. Determinar la media aritmética de un conjunto de datos. Siete. Calcular la varianza y la desviación típica para

datos no agrupados.

MATEMÁTICA • UNIDAD SEIS

73

Contenidos

1. Conceptos básicos 2. Organización y presentación de la información a) Variables cualitativas y cuantitativas (discretas) • Gráfico de barras • Gráfico circular o de sectores • Gráfico lineal • Pictogramas b) Variabes continuas • Tabla de distribución de frecuencias • Histograma 3. Media aritmética a) Propiedades 4. Medidas de dispersión a) Varianza b) Desviación Típica

74

MATEMÁTICA • PRIMERO DE BACHILLERATO

1. Conceptos básicos

Estadística inferencial Es la rama de la Estadística que a partir de una muestra obtiene conclusiones que son válidas para toda la población.

Población En los estudios estadísticos una población está constituida por todas las observaciones posibles en las cuales se está interesado. Por ejemplo si se desea conocer las razones por las que las personas se abstienen de votar, entonces la población estará constituida por todos los salvadoreños adultos aptos para emitir el voto. Cuando un empresario desea instalar una venta de repuestos para automotores y lleva adelante una investigación de mercado, para poder tener una mejor idea acerca de los repuestos que debe adquirir, entonces la población está constituida por todos los vehículos automotores que circulan en el país. Para poder estudiar la gravedad de los niveles de contaminación de nuestros recursos hídricos, la población a considerar está constituida por todos los ríos, lagos y lagunas que existen en nuestro territorio. Es claro que si se está interesado en conocer las razones por las que las personas se abstienen de votar, lo ideal sería pregúntarselo a todos los salvadoreños adultos; pero como eso es practicamente imposible se le pregunta solamente a una parte de la población.

MATEMÁTICA • UNIDAD SEIS

75

Muestra Se llama muestra a una parte de una población. Siendo que las conclusiones estadísticas que se refieren a una población se obtienen a partir de una muestra, es de la mayor importancia conocer las técnicas adecuadas para poder obtener muestras representativas de toda la población, es decir que en la medida de los posible conduzcan a conclusiones válidas, de tal manera que se minimice la posibilidad de error.

Parámetro estadístico Los datos que caracterizan a toda la población se llaman parámetros. Los datos que caracterizan a una muestra se llaman Estadígrafos o Estadísticos. Por ejemplo, el porcentaje a nivel nacional de abstencionismo en unas elecciones es un parámetro, mientras que el porcentaje de abstencionismo entre las personas que viven en tú vecindario es un Estadígrafo. Cuando se hace una recopilación de información ésta puede estar constituida por dos clases de datos. Cualitativos y Cuantitativos.

Datos cualitativos Son los que se refieren a cualidades como color, raza, religión, sexo, etc.

Datos cuantitativos Son los que se refieren a cantidades y que por lo tanto pueden ser, designadas por variables numéricas tales como: estatura, número de hijos por familia, sueldo mensual, etc. Las variables numéricas pueden ser discretas o continuas. Son discretas las que asumen únicamente valores aislados, como por ejemplo el número de hijos por familia. Son continuas las que pueden tomar cualquier valor de un intervalo, por ejemplo la estatura de una persona.

76

MATEMÁTICA • PRIMERO DE BACHILLERATO

2. Organización y presentación de la información

Como la información estadística generalmente consta de un gran número de observaciones y mientras mayor es su número más difícil resulta su lectura e interpretación, se hace necesario presentar los datos en forma resumida por medio de un cuadro o tabla estadística llamada Tabla de Distribución de Frecuencias.

Definición. Se llama frecuencia al número de veces que

aparece repetido un determinado valor de la variable. La frecuencia se acostumbra representarla por la letra f.

Ejemplo 1 Se preguntó a 20 personas por su color favorito y las respuestas que se obtuvieron fueron las siguientes: Azul, negro, azul, negro, café, rosado, rojo, anaranjado, verde, café, blanco, anaranjado, verde, azul, negro, café, negro, rojo, azul y morado. Al presentar esta información por medio de una tabla de distribución de frecuencias, los datos que aparecen con mayor frecuencia se colocan preferiblemente en la parte superior de la tabla; mientras que los datos que aparecen con menor frecuencia ocupan la parte inferior. Esta es una tabla de distribución de frecuencias en que la variable color es cualitativa.

Color preferido

Frecuencia

Azul Negro Café Anaranjado Rojo Verde Blanco Morado Rosado

4 4 3 2 2 2 1 1 1

Total

20

Los datos que se resumen por medio de una tabla de distribución de frecuencias pueden ser presentados haciendo uso de gráficas.

MATEMÁTICA • UNIDAD SEIS

77

a) Variables cualitativas y cuantitativas discretas Uno de los gráficos más sencillos es el llamado Gráfico de Barras, el cual estudiaremos a continuación.

❚ Gráfico de barras

Se utiliza para representar tanto datos cualitativos como cuantitativos; pero referidos a variables discretas.

El gráfico de barras consiste en barras de igual ancho, cuya longitud es proporcional a la frecuencia con que aparecen los datos.

Ejemplo 2 Se preguntó a 25 personas, que laboran en un supermercado capitalino, por la zona geográfica del país de la cual son originarios y las respuestas que se obtuvieron fueron las siguientes: Central, central, oriental, occidental, central, oriental, occidental, occidental, occidental, occidental, central, central, central, central, central, occidental, central, occidental, occidental, central, oriental, occidental, oriental, central, oriental. Presentar esta información por medio de un gráfico de barras.

Solución: La tabla de Distribución de frecuencias correspondiente a estos datos es:

Zona de origen

78

Frecuencia

Central Occidental Oriental

11 9 5

Total

20

MATEMÁTICA • PRIMERO DE BACHILLERATO

11 10

El gráfico de barras correspondiente a esta tabla de distribución de frecuencias queda de la manera siguiente:

9 8 7 6 5 4 3 2 1 0

Central

Occidental

Oriental

Zona geográfica

❚ Gráfico circular o de sectores Este gráfico se conoce también con el nombre de gráfico de pastel y sirve para representar datos cualitativos.

El gráfico circular consiste en un círculo de radio arbitrario que se divide en sectores proporcionales a la frecuencia de los datos.

Para un gráfico circular se debe tener presente que:

El ángulo central que le corresponde a un círculo es de 360 grados.

MATEMÁTICA • UNIDAD SEIS

79

Ejemplo 3: Se preguntó a 40 personas adultas sí votarán en las próximas elecciones presidenciales. Las respuestas obtenidas se muestran en el cuadro.

Respuesta

Nº de pers.



16

No

24

Total

40

Representar los datos por medio de un gráfico circular. Solución:

A las 40 personas le corresponden los 360 grados de todo el círculo. A una persona le corresponden

360 = 9 grados 40

Además, las 40 personas representan el 100% del total de entrevistados. Una persona representa 100 = 2.5% del total 40

La tabla de Distribución de frecuencias se amplía de la manera siguiente: ¿Votará?

80

Nº de personas

Grados del círculo

Porcentaje



16

(16 x 9) = 144

(16 x 2.5%) = 40%

No

24

(24 x 9) = 216

(24 x 2.5%) = 60%

Total

40

360

100%

MATEMÁTICA • PRIMERO DE BACHILLERATO

Al medir con un transportador. El gráfico, con su respectivo porcentaje, es el siguiente:

Es recomendable que los sectores se grafiquen de mayor a menor y siguiendo la dirección contraria a las agujas del reloj, empezando por el radio horizontal.

❚ Ejemplo 4

Representar por medio de un gráfico circular los datos del cuadro siguiente: SUPERFICIE DE EL SALVADOR SEGÚN ZONA Zona Occidental Central Oriental Total

Superficie Kms2 4,487 8,824 7,729 21,040

Solución: Al área total de 21,040 Km2 le corresponden los 360 grados de todo el círculo. A 1 Km2 le corresponden

360 grados 21,040

Por lo tanto: A 4,487 Kms2 de la zona occidental le corresponden:

4,487(360) = 77º 21,040

A 8,824 Kms2 de la zona central le corresponden:

8,824(360) = 151º 21,040

A 7,729 Kms2 de la zona oriental le corresponden:

7,729(360) = 132º 21,040

TOTAL:

MATEMÁTICA • UNIDAD SEIS

360º

81

Al asignar los grados, haciendo uso de un transportador, se tiene el gráfico siguiente: Cada sector se ha rotulado con su nombre y se le ha colocado el porcentaje respectivo.

Zona central central Zona 41.94% 41.94%

Zona oriental Zona oriental 37.73% 36.73%

ZonaZona occidental 21.33% occidental 21.33%

El porcentaje territorial correspondiente a cada zona se obtiene de igual forma en que se obtienen los grados respectivos.

A 21,040 le corresponde 100% 100% 21,040

A 1 Km2 le corresponde:

100% = 21.33% 21,040

A 4,487 Kms2 le corresponde:

4,487x

A 8,824 Km2 s le corresponde:

8,824x 100% = 41.94% 21,040

A 7,729 Kms2 le corresponde:

7,729x 100% = 36.73% 21,040

TOTAL = 100%

Las aproximaciones deben hacerce de tal manera que siempre la suma total de los porcentajes dé el 100%. Podemos observar que a la hora de hacer el gráfico no se respeta el orden en que los datos aparecen en la tabla, sino que estos se dibujan siguiendo la dirección contraria a las agujas del reloj y en orden de mayor a menor.

82

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ejercicios Nº 1

1. En el presupuesto general de la nación para el año de 1993 se asignaron las mayores cantidades a las cinco dependencias que se detallan en el cuadro. Presentar la información por medio de un gráfico de barras verticales.

MAYORES ASIGNACIONES EN EL PRESUPUESTO GENERAL DE LA NACIÓN 1993 Dependencia Defensa Educación Obras públicas Policía Salud

Millones asignados 866 1,106 988 256 730

2. La siguiente tabla muestra el número de manzanas que fueron sembradas de algodón, en El Salvador, durante distintos años. Representar los datos por medio de un gráfico de barras verticales.

Año 1981 1983 1985 1987 1989

Superficie sembrada (Miles de manzanas)

101 83 63 24 21

MATEMÁTICA • UNIDAD SEIS

83

3. Se preguntó a 36 jóvenes por su deporte favorito, las respuestas obtenidas se dan en el cuadro. Presentar los datos por medio de un gráfico circular.

Deporte preferido

Nº de personas

Fútbol Baloncesto Ciclismo Total

18 12 6 36

• A las 36 personas les corresponden 360 grados, luego a una persona le corresponde = = grados. • Las 36 personas representan el 100%, una persona representa Llenemos el cuadro ampliado Deporte favorito

Número de personas

Fútbol Baloncesto Ciclismo

18 12 6

Total

36

El gráfico es el siguiente ¡complétalo!

Fútbol %

Ciclismo % Baloncesto %

84

MATEMÁTICA • PRIMERO DE BACHILLERATO

Grados

360

Porcentaje

100%

%

4. El siguiente cuadro dá las exportaciones de café que efectuó El Salvador durante 1988. Presenta los datos por medio de un gráfico circular o de sectores. EXPORTACIONES DE CAFE POR PAIS DE DESTINO. 1988 País E.E.U.U. Alemania Japón Otros TOTAL:

Quintales exportados 532,766 284,904 118,054 88,876 11024,600

Autoevaluación Nº 1

I) Escribe en el espacio correspondiente si se trata de un dato cualitativo o cuantitativo. 1) Clase de ocupación: 2) Votos anulados en las últimas elecciones: II) Escribe en el espacio correspondiente si se trata de una variable discreta o continua 3) Cantidad de matrimonios efectuados el año pasado 4) Tiempo empleado en resolver un examen

MATEMÁTICA • UNIDAD SEIS

85

III) Se preguntó a 30 mujeres adultas por su estado civil y las respuestas obtenidas se presentan a continuación: casada, acompañada, casada, casada, divorciada, soltera, acompañada, casada, viuda, casada, acompañada, casada, divorciada, acompañada, acompañada, casada, casada, casada, divorciada, soltera, soltera, soltera, viuda, divorciada, casada, casada, soltera, casada, soltera y casada. Presenta estos datos por medio de una tabla de Distribución de frecuencias y luego construye el gráfico de barras correspondiente.

IV) Se preguntó a 144 estudiantes por su materia de estudio preferida. Las respuestas obtenidas se dan en el cuadro.

Materia preferida Naturales Sociales Matemática Lenguaje Total

Número de estudiantes 72 36 24 12 144

Construir un gráfico circular, para presentar estos datos.

86

MATEMÁTICA • PRIMERO DE BACHILLERATO

❚ Gráfico lineal El Gráfico Lineal se utiliza para representar cuadros estadísticos en los que la variable corresponde a períodos de tiempo, principalmente años. Por medio de este gráfico se establecen comparaciones entre distintos años, observándose claramente las alzas y bajas. El gráfico lineal se construye de la manera siguiente:

1. Sobre el eje horizontal, el cual es la base de un rectángulo, se marcan los años o meses. 2. El primer año o mes se coloca en el origen de coordenadas. 3. Sobre el eje vertical, el cual es la altura de un rectángulo, se marcan las frecuencias. 4. Se cuadricula el rectángulo. 5. Para cada año y su respectiva frecuencia se grafica un punto. 6. Se unen todos los puntos por medio de una línea continua.

Ejemplo 1: A continuación se dá el Producto Interno Bruto del pueblo salvadoreño desde 1993 hasta 1997. Representaremos los datos por medio de un gráfico lineal. Año

PIB colones

1993 1994 1995 1996 1997

8,000 8,300 8,700 8,700 8,800

Colones

10,000

10.000

9,000 9.000 8,000 8.000 7,000 7.000 6,000 6.000 5,000 5.000 4,000 4.000 3,000 3.000 2,000 2.000 1,000 1.000

El gráfico queda de la manera siguiente: 1993 1993

1994 1994

1995 1995

1996 1996

1997 1997

MATEMÁTICA • UNIDAD SEIS

Años

87

❚ Pictogramas Los pictogramas son representaciones de datos estadísticos por medio de dibujitos que indican claramente la naturaleza de la información. Para representar datos estadísticos por medio de Pictogramas debe poseerse creatividad o ingenio en la técnica del dibujo, puesto que se busca atraer la atención del público en general y que éste pueda captar la información, aunque no posea mayores conocimientos estadísticos. Al construir un Pictograma deberá tenerse presente que todas las figuras que aparezcan deberán ser del mismo tamaño y en el encabezado indicarse claramente a cuántas unidades equivale cada figurita.

Ejemplo 2 : Las exportaciones de frutas que ha efectuado El Salvador desde 1985 hasta 1988 se dan a continuación. Presentar los datos del cuadro por medio de un pictograma.

Año

Millones de colones

1985

11188,300

1986

61000,800

1987

81210,500

1988

41977,200

Solución: Exportación de frutas

88

= ¢ 11000,000.00

1985

1.188 millones

1986

6 millones

1987

8.21 millones

1988

4.977 millones

MATEMÁTICA • PRIMERO DE BACHILLERATO

Como podemos ver claramente, por el ejemplo anterior, los pictogramas son aproximaciones gruesas y no son parte de un análisis estadístico serio, si no que, como dijimos anteriormente, el propósito de un pictograma solamente es el llamar la atención y, transmitir una información rápida al gran público.

Ejercicios Nº 2

1.

La siguiente tabla muestra el número de divorcios que se efectuaron desde 1982 hasta 1986. Presentar la información por medio de un gráfico de líneas. DIVORCIOS REALIZADOS 1982 - 1986

Año 1982 1983 1984 1985 1986

2.

Número de divorcios 1,700 1,700 1,500 1,900 2,000

A continuación aparecen las cantidades de personas que procedentes de Estados Unidos, visitaron El Salvador en calidad de turistas desde 1985 hasta 1989. Presentar los datos por medio de un gráfico de líneas. INGRESO DE TURISTAS, PROCEDENTES DE E.E.U.U. 1985 -1989

Año 1985 1986 1987 1988 1989

Miles de turistas 22.5 25.6 28.3 37.9 32.5

MATEMÁTICA • UNIDAD SEIS

89

3. La siguiente tabla muestra la producción de azúcar blanca desde 1987 hasta 1989. Presentar los datos por medio de un pictograma. PRODUCCION DE AZÚCAR BLANCA. 1987 - 1989

Año 1987 1988 1989

90

MATEMÁTICA • PRIMERO DE BACHILLERATO

Millones de quintales 2.9 2.6 3.5

Autoevaluación nº 2

1. El cuadro proporciona la población del área metropolitana de San Salvador, en períodos de 10 años, desde 1950 hasta 1990. Representa los datos por medio de un gráfico de líneas.

Año

Población (millones)

1950 1960 1970 1980 1990

0.20 0.35 0.57 0.87 1.25

2. El cuadro indica las cantidades de queso que se importaron de los principales países proveedores durante el año de 1988. Presenta los datos por medio de un pictograma.

País Guatemala Dinamarca Nueva Zelandia

Kilogramos queso 50,000 150,000 175,000

MATEMÁTICA • UNIDAD SEIS

91

b) Variables continuas ❚ Tabla de distribución de frecuencias Hemos dicho anteriormente que un cuadro o tabla estadística, que contiene la información resumida, se llama Tabla de Distribución de Frecuencias. Cuando se desea resumir un número grande de datos de variable continua, para presentarlos por medio de una Tabla de Distribución de Frecuencias, se agrupan los diversos valores en un número reducido de clases, llamados intervalos de clase. Para agrupar un conjunto de datos, haciendo uso de intervalos de clase, se sigue el procedimiento siguiente:

1. Primero debe decidirse cuántos intervalos se considerarán. 2. Se encuentran el recorrido, el cual es igual a la mayor de las observaciones menos la menor de las observaciones. 3. Se divide el recorrido entre el número de intervalos de clase que se desean y este resultado es la amplitud o ancho de cada intervalo. 4. Se forman los intervalos, agregando el ancho al límite inferior de cada clase, principiando por el menor de todos los datos. 5. Se determinan, de entre todas las observaciones, aquellas que pertenecen a cada clase o intervalo.

Ejemplo 1 Las siguientes son las estaturas, en centímetros, de 44 aspirantes a ingresar a la Universidad. 167, 156, 154, 159, 162, 156, 160, 166, 162, 165, 162, 158, 169, 159, 162, 173, 156, 165, 158, 165, 174, 155, 157, 164, 185, 158, 168, 163, 173, 178, 162, 173, 159, 158, 170, 159, 175, 167, 163, 155, 161, 162, 160, 167. Resumir los datos anteriores por medio de una tabla de Distribución de Frecuencias que conste de cinco intervalos de clase.

92

MATEMÁTICA • PRIMERO DE BACHILLERATO

Solución: Como la altura máxima es 185 cms. y la mínima 154 cms. se tiene lo siguiente: 2. Recorrido: 185 cms. - 154 cms. = 31 cms. 3. Ancho del intervalo de clase:

Recorrido = 31 cms. = 6.2 Nº de intervalos 5

4. Como el valor más pequeño es 154 cms., éste es el límite inferior del primer intervalo. Al sumarle a este valor, el ancho 6.2 se obtiene 160.2, que es el límite superior del primer intervalo. De acuerdo con esto, el primer intervalo va desde 154 cms. hasta 160.2 cms. Esto lo podemos denotar de la manera siguiente:

Límite inferior

154

160.2





Límite superior

Ahora sumamos a 160.2 el valor del ancho 6.2, obteniendo así el segundo intervalo, que va de 160.2 cms. hasta 166.4 cms. Se tienen, en este momento, los dos intervalos siguentes: 154

160.2

160.2

166.4 INTERVALOS

Al sumar a 166.4 el valor 6.2, del ancho, se tiene el tercer intervalo 166.4 172.6. De manera similar se encuentran los restantes intervalos, para obtener finalmente lo siguiente:

154.0 160.2 166.4 172.6 178.8

160.2 166.4 172.6 178.8 185.0

MATEMÁTICA • UNIDAD SEIS

93

Podemos observar que el límite superior de un intervalo, aparece también como límite inferior del intervalo siguiente y como cada valor debe aparecer solamente en un intervalo, podemos perfectamente utilizar una notación como la siguiente:

INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 •

160.2 166.4 172.6 178.8 • 185

Con ésta notación queremos indicar que para los primeros cuatro intervalos, el límite superior de cada uno de ellos, no está incluido, pero sí el límite inferior. Mientras que en el último intervalo están incluidos los dos límites, tanto el inferior, que es 178.8, como el superior 185. También podríamos utilizar la notación siguiente: INTERVALOS 154 • 160.2 166.4 172.6 178.8

• • • • •

160.2 166.4 172.6 178.8 185

En este caso queremos indicar que el primer intervalos incluye los dos límites, tanto el inferior como el superior; pero los últimos cuatro intervalos solamente incluyen el límite superior y no así el límite inferior. Estas dos notaciones son opcionales y la persona que elabore la tabla puede perfectamente utilizar cualquier otra notación, siempre y cuando quede claramente establecido, cuáles valores incluye el intervalo respectivo y cuáles no.

94

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ilustración:

Extremo inferior incluido • •

Extremo inferior incluido •

Extremo superior incluido

• Extremo superior incluido

Al construir los intervalos debe tenerse presente que el límite inferior del primer intervalo corresponde al menor de todos los datos y el límite superior del último intervalo corresponde al mayor de todos los datos. Y que estos dos valores, tanto el menor como el mayor deberán ser siempre incluidos. 5. Finalmente para construir la tabla contamos el número de datos que caen en cada intervalo, y este número lo anotamos en la columna correspondiente a las frecuencias, teniéndose así los siguiente:

INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 • TOTAL

160.2 166.4 172.6 178.8 • 185

FRECUENCIA 17 14 6 6 1 44

Como la información, contenida en la tabla, debe ser clara, lo más conveniente es ponerle título y encabezados que indiquen de manera inequívoca de qué trata el cuadro. Es decir que una mejor manera de expresar el cuadro anterior, es el siguiente:

MATEMÁTICA • UNIDAD SEIS

95

ESTATURAS DE 44 ASPIRANTES A LA UNIVERSIDAD INTERVALOS 154 • 160.2 • 166.4 • 172.6 • 178.8 •

160.2 166.4 172.6 178.8 • 185

TOTAL

FRECUENCIA 17 14 6 6 1 44

La tabla de Distribución de Frecuencias anterior puede ser ampliada con una tercer columna, en donde se indiquen los porcentajes de alumnos que están comprendidos entre las distintas estaturas. Esta columna se encabeza con el nombre de frecuencia relativa.

Definición: Frecuencia relativa es el porcentaje de

observaciones que corresponde a cada intervalo.

La frecuencia relativa, que se designa por fr, se obtiene dividiendo la frecuencia f entre el tamaño n de la muestra y multiplicando luego por 100%.

En otras palabras

fr= nf 100%

Ejemplo 2 : Cincuenta estudiantes se sometieron a un examen de Estadística I, obteniendo las calificaciones siguientes:

5.2, 4.2, 5.7, 8.8, 4.7, 4.2, 6.2, 4.0, 5.3, 6.5, 7.8, 5.5, 5.8, 7.8, 6.3, 6.8, 4.0, 7.0, 6.8, 6.0, 6.5, 9.0, 7.3, 5.3, 4.5, 8.2, 4.3, 4.0, 6.0, 3.0, 5.3, 5.2, 5.0, 2.0, 4.2, 4.5, 2.2, 5.3, 4.5, 4.7, 2.5, 10.0, 4.2, 8.0, 7.3, 7.5, 5.5, 5.5, 6.5, 6.8.

96

MATEMÁTICA • PRIMERO DE BACHILLERATO

Resumir ésta información por medio de una tabla de distribución de frecuencias, que esté formada por cinco intervalos, de tal manera que el límite inferior de cada uno de ellos esté incluido. Agregar a la tabla no solamente las frecuencias, si no que tambien las frecuencias relativas.

Solución: Ancho de cada intervalo=

Recorrido = 10.0 - 2.0 = 1.6 No. de intervalos 5

De acuerdo con este ancho, la información total correspondiente al primer intervalo es la siguiente:

Primer intervalo 3.6

2.0

Frecuencia

Frecuencia relativa

4

4 x 100% = 8% 50

Segundo intervalo 5.2

3.6

14 50

14

x 100%= 28%

De la misma manera se forman los siguientes tres intervalos. La tabla de distribución de frecuencias, queda entonces, así:

CALIFICACIONES DE 50 ESTUDIANTES. ESTADISTICA I CALIFICACIONES

2.0 • 3.6 • 5.2 • 6.8 • 8.4 •

3.6 5.2 6.8 8.4 • 10.0 TOTAL

f NO. DE ALUMNOS

4 14 18 11 3 50

fr PORCENTAJE

8% 28% 36% 22% 6% 100%

MATEMÁTICA • UNIDAD SEIS

97



NOTA:

El total correspondiente a las frecuencias debe ser igual al número de datos, que en este caso son cincuenta; mientras que el total correspondiente a las frecuencias relativas debe ser siempre igual al 100%. Cuando se agrupe un conjunto de datos haciendo uso de intervalos de clase deberá tenerse presente el hecho de que entre menos intervalos de clase tenga la tabla de distribución de frecuencias, más fácil será la “lectura” de la información; porque los datos estarán más concentrados, ésta por supuesto será una ventaja; pero también existirá una desventaja y es la de que entre menos intervalos tenga la tabla, más pérdida de información habrá. Quizás lo deseable sería que el número de intervalos no fuera menor que 5; pero tampoco mayor de 10. En definitiva el número de intervalos lo dictará cada circunstancia en particular.

98

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ejercicios Nº 3

1. Se dan a continuación los pesos en libras, de 80 jóvenes bachilleres: 110, 150, 127, 105, 155, 140, 170, 160, 160, 125, 136, 145, 170, 150, 115, 140, 148, 155, 133, 105, 145, 180, 120, 135, 110, 140, 120, 150, 125, 130, 120, 115, 150, 155, 105, 165, 98, 105, 210, 120, 120, 151, 96, 118, 137, 140, 140, 108, 158, 152, 145, 110, 175, 130, 130, 135, 127, 135, 132, 150, 140, 111, 125, 190, 150, 150, 130, 117, 140, 168, 97, 170, 158, 128, 130, 135, 115, 145, 175, 140. Resumir la información anterior por medio de una tabla de distribución de frecuencias relativas, y que conste de cinco intervalos, en donde el límite inferior de cada intervalo esté incluído. 2. Las estaturas, en cms., de sesenta estudiantes universitarios de segundo año son: 160, 157, 178, 163, 173, 156, 165, 160, 174, 155, 165, 156, 171, 167, 172, 155, 172, 189, 170, 171, 159, 163, 170, 151,172, 168, 152, 171, 170, 160, 174, 175, 165, 165, 170, 160, 178, 179, 165, 179, 170, 167, 170, 160, 154, 157, 154, 170, 178, 170, 160, 162, 155, 165, 152.

160, 160, 179, 185, 181,

Resumir la información anterior por medio de una tabla de distribución de frecuencias, en que aparezcan tanto las frecuencias como las frecuencias relativas. La tabla deberá constar de 6 intervalos y el límite superior de cada intervalo deberá estar incluido.

MATEMÁTICA • UNIDAD SEIS

99

Gráficos para variables continuas Los datos agrupados haciendo uso de intervalos de clase, pueden representarse por medio de varios gráficos. Los principales gráficos que se utilizan par representar las frecuencias o las frecuencias relativas son: Histograma y Polígono de Frecuencias.

❚ Histograma Este gráfico se utiliza para representar tanto las frecuencias como las frecuencias relativas.

El Histograma se construye de la manera siguiente: 1) En el eje horizontal se marcan los intervalos de clase. 2) En el eje vertical se marcan las frecuencias. 3) Se levanta, sobre cada intervalo, un rectángulo cuya base coincida con el ancho del intervalo y cuya altura sea igual a la frecuencia respectiva.

Ejemplo 1: La cantidad de alumbramientos que hubo en el año de 1986 y las edades de las madres, aparecen en el cuadro siguiente. Presentar la información por medio de un histograma. ALUMBRAMIENTOS SEGUN EDAD DE LA MADRE. 1986 Edad de la madre (años) 10 • 15 • 20 • 25 • 30 • 35 • 40 • 45 • 50 •

15 20 25 30 35 40 45 50 • 55

TOTAL

100

MATEMÁTICA • PRIMERO DE BACHILLERATO

Número de alumbramientos 500 28,100 46,300 31,000 18,000 10,900 4,100 1,100 100

140,100

Solución: 5050

Número de alumbramientos (en miles)

Número de alumbramientos (en miles)

45 45 4040

3535

3030

2525

20 20

1515

10 10

5

5 0 5 5

10 10

15 15

20 20

25 25

30 30

35 35

40 40

45 45

50 50

55 55

Edad de las Edad de las madres (años)

madres (años)

Como ya hemos dicho anteriormente, el histograma se utiliza no solamente para representar las frecuencias, sino que también puede utilizarse para representar las frecuencias relativas. Para los datos del ejemplo anterior queremos construir un histograma por medio del cual se presenten las frecuencias relativas o porcentajes. Entonces es necesario calcular primero las frecuencias relativas. Al agregarle la columna correspondiente a las frecuencias relativas, la tabla de distribución de frecuencias queda de la manera siguiente:

MATEMÁTICA • UNIDAD SEIS

101

ALUMBRAMIENTOS SEGUN LA EDAD DE LA MADRE. 1986 Edad de la madre (Años) 10 • 15 • 20 • 25 • 30 • 35 • 40 • 45 • 50 •

15 20 25 30 35 40 45 50 • 55

Nº de alumbramientos 500 28,100 46,300 31,000 18,000 10,900 4,100 1,100 100

TOTAL

140,100

fr Porcentaje 0.36% 20.06% 33.05% 22.13% 12.85% 7.78% 2.92% 0.78% 0.07% 100.00%

Para que la suma total de los porcentajes sea de 100%, se ha hecho lo siguiente: En el intervalo séptimo 2.926% se ha aproximado a 2.92%. En el intervalo octavo

0.785% se ha aproximado a 0.78%.

Esto se hizo así, porque en estos dos intervalos los decimales que se han despreciado son menores que los que tendrían que despreciarse en los restantes intervalos y como ya lo hemos dicho antes, se busca siempre que la suma total de los porcentajes sea del 100%. Si para ello hay que aumentar o despreciar pequeñas aproximaciones decimales, deberá hacerce esto. Ahora que ya tenemos calculadas las frecuencias relativas, podemos graficar el histograma. El histograma correspondiente a las frecuencias relativas es el mismo que el histograma correspondiente a las frecuencias. La única diferencia es que en el eje vertical no se colocan las frecuencias sino que los porcentajes.

102

MATEMÁTICA • PRIMERO DE BACHILLERATO

El histograma queda de la manera siguiente::

Porcentaje

33% 33% 30% 30%

27% 27%

24% 24% 21% 21%

18% 18% 15% 15%

12% 12% 9% 9% 6%

6%

3%

3% 0

0 5 5

10 10

15 15

20 20

25 25

30 30

35 35

40 40

45 45

50 50

55 55

Edad de las madres Edad (años) de las madres (años)

MATEMÁTICA • UNIDAD SEIS

103

Ejercicios Nº 4

1. Presentar por medio de un histograma los datos correspondientes a las estaturas de 60 estudiantes, que aparecieron en los ejercicios Nº 3 y graficar las frecuencias y también las frecuencias relativas. 2. El promedio de vida al nacer o esperanza de vida en años, del pueblo salvadoreño durante distintas épocas se presenta en el siguiente cuadro. Representar los datos por medio de un histograma.

ESPERANZA DE VIDA AL NACER. 1950 - 1975 Época/tiempo 1950 • 1955 • 1960 • 1965 • 1970 •

Esperanza de vida (años) 1955 1960 1965 1970 1975

46.7 49.6 52.9 56.0 59.0

3. Representar por medio de un histograma los datos correspondientes a los pesos de 80 jóvenes que aparecen en los ejercicios Nº 3.

104

MATEMÁTICA • PRIMERO DE BACHILLERATO

Autoevaluación Nº 3

Se dan a continuación las calificaciones que 80 estudiantes obtuvieron en matemática: 6.0, 7.0, 0.5, 5.1, 5.4, 5.5, 2.3, 1.9, 4.6, 3.3, 4.3, 0.8, 0.7, 5.5, 2.8, 3.3, 7.1, 1.5, 6.0, 6.8, 3.1, 3.0, 0.9, 6.6, 1.6, 0.8, 5.6, 2.2, 3.9, 1.1, 5.6, 6.3, 4.6, 6.9, 4.2, 5.6, 6.8, 5.0, 6.0, 6.0, 3.7, 7.9, 6.0, 5.6, 6.2, 10.0, 9.2, 7.0, 8.8, 9.4.

6.0, 2.5, 4.1, 6.3, 5.5, 2.9, 3.4, 7.9, 6.0, 1.5, 4.9, 6.8, 6.5, 4.9, 4.5, 8.4, 4.4, 6.1, 3.6, 6.7, 4.0, 6.0, 7.9, 5.5, 7.0,

2.4, 0.9, 3.3, 8.9, 8.4,

1. Resumir la información anterior por medio de una tabla de distribución de frecuencias y que conste de cinco intervalos. 2. Presentar los datos por medio de un histograma en el cual se indiquen las frecuencias. 3. Presentar los datos por medio de un histograma en el cual se indiquen las frecuencias relativas.

MATEMÁTICA • UNIDAD SEIS

105

3. Media artimética: x Mario, Toño, José y Luis son cuatro amigos. En base a su amistad, deciden lo siguiente: reunirán en un fondo común, todo el dinero que llevan consigo; para luego repartirlo en partes iguales y así ir a una excursión con igual cantidad de dinero. Mario aporta al fondo común 122 colones, Toño 38 colones, José 68 colones y Luis aporta 84 colones. El total que reúnen asciende a 312 colones; por lo tanto al dividirlo entre los cuatro, a cada uno le corresponden 78 colones. José ¢ 68.00

Toño ¢ 38.00

Luis ¢ 84.00

¢ 312.00

Mario

X= 312 = 78 4

¢ 122.00

La cantidad que le toca a cada uno, al repartir el fondo común, es la que se conoce con el nombre de media aritmética.

Definición. La Media Aritmética, de un conjunto de datos, se calcula sumando todos los datos y dividiendo esta suma entre el número de datos.

Si se tienen los n datos siguientes: x1, x2, ..., xn. Entonces la media aritmética de ellos es: X=

106

x1 + x2 + ... + xn n

MATEMÁTICA • PRIMERO DE BACHILLERATO

Para representar la suma de varios valores se acostumbra usar la letra griega ∑, que se llama sigma. n

Así el símbolo ∑ x i, nos dice que debemos sumar los elementos que i=1

se encuentran a la derecha del signo ∑ , los cuales empiezan con x1 (cuando i=1) y terminan con xn (cuando i=n). Al utilizar ésta notación, podemos expresar la media aritmética de la manera siguiente: n

X=

∑ xi x1 + x2 + ... + xn = i=1 n n

Notación:

La media aritmética de una muestra se designa por: X La media aritmética de una población se designa por: µ

Si X es la media de x1, x2 , ..., xn . Esto quiere decir que X representa lo que correspondería a todos y cada uno de los elementos x1, x2, ..., xn, si se hiciera un reparto del total. Observemos que por definición:

X=

x1 + x2 + ... + xn n

Al despejar se tiene: nX = x1 + x2 + x3 + ... + xn X + X + ... + X = x1 +x2 + x3+ ... + xn n veces la media

suma total de los n datos

MATEMÁTICA • UNIDAD SEIS

107

De acuerdo con ésta última igualdad, el total que resulta al sumar los n datos es igual al total que resulta al sumar n veces la media. En otras palabras si cada uno de los valores es sustituido por su media entonces la suma total no se altera. (Recuerda el fondo común de los cuatro amigos).

Ejemplo 1 : Las edades de Juan, Pedro, Luis y Antonio son respectivamente 16, 14, 18, 12 años. Encontrar la edad media de los cuatro.

Solución: Sea

X

=

Edad media

Al aplicar la fórmula para la media, resulta: X= 16 + 14 + 18 + 12 = 15 años 4

Ejemplo 2 : Encontrar la media aritmética de los números siguientes:100, 102, 104, ..., 200, 202.

Solución: Podemos ver que hay 52 números en total, por lo tanto: X= 100 + 102 + 104 + ... + 200 + 202 52 Sumar los cincuenta y dos términos del numerador es un proceso bastante largo, aún haciendo uso de calculadora; sin embargo los cálculos se pueden simplificar si observamos lo siguiente:

100, 102, 104, 106, ..., 150, 152, ..., 196, 198, 200, 202

302

108

MATEMÁTICA • PRIMERO DE BACHILLERATO

La suma de cada una de las veitiséis parejas de números que están unidas por la flecha es siempre igual a 302, es decir que:

26 igualdades





100 + 202 = 302 102 + 200 = 302 150 + 152 = 302

Esto nos facilita los cálculos. x = 100 + 102 + 104 + ... +200 + 202 = 302 (26) = 151 52 52

Ejercicios Nº 5

1. Encuentre la media aritmética de los números siguientes: 27, 28, 29, ... , 254, 255, 256 2. Un niño tiene en su bolsillo 15 monedas de a cinco centavos, otro tiene 13 monedas de diez centavos. Si un tercer niño tiene 7 monedas de veinticinco centavos; mientras que un cuarto tiene 3 monedas de a colón. ¿Cuál es la cantidad media de dinero que tienen entre los cuatro?

MATEMÁTICA • UNIDAD SEIS

109

Autoevaluación Nº 4

1. Calcule la media de los números siguientes: 1, 5, 9, 13, ... , 77 2. En un supermercado trabajan 30 personas, las cuales tienen un sueldo medio mensual de 2,300 colones. si se paga a cada trabajador 13 sueldos al año ¿A cuánto asciende la cantidad de dinero anual que dicho supermercado paga en total a los 30 empleados?

a) Propiedades de la media Definición: Llamaremos desviaciones a las diferencias (con el

correspondiente signo) entre los valores de la variable y un valor fijo.

Las principales propiedades matemáticas que posee la media aritmética se enuncian a continuación:

Ejemplo 1: Las edades, en años, de cinco jóvenes son 16, 19, 23, 20 y 17. Encontrar la edad media y verificar que la suma de las desviaciones respecto a la media, es cero. Solución: Sea

X

Entonces:

110

=

Edad media

X = 16 + 19 + 23 + 20 + 17 = 19 años 5

MATEMÁTICA • PRIMERO DE BACHILLERATO

La suma de las desviaciones es: n

∑ (xi - X)

= (16 - 19) + (19 - 19) + (23 - 19) + (20 - 19) + (17 - 19)

1=1

= -3 + 0 + 4 + 1 - 2 =0

Propiedad 1

“La suma de las desviaciones de las variables respecto a la media aritmética, es siempre igual a cero”.

Simbólicamente esto mismo se expresa de la manera siguiente: n

∑ (xi - X) = 0 1=1

Ejemplo 2 : Los gastos en golosinas, que efectuó un estudiante, durante cada uno de los cinco días de clases de la semana pasada fueron: ⊄4.00, ⊄4.00, ⊄4.00, ⊄4.00 y ⊄4.00. ¿Cuál fue el gasto medio diario de dicho estudiante para esos cinco días?

Solución: Sea Entonces:

X = Gasto medio X = 4 + 4 + 4 + 4 + 4 = ¢4.00 5

MATEMÁTICA • UNIDAD SEIS

111

Propiedad 2

La media aritmética de un valor constante, es la misma constante.

Prueba: Si cada uno de los valores observados x1, x2, ..., xn es igual a una constante C , entonces:

X=

x1 + x2 + ... + xn ... + C = nC = C =C+C+ n n n

Notación: Qué la media de una constante es igual a la misma constante se puede expresar de la siguiente manera: C=C

Ejemplo 3: Encontrar la media aritmética para 40, 50, 38, 101, 145 y 178. Multiplicar luego cada uno de los datos anteriores por 7 y obtener la media de los nuevos valores resultantes.

Solución: X = 40 + 50 + 38 + 101 + 145 + 178 = 92 6 Al multiplicar cada dato por 7 se tiene: 280, 350, 266, 707, 1,015 y 1,246. La media de estos nuevos datos es: X = 280 + 350 + 266 + 707 + 1,015 + 1,246 = 644 6 Vemos claramente que la segunda media es igual al producto de la primer media por 7, es decir 7(92) = 644.

112

MATEMÁTICA • PRIMERO DE BACHILLERATO

Propiedad 3

La media del producto de una constante por una variable es igual al producto de la constante por la media de la variable.

Notación: CX=CX Prueba:

Si los valores observados son x1, x2, ..., xn . Al multiplicar por la constante C, resulta Cx1, Cx2, ..., Cxn .

Entonces: CX=

Cx1 + Cx2 + ... + Cxn C(x1 + x2 + ... + xn) = n n = C

x1 + x2 + ... + xn n

= CX

De acuerdo con esta propiedad 3, si cada uno de los valores de una muestra, se multiplica por una constante C , entonces la media de la muestra queda multiplicada por C.

Ejemplo 4: En una panadería laboran cinco panaderos cuyo sueldo mensual medio es de ⊄1,600.00. Si el dueño de la panadería aumenta los sueldos de los panaderos en un veinte por ciento, ¿Cuál es el nuevo sueldo mensual medio de los cinco panaderos?

MATEMÁTICA • UNIDAD SEIS

113

Solución: Sea Entonces:

0.20X

X = Sueldo mensual de un panadero cualquiera = Aumento mensual de un panadero cualquiera

De acuerdo con esto, el nuevo sueldo mensual de cada uno de los panaderos es: x + 0.20x = 1.20x Como para obtener el nuevo sueldo se ha multiplicado por 1.20 cada uno de los sueldos originales, entonces el nuevo sueldo medio es: 1.20 (1,600) = ⊄1,920.00

Ejemplo 5: Encontrar la media aritmética para 75, 61, 94, 150 y 45. Sumar luego 20 a cada uno de los datos anteriores y obtener la media de los nuevos valores.

Solución: X = 75 + 61 + 94 + 150 + 45 = 85 5 Al sumar 20 a cada dato resultan los nuevos valores: 95, 81, 114, 170, 65. La media de estos nuevos valores es: X = 95 +81 + 114 + 170 + 65 = 105 5 La segunda media es igual a la primera media más 20. O sea que si a cada uno de los valores de una muestra se le suma una misma constante, entonces la media de la muestra queda aumentada en dicha constante.

114

MATEMÁTICA • PRIMERO DE BACHILLERATO

Propiedad 4

La media de la suma de una variable más una constante es igual a la media de la variable más la constante

Notación: X+C=X+C Prueba: Si los valores observados son: x1, x2, ..., xn Al sumarle la constante C a cada uno de ellos, resulta:

x1 + C, x2 + C, ..., xn + C La media de estos nuevos datos es: X+C=

(x1 + C) + (x2 + C) + ... + (xn + C) n x1 + x2 + ... + xn + C + C + ... + C n

=

x1 + x2 + ... + xn + C + C + ... + C n n

=

x1 + x2 + ... + xn + nC = X + C n n

{

=

X

C

MATEMÁTICA • UNIDAD SEIS

115

Propiedad 5

Si f1 números tienen como media a X1 f2

. . .

fn









. . .

.

. . .

. . .





” ” Xn

. .



” X2

. . .

. . .

Entonces la media de todos los números es: X=

f1 X1 + f2 X2 + ... + fn Xn f1 + f2 + ... + fn

Ejemplo 6: En séptimo grado hay 125 estudiantes inscritos y su edad media es de 13 años. En octavo grado hay 100 estudiantes y su edad media es de 14 años; mientras que en noveno grado hay 70 estudiantes con una edad media de 15 años. ¿Cuál es la edad media para los tres años de tercer ciclo? Solución: En este caso: f1 = 125

y

X1 = 13

f2 = 100

y

X2 = 14

f3 = 70

y

X3 = 15

La edad media de todos es: X=

f 1 X 1 + f2 X 2 + f3 X 3 f 1 + f2 + f3

= 125(13) + 100(14) + 70(15) 125 + 100 + 70 = 13.81 años

116

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ejercicios Nº 6

1. La media de los datos: 45, 62, 89, 92 y 112, es: La nueva media que se obtiene cuando a cada uno de los datos anteriores: a) Se le suma 18 es: b) Se le resta 12 es: c) Se le multiplica por 5 es: d) Se le divide entre 4 es: 2. En una fábrica laboran 200 obreros cuyo sueldo mensual medio es ¢ 1,800.oo. Se llega a un acuerdo con el dueño para que el próximo año efectúe dos aumentos de sueldo, uno en el mes de febrero y otro en el mes de julio. Uno de los aumentos deberá ser de 200 colones y el otro consistirá en el 12% del sueldo que el obrero esté devengando a la hora del aumento. Entonces: a) El aumento que conviene a los obreros se efectúe primero es el de: b) El nuevo sueldo medio después de efectuar los dos aumentos en el orden que le conviene a los obreros es: c) Al dueño le conviene efectuar primero el aumento de : d) El nuevo sueldo medio después de efectuar los dos aumentos, en el orden que le conviene al dueño es: e) Si el dueño efectúa los dos aumentos en el orden en que a él le conviene. Entonces mensualmente dejará de pagar la cantidad total de dinero siguiente: 3. Un grupo de clase formado por 30 varones y 20 señoritas tiene, en matemática, una nota media de 6.2. Si la media para solamente las señoritas es de 6.8. Entonces la nota media de los varones solos es de:

MATEMÁTICA • UNIDAD SEIS

117

Autoevaluación Nº 5

1. Haciendo uso de un cordel se miden las cinturas de un grupo de atletas, resultando al final que la cintura media de éstos es de 72.6 cms. Posteriormente, al medir el cordel resulta que es 2cms. más largo de lo que se pensaba ¿Cuál es entonces la verdadera media para la cintura de los atletas? 2. El peso medio de 5 señoritas es de 98 libras; mientras que el peso medio de 12 varones es de 110 libras. ¿Cuál es el peso medio de las 17 personas? 3. En una granja avícola hay 3,200 pollos cuyo peso medio es de 4 libras. El propietario decide darles un nuevo alimento para pollos, cuya garantía es que aumenta el peso de cada pollo en un 10% semanalmente, si la garantía es verdadera, ¿Cuál es el meso medio de los pollos al cabo de 4 semanas? ¿Cuántas libras extras de carne de pollo obtendrá el propietario al cabo de 4 semanas?

118

MATEMÁTICA • PRIMERO DE BACHILLERATO

4. Medidas de dispersión Empecemos con la ilustración siguiente: Para probar la capacidad de los estudiantes, se decide efectuar dos exámenes, uno de Estadística y otro de Matemática. Los alumnos que obtengan las tres mejores calificaciones, en cada una de las materias, recibirán un premio. Diez estudiantes se someten al examen de Estadística y también diez se someten al de matemática. Obteniendo las notas siguientes: Estadística: 2, 3, 6, 7, 8, 8, 8, 9, 9, 10 Matemática: 6, 6, 6, 6, 6, 6, 7, 7, 10, 10 En ambos grupos la nota media es 7. Sin embargo en Estadística, quien obtuvo 7 no recibirá premio; porque hay seis estudiantes mejores que él. No así en matemática, en donde la nota 7 si es merecedora de premio, por existir solamente dos estudiantes con mejor nota que ésta. Podemos ver en la ilustración anterior que la media, por si sola, no ayuda a interpretar cabalmente los datos. Es necesario también tener una medida que permita apreciar cuán dispersos están los datos alrededor de ella.

Definición: Al grado con que los datos numéricos

tienden a extenderse alrededor de un valor medio, se le llama Variación o Dispersión de Datos.

Los Estadígragos de Dispersión se conocen también con el nombre de medidas de Dispersión o de Variabilidad. Y los principales son: Varianza y Desviación Típica.

MATEMÁTICA • UNIDAD SEIS

119

a. Varianza

Definición: Se llama Varianza a la media aritmética de los cuadrados de las desviaciones de los datos respecto a su media.

La varianza de los datos x1, x2, ..., xn que se denota por σ2 es entonces: σ2 =

(X1 - X)2 + (X2 - X)2 + (X3 - X)2 + ... + (Xn - X)2 n n

∑ (Xi - X)2 σ2 =

i =1

n

• La varianza muestral se denota por: s2 ó por σ2n -1 • La varianza poblacional se denota por: σ2 • Una varianza grande indica bastante variación de los datos.

Ejemplo 1: Encontrar la varianza de 16,14, 27, 3 y 20. Solución: Encontramos primero la media: X = 16 + 14 + 27 + 3 + 20 = 16 5 La varianza es: σ2=

(16 -16)2+ (14 - 16)2+ (27 - 16)2 + (3 - 16) 2+ (20 - 16) 2 5

σ2= 0 + 4 + 121 + 169 + 16 = 62 5 120

MATEMÁTICA • PRIMERO DE BACHILLERATO

Como la varianza es grande, en relación con los datos, podemos concluir que existe bastante variabilidad. O lo que es lo mismo, que hay datos que están bastante alejados de la media.

❚ Otra fórmula para calcular la varianza A partir de la definición podemos obtener otra manera para calcular la varianza y que simplifica un poco los cálculos. Por lo que recibe el nombre de Método Corto para el Cálculo de la Varianza. La deducción de la nueva fórmula es la siguiente. Por definición sabemos que: σ2 =

(X1 - X)2 + (X2 - X)2 + (X3 - X)2 + ... + (Xn - X)2 n

Al desarrollar los cuadrados se tiene: 2

σ2 =

2

2

2

2

2

X1 - 2XX1+ ( X ) + X2 - 2XX2 + ( X ) + ... + Xn - 2XXn + ( X ) n

Al agrupar términos: 2

2

2

2

2

2

X1+X2 + ... +Xn - 2XX1 - 2XX2 - ... - 2XXn+( X ) +( X ) +...+( X ) σ2 = n 2

2

2

X1 + X2 + ... + Xn X1+ X2 + ... + Xn n( X ) 2 σ2 = - 2X + n n n X 2 2 2 X1 + X2 + ... + Xn 2 σ2 = -2XX+(X) n σ2 =

σ2 =

2

2

2

2

2

2

X1 + X2 + ... + Xn 2 2 -2(X)+(X) n X1 + X2 + ... + Xn n

-(X)

2

MATEMÁTICA • UNIDAD SEIS

121

Esta última igualdad dice que la varianza es igual a

“La media de los cuadrados menos el cuadrado de la media”.

Ejemplo 2 : Calucular la varianza de 6, 8, 9, 10, 4, 5. Haciendo uso de las dos fórmulas.

Solución : • Primera fórmula: X = 6 + 8 + 9 + 10 + 4 + 5 = 7 6

σ2 =

(6 - 7)2 + (8 - 7)2 + (9 - 7)2 + (10 - 7)2 + (4 - 7)2 + (5 - 7)2 = 4.7 Aprox. 6

• Segunda fórmula: (Método corto) 2 2 2 2 2 2 σ2 = 6 + 8 + 9 + 10 + 4 + 5 - 7 2 6

σ2 = 322 - 49 6 σ2 = 4.7 (aproximadamente)

Como podemos ver, el resultado es el mismo por ambos métodos.

122

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ejercicio Nº 8

Haciendo uso de las dos fórmulas estudiadas, encontrar la varianza de 5, 10, 25, 50 y 100. Solución: X=

=

Según la primer fórmula de la varianza se tiene: S2 = S2 = S2 = Según el método corto: S2 = S2 =

-

S2 =

b) Desviación típica: S

Definición: La Desviación Típica es igual a la raíz

cuadrada (con signo positivo) de la varianza.

La Desviación Típica es la más importante de las medidas de dispersión. Es la que mejor mide cuánto se separan los datos con respecto a su medida. En las calculadoras de bolsillo la desviación típica se designa por s y también por σn. Depende de la marca de la calculadora. La varianza, como medida de variabilidad, tiene el inconveniente de que se expresa en unidades distintas a las de la variable original.

MATEMÁTICA • UNIDAD SEIS

123

Si por ejemplo se está estudiando el peso, en libras, de un grupo de personas. Entonces la varianza dá la variabilidad en libras al cuadrado. La desviación típica en cambio dá la variabilidad en las mismas unidades que la variable original. En este caso daría la variabilidad en libras. De acuerdo con la definición, la desviación típica de los datos: x1, x2, ..., xn se obtiene por medio de la fórmula:

σ=

X21 + X22 + ... + Xn2 n

– ( X )2

Aunque para datos dispersos lo mejor es obtenerla directamente por medio de la calculadora de bolsillo.

Ejemplo 1: Las edades en años de 25 estudiantes de 2º año de la Universidad son: 20, 21, 22, 19, 20, 19, 19, 19, 20, 19, 22, 20, 20, 20, 20, 19, 20, 20, 19, 20, 19, 20, 21, 22, 19. Encontrar la desviación típica de las edades.

Solución: Primera manera (por medio de la fórmula)

X=

σ=

9(19) + 11(20) + 2(21) + 3(22) = 19.96 años 25

9(19)2 + 11(20)2 + 2(21)2 + 3(22)2 25

124

MATEMÁTICA • PRIMERO DE BACHILLERATO

- (19.96)2 = √ 0.9184 = 0.9583

Segunda manera (Haciendo uso de la caltculadora) a) Coloca la calculadora de modo estadístico (SD) b) Introduce cada uno de los datos a memoria ( ∑+) ó ( M+) c) Marca el valor correspondiente a Sn

ó

σx

Paso a paso, si tienes una calculadora Casio o Texas Instrument, hace lo siguiente:

Casio Introduce

Presiona .

MODE

Texas Instrument Aparece en pantalla SD

INV. SAC AC

Presiona

Aparece en pantalla

20

Σ+

1

21

Σ+

2

22

Σ+

3

Introduce

20

M+

20

21

M+

21

.:

.:

.:

.:

.:

.:

20

Σ+

22

20

M+

20

21

Σ+

23

21

M+

21

22

Σ+

24

22

M+

22

19

Σ+

25

19

M+

19

2nd [Sx].

0.9583

INV. [σn]

0.9583

MATEMÁTICA • UNIDAD SEIS

125

Si a la media se le suma una desviación típica y se le resta también una desviación típica, entonces se forma un intervalo. El cual abarca, en algunas ocasiones, el 68% de los datos. ( 68% de los datos ) X - σn

X

X + σn

Para los datos del ejemplo 6 se tiene el intervalo siguiente:

( 19.0017

19.96

) 20.9138

Este intervalo incluye 13 de las 25 edades, es decir el 52% del total. Podemos comprobar con este ejemplo que la afirmación que dice que el intervalo debía contener al 68% de los datos, es una afirmación empírica (es decir no sustentada en ninguna prueba matemática).

Ejercicio Nº 8

Para los números 4, 9, 16, 20, 28, 51 calcular la Desviación Típica. a) Haciendo uso de la fórmula b) Haciendo uso de la calculadora

126

MATEMÁTICA • PRIMERO DE BACHILLERATO

a) Propiedades

Propiedad 1:

La desviación típica nunca es negativa.

Propiedad 2:

La desviación típica de un dato constante es cero. No podía ser de otra manera, ya que en una constante no hay variabilidad.

Propiedad 3:

La desviación típica del producto de una constante por una variable es igual a la constante por la desviación típica de la variable.

En otras palabras: Si la desviación típica de x1, x2, ..., xn, es S Entonces la desviación típica de Cx1 + Cx2 , ..., Cxn es CS

Propiedad 4:

La desviación típica de la suma de una variable y una constante es igual a la desviación típica de la variable.

Es decir que: Si la desiviación típica de x1, x2, ..., xn, es S entonces la desviación típica de x1 + C, x2 + C, ..., xn + C es S

MATEMÁTICA • UNIDAD SEIS

127

Ejemplo 2 Las calificaciones obtenidas por un grupo de estudiantes poseen una desviación típica de 1.5 puntos. ¿Cuál es la nueva desviación típica de las calificaciones si a cada estudiante se le aumenta: a) ¿El diez por ciento de la nota obtenida? b) ¿Un punto?

Solución: Se sabe que S = 1.5 a) Sea X = Nota obtenida por un estudiante Entonces al aumentarle el 10%, la nueva nota es: x + 0.10x = 1.10x Como la nueva nota se obtiene multiplicando por 1.10 la nota original. Entonces por la propiedad 3, la nueva desviación típica es: 1.10S = 1.10 ( 1.5 ) = 1.65 b) De acuerdo con la propiedad 4, en este caso la desviación típica no se modificará después de aumentar un punto a cada uno de los estudiantes y sigue siendo: S = 1.5

128

MATEMÁTICA • PRIMERO DE BACHILLERATO

Ejercicio Nº 9

Calcule la desviación típica de 39, 75, 84, 93, 96 y 116. La desviación típica es: a) Si a cada uno de los 6 datos se le suma 15, entonces la nueva desviación típica es: b) Si a cada uno de los 6 datos se le resta 10, entonces la nueva desviación típica es: c) Si cada uno de los 6 datos se multiplica por 8, entonces la nueva desviación típica es: d) Si cada uno de los datos se divide entre 3, entonces la nueva desviación típica es:

MATEMÁTICA • UNIDAD SEIS

129

Autoevaluación Nº 6

1. Un niño tiene en su bolsillo 7 monedas de a veinticinco centavos, otro tiene 11 monedas de a diez centavos. Si un tercer niño tiene 15 monedas de a cinco centavos y un cuarto tiene 4 monedas de a colón. Encontrar la desviación típica del dinero que tienen los cuatro. 2. Las edades actuales en años, de 3 amigos son: 42, 50, 52. a) Encuentra la desviación típica de las edades b) ¿Cuál era la desviación típica hace 10 años? c) ¿Cuál será la desviación típica dentro de 10 años?

130

MATEMÁTICA • PRIMERO DE BACHILLERATO

Respuestas a los ejercicios

❚ Ejercicios Nº 1

1. Si ordenamos los datos de mayor a menor, entonces el gráfico debió quedarte más o menos de la manera siguiente:

1200 1200 1000 1000 800 800 600 600 400 400 200 4200

Educación Educación

Obras Obras públicas públicas

Defensa Defensa

Salud Salud

Policía Policía

Dependencia Dependencia Estatal Estatal

2. El gráfico es de la forma indicada a continuación: Miles de Miles de Manzanas manzanas

120 120 100 100 80 80 60 60 40 40 20 20

1981 1981

1983 1983

1985 1985

1987 1987

1989 1989

Año

Anno

MATEMÁTICA • UNIDAD SEIS

131

3)

4) Fútbol 50%

E.E.U.U. 52% Ciclismo 16.67%

Baloncesto 33.33%

Alemania 27.8%

Japón 11.5%

❚ Ejercicios Nº 2

1)

Número de divorcios

2,500 2,500

2,000 2,000 1,500 1,500

1,000 1,000

500 500

1982 1982

1983 1983

1984 1984

1985 1986

1986 1987

Años

1987 1987

1988 1988

1989 1989

Años

Número de turistas

2) 45,000 45,000 40,000 40,000 35,000 35,000

30,000 30,000 25,000 25,000 20,000 20,000 15,000 15,000

10,000 10,000

5,000 5,000

1985 1985

132

Otros 8.7%

MATEMÁTICA • PRIMERO DE BACHILLERATO

1986 1986

3) Producción de azúcar blanca

= un millón de quintales

1987

21900,000 qq

1988

21600,000 qq

1989

31500,000 qq

❚ Ejercicios Nº 3

1) Pesos (libras) 96 • 118.8 141.6 164.4 187.2 •

Número de bachilleres

Porcentajes

118.8 •141.6 •164.4 •187.2 •210

17 32 21 8 2

21.25% 40.00% 26.25% 10.00% 2.50%

TOTAL

80

100%

MATEMÁTICA • UNIDAD SEIS

133

2) Estaturas (cms) 151 • 157.33 163.66 169.99 176.32 182.65

Estudiantes Universitarios

157.33 • 163.66 • 169.99 • 176.32 • 182.65 • 189 •

Total

Porcentajes

12 12 9 18 7 2

20.00% 20.00% 15.00% 30.00% 11.67% 3.33%

60

100%

❚ Ejercicios Nº 4

1) a) Número de Número deestudiantes estudiantes

1818

1616

14 14

5,000 12 12

10 10

88

66 4 4

22 00

134

151 151

MATEMÁTICA • PRIMERO DE BACHILLERATO

189 163.66 169.99 169,99 176.32 176,32 182.65 182.65 189 157,33 163.66 157.33

Estatura (cms.) Estatura (cms.)

Número estudiantes Número dedeestudiantes

1) b)

30% 30% 27% 27%

24% 24% 21% 21% 18% 18%

15% 15% 12% 12% 9% 9% 6% 6% 3% 3%

00

189 151 189 163.66 169.99 169,99 176.32 176,32 182.65 182.65 151 157.33 157,33 163.66

Estatura (cms.) Estatura (cms.)

Esperanza vida ESperanzade de vida años en enaños

2) 60 60

50 50 40 40 30 30 20 20 10 10 0

3)

0

1950 1955 1960 1950 1955 1960

1965 1965

1970 1970

1975 1975

Época Época

Número Númerode de bachilleres bachilleres

35 35

30 30 25 25 20 20 15 15 10 10 55

0

0

96 96

118.8 187.2 210 164.4 187.2 210 118.8 141.6 141.6 164.4

peso Peso (libras (libras)

MATEMÁTICA • UNIDAD SEIS

135

❚ Ejercicios Nº 5

1) X = 27 + 28 + 29 + ... + 255 + 256 = 120(283) = 141.5 240

240

2) X = 15(5) + 13(10) + 7(25) + 3(100) = 170 centavos = 1.70 colones 4

❚ Ejercicios Nº 6

1) X = 80,

a) 98,

b) 68

2) a) El de 200 b) 2,240 colones c) El de 12%

c) 400

d) 20

d) 2,216 colones e) 4,800 colones

3) 5.8

❚ Ejercicios Nº 8

17.01959655

❚ Ejercicios Nº 9

S = 23.646 a) La misma

136

b) La misma

MATEMÁTICA • PRIMERO DE BACHILLERATO

c) S = 189.1689

d) S = 7.882

Solución a las autoevaluaciónes

❚ Autoevaluación Nº 1

I) 1) Cualitativo

2) Cuantitativo

3) Discreta

4) Continua

II) Estado Civil

Número de Mujeres

Casada Soltera Acompañada Divorciada Viuda

13 6 5 4 2

Total

30

Número de mujeres

Número de mujeres

14 14 12 12

10 10

88

66

44

Viuda

Viuda

Divorciada Divorciada

Acompañada Acompañada

Soltera Soltera

00

Casada Casada

22

Estado Estado civil civil

MATEMÁTICA • UNIDAD SEIS

137

IV) Naturales 50% Lenguaje 8.33%

Sociales 25%

Matemática 16.67%

❚ Autoevaluación Nº 2

1)

Habitantes

1,400,000 1,400,000 1,200,000 1,200,000 1,000,000 1,000,000 800,000 800,000

600,000 600,000 400,000 400,000 200,000 200,000

1950 1950

1960 1960

1970 1970

1980 1980

1990 1990

2) = 50,000 kgs

Guatemala

Dinamarca

Nueva Zelandia

138

MATEMÁTICA • PRIMERO DE BACHILLERATO

Años

❚ Autoevaluación Nº 3

1) Número de Estudiantes

Calificaciones • 2.4 • 4.3 • 6.2 • 8.1 • 10.0

0.5 2.4 4.3 6.2 8.1

Total

2)

Porcentaje

13 16 27 17 7

16.25% 20.00% 33.75% 21.25% 8.75%

80

100%

Número de estudiantes 28 28 26 26

24 24 22 22 20 20 18 18 16 16 14 14 12 12 10 10 8

8 66

4

4 2

2 0

0

0.5 0.5

2.4 2.4

4.3 4.3

6.2 6.2

8.1 8.1

10.0 10.0

Calificaciones

Calificaciones

MATEMÁTICA • UNIDAD SEIS

139

Porcentaje

3) 33.7% 33.7%

21.25% 21.25% 20% 20% 16.25% 16.25%

8.75% 8.75%

0 0

0.5 0.5

2.4 2.4

4.3 4.3

6.2 6.2

8.1 8.1

❚ Autoevaluación Nº 4

1) media: 39 2) 897,000

❚ Autoevaluación Nº 5

1) 74.6 cms 2) 106.47 libras 3) Peso medio: 5.8564 libras. Libras extra: 5,940.48

❚ Autoevaluación Nº 6

1) 126.44 centavos

140

MATEMÁTICA • PRIMERO DE BACHILLERATO

2) a) 4.32 b) 4.32 c) 4.32

10.0 10.0

Calificaciones Calificaciones