ESTADISTICA DESCRIPTIVA INDICE

TEMARIO Orígenes de la Estadística Psicología y Estadística Aspectos conceptuales de la Estadística Estadística descriptiva Ejercitación práctica 1 Niveles de medición Ejercitación práctica 2 Medidas de Posición Ejercitación práctica 3 Ejercitación práctica 4 Medidas de Dispersión Ejercitación práctica 5 Medidas de Distribución

PAG. 1 2 3 4 14 21 26 30 43 48 53 61 65

ORIGENES DE LA ESTADISTICA La Estadística parece derivar de una palabra latina “status”, que quiere decir estado político, y como tal se la empleó para exponer en forma sistemática y ordenada las características de un estado. Se recolectaban datos referentes a la población y posteriormente se los analizaba, llevando un registro de los resultados. Es decir, se la empleó para realizar los llamados censos. Se tienen noticias de éstos desde la época de Moisés, que hizo un censo de los israelitas, de que en China se realizaban estadísticas agrícolas y comerciales y en Roma, donde se hicieron famosos los censos romanos, por los que se tenía un registro muy estricto de los datos demográficos de la población. A pesar de que estos datos se perdieron, las repúblicas itálicas siguieron con la costumbre y la Iglesia, a través del Concilio de Trento, estableció como obligatorio la anotación de los matrimonios, nacimientos y defunciones. Esto fue a fines del siglo XIII. En el siglo XVI puede considerarse el inicio de la Estadística descriptiva, ya que se la empezó a aplicar a cuestiones que iban más allá de las meramente políticas y demográficas o de importancia para el estado, se la utilizó para destacar temas notables o significativos. Achenwald utilizó por primera vez el término estadística para estas cuestiones. Paralelamente en Inglaterra y Francia, con Pascal y Fermat, empezaron a desarrollarse teorías sobre el azar, pero quien aplicó estas teorías a lo social fue Bernoulli, introduciendo los términos de certeza y probabilidad y posteriormente Laplace, que sentó las bases para la ley de los errores. Karl Gauss, un físico alemán, estudió la teoría de los errores, y demostró que la distribución de los errores cometidos en las pruebas científicas era una forma típica, característica de todos los fenómenos y campanular, que desde entonces es conocida como curva Normal o curva de Gauss. Es así que la Estadística, que originariamente comenzó cono una técnica de descripción de datos masivos, con la complementación de las teorías de la probabilidad pasó a ser una forma adecuada de inferir, a partir de pocos datos, lo que sucedería en la población.

1

PSICOLOGIA Y ESTADISTICA

A partir de la segunda mitad del siglo XIX, se fueron desarrollando nuevos campos en Psicología, como el estudio de las diferencias individuales, el interés clínico por distinguir los distintos grados de debilidad mental y la Psicología fisiológica y experimental. Para llevar a cabo estas investigaciones fue necesario construir instrumentos de medición de las capacidades de los individuos y desarrollar técnicas y procedimientos estadísticos para la elaboración y análisis de los datos recogidos. Francis Galton, estimulado por su primo Charles Darwin, fue el que inició la utilización de las técnicas estadísticas en Psicología, fundando la Psicometría, la rama que investiga la conducta mediante instrumentos de medición conocidos como “test”. Galton introdujo las escalas de percentiles, el método de correlación y el concepto de regresión, a los que posteriormente Karl Pearson proporcionó su fundamento matemático. A principios del siglo XX, Charles Spearman, para investigar la “inteligencia general”, creó el Análisis Factorial, el cual se convirtió posteriormente en una teoría estadística general de gran aplicación en psicología, economía, sociología, medicina, meteorología y geología. Con el auge de la confección de test, se necesitó crear nuevas teorías estadísticas como son la Teoría clásica de Test y la Teoría de respuesta al Item. A mediados del siglo XX, Stanley Smith Stevens desarrolló la Teoría de las Escalas de medición, lo cual motivó en las décadas siguientes, la construcción de los fundamentos matemáticos de la teoría. Por lo tanto, la Psicología fue y es fuente de construcción de teorías estadísticas, las que necesita para poder modelizar los instrumentos de medición que utiliza. Esto muestra la estrecha vinculación desde hace más de cien años, de la Psicología y la Estadística.

2

ASPECTOS CONCEPTUALES DE LA ESTADISTICA La Estadística es un conjunto de técnicas que permiten manipular (recolectar, organizar, resumir, presentar y analizar) la información numérica masiva, es decir, la información referente a un conjunto de observaciones. Por lo tanto, solo es aplicable en aquellos casos en que el número de observaciones es numeroso. El método estadístico tiene la característica de ser un procedimiento que describe al grupo en función de las características del grupo y no en función de las cualidades individuales de cada unidad observada. Esto permite tener un conocimiento de qué conjunto de unidades dentro del grupo poseen tal característica, en qué proporción, permite caracterizar al grupo en función de ciertas medidas que la resumen, extrapolar las conclusiones obtenidas en un grupo menor a un grupo mayor, etc. En su aspecto metodológico, es una técnica adecuada para estudiar cuantitativamente los fenómenos colectivos, entendiendo por tales aquellos cuya medición implica una serie de observaciones de otros fenómenos individuales. La Estadística se divide en dos ramas:  Estadística Descriptiva: Es la Estadística que describe al grupo en función de sus características, con el objeto de estudiarlo y analizarlo sin hacer ningún tipo de inferencia respecto de un grupo mayor.  Estadística Inferencial: Es la Estadística que, a partir de los resultados obtenidos en una parte representativa (muestra) de un grupo mayor (población) permite sacar conclusiones sobre dicha población de la cual ha sido extraída la muestra. Trata de las condiciones bajo las cuales se realizan inferencias a partir de la muestra y que puedan generalizarse a la población. Como dichas inferencias nunca son exactas ni ciertas, se utiliza el cálculo de las probabilidades para sacar las conclusiones. La Estadística Descriptiva puede aplicarse para caracterizar las unidades de una población como las de una muestra. Población: Es la totalidad de los elementos (personas, objetos, etc) que reciben el nombre de unidades estadísticas poblacionales y a las que se refieren las observaciones numéricas masivas. Se la denomina como N. Muestra: Parte representativa de la población. Se la denomina como n. Esto significa que los elementos que conforman una muestra o una población pueden ser descriptos a partir de los métodos de la Estadística Descriptiva. En cambio, la Estadística Inferencial sólo tiene sentido cuando se ha extraído una muestra de una población, y la intención es extrapolar los resultados obtenidos en la muestra a la población. Como dicha inferencia no es exacta, se utiliza el Cálculo de probabilidades.

3

ESTADISTICA DESCRIPTIVA Puede definirse a la Estadística Descriptiva como aquella parte de la Estadística que solamente estudia, analiza y saca conclusiones respecto de una característica de un grupo u observaciones, sin hacer ningún tipo de inferencia respecto de un grupo mayor. Debido a ello, la descripción de dicha característica puede realizarse tanto si el grupo es definido como una población o como una muestra, sus unidades (sean poblacionales o muestrales) pueden ser estudiadas estadísticamente en base a sus características. En otras palabras, la Estadística descriptiva puede aplicarse para describir las características tanto de las unidades de la población como de las unidades de la muestra. Esa característica o propiedad puede ser: -

Atributo : Característica que no puede ser mensurada cuantitativamente. También se la conoce como variable cualitativa. Puede ser. -

Nominal – Clasifica a las unidades estadísticas (Por ejemplo: Sexo, nacionalidad, lugar de residencia, etc)

-

Ordinal – Ordena a las unidades estadísticas. (Por ejemplo: Niveles educacionales, niveles laborales, grados de acuerdo o satisfacción, etc)

Las diferentes clasificaciones que puede asumir una variable cualitativa reciben el nombre de dimensión. (Por ejemplo: Hombre / Mujer en el atributo Sexo; Primario Secundario, Terciario, Universitario en la variable Nivel educacional.) -

Variable: Característica o propiedad a estudiar en cada una de las unidades estadísticas de la población o muestra y suceptible de asumir diferentes valores cuantitativos. Puede ser. -

Discreta: Cuando los valores que asume son enteros. (Por ejemplo: Número de hijos, cantidad de materias aprobadas)

-

Continua: Cuando puede asumir cualquier valor dentro de su campo de variabilidad. (Por ejemplo: Altura, ingresos, edad, etc)

Los diferentes valores que asume una variable cuantitativa reciben el nombre de categorías. Por ejemplo: Un hijo, dos hijos, tres hijos en la variable número de hijos; $1000, $1005, $1080, $1100, ..........$1500, en la variable ingresos, etc. Cuando se decide hacer una investigación, el primer paso es definir qué se quiere investigar, es definir el objetivo de la investigación. Esta es la variable, la pregunta que se le hará a cada una de las unidades estadísticas. Paralelamente, se definirá la población objeto de estudio, a quién se va a investigar. El segundo paso es recopilar la información, es decir, hacer la pregunta a cada una de las unidades estadísticas y clasificarlas de acuerdo a las respuestas que han dado, de manera de poder

4

presentar los datos obtenidos en algún tipo de cuadro que resuma esa información y la haga comprensible. Supongamos que se quiere estudiar la edad en un grupo de 100 personas (N = 100). Al preguntarle a cada una de ellas cuántos años tiene, se obtendrá un listado de 100 edades; esto constituye una Serie simple, una sucesión ininterrumpida de 100 datos sin ningún tipo de orden. Por lo general esta serie es de muy difícil interpretación, no da una visión de conjunto de la caracterización de la población respecto de la edad. Resultará conveniente sistematizar la información agrupando a los individuos en grupos de similar característica, es decir, en función de sus dimensiones o de sus categorías. Esas dimensiones o categorías deberán cumplir con dos condiciones: -

Exhaustivas – Cada uno y todos los individuos de la muestra o población deberán tener una categoría o dimensión en dónde ubicarse. Excluyentes – Un individuo sólo podrá pertenecer a una sola categoría.

Este agrupamiento de las unidades estadísticas en dimensiones o categorías da lugar a las llamadas Distribuciones de frecuencias o Series de frecuencias. Se la puede definir como una tabla en la que se detallan las diferentes dimensiones del atributo o categorías de la variable que se está estudiando y en la que se indica la cantidad de unidades estadísticas que pertenecen a esa categoría o dimensión. Esta cantidad recibe el nombre de Frecuencia absoluta, de tal manera que la suma de todas las frecuencias absolutas correspondientes a todas las categorías o dimensiones debe ser igual a la población. f=N El cociente entre las frecuencias absolutas y la extensión de la población da lugar a las Frecuencias relativas r. =

f N

Las Frecuencias relativas deberán cumplir con la condición: r=1 Si se las multiplica por 100, dará el porcentaje de unidades estadísticas que pertenecen a una determinada dimensión o categoría. p. = f N

. 100

De tal manera que  p = 100 En las variables cuantitativas, sean discretas o continuas, es posible calcular las Frecuencias acumuladas absolutas, las Frecuencias acumuladas relativas y los porcentajes acumulados, es decir, la cantidad de observaciones que se acumulan hasta un determinado valor de variable. La Frecuencia acumulada correspondiente a la última categoría será igual a la población.

5

La diferencia entre el mayor valor de variable y el menor valor, recibe el nombre de campo de variabilidad de la variable. En el caso de una variable cuantitativa continua, como la variable puede asumir infinitos valores entre su menor valor y su mayor valor, cada categoría de variable está definida como un intervalo que recibe el nombre de intervalo de clase. El mismo tendrá un límite superior y un límite inferior, de tal manera que la diferencia entre ambos es la amplitud del intervalo. c. = Ls - Li Para calcular la cantidad de intervalos de clase, se considera el valor menor y el valor mayor correspondientes al campo de variabilidad de la variable y se intentará que los intervalos sean de una amplitud similar y que no queden intervalos con frecuencia 0. La cantidad óptima de intervalos dependerá de los objetivos de la investigación. Sin embargo, para determinar esta cantidad, puede aplicarse la Fórmula de Sturges: n. = 1 + 3.33 log. N En la que: n.: cantidad de intervalos de clase N: extensión de la población Es de destacar que por lo general el número de intervalos obtenido con esta fórmula se ajustará a la conveniencia práctica de la investigación. Es así que en una Distribución de frecuencias o Serie de frecuencias se tendrá : x.= denominación genérica de la variable objeto de estudio f. = frecuencia absoluta F = frecuencia absoluta acumulada r. = frecuencia relativa R = frecuencia relativa acumulada p. = porcentaje P = Porcentaje acumulado N = Población  = Sumatoria

6

Ejemplos de Distribuciones de frecuencias  Variable cualitativa nominal – Atributo nominal = Enfermedades psíquicas

x. = Enfermedades Histeria Neurosis obsesiva Fobias Psicosis

f 8 15 27 20  f = N = 70

r 0.11 0.21 0.39 0.29 r=1

p 11 21 39 29  p = 100

 Variable cualitativa ordinal – Atributo ordinal = Nivel educacional

x. = Actitud Primario Secundario Universitario Posgrado

f 16 26 28 10  f = N =80

r 0.20 0.32 0.35 0.13 r=1

p 20 32 35 13  p = 100

 Variable cuantitativa discreta – Cantidad de arrestos de los delincuentes

x. =Arrestos 1 2 3 4 5 6 7

f. 8 15 25 30 22 16 10  f = N = 126

F 8 23 48 78 100 116 126

r. 0.0635 0.1190 0.1984 0.2381 0.1746 0.1270 0.0794 r=1

7

R 0.0635 0.1895 0.3809 0.6190 0.7936 0.9206 1

p. 6.35 11.90 19.84 23.81 17.46 12.70 7.94  p = 100

P 6.35 18.95 38.09 23.81 79.36 92.06 100

 Variable cuantitativa continua – Tiempo en minutos que se tarda en resolver un test

x. = tiempo 0-2 2-4 4-6 6-8 8 - 10 10 - 12 12 - 14

f 18 20 25 22 17 14 12  f = N = 128

F 18 38 63 85 102 116 128

r 0.1406 0.1563 0.1953 0.1719 0.1328 0.1094 0.0938 r=1

R 0.1406 0.2969 0.4922 0.6641 0.7969 0.9063 1

p 14.06 15.63 19.53 17.19 13.28 10.94 9.38  p = 100

P 14.06 29.69 49.22 66.41 79.69 90.63 100

GRAFICOS

Todas las Distribuciones o Series de frecuencias pueden graficarse. El objetivo de los gráficos es poder visualizar cómo se distribuyen las frecuencias en una población / muestra determinada. Los tipos de Gráficos dependerán del tipo de variable en cuestión. 

Variables cualitativas

Para las frecuencias absolutas o relativas o para los porcentajes Gráficos de Barras separadas / bastones

8

NIVEL EDUCACIONAL

NIVELES

Posgrado

Universitario

Secundario

Prim ario

0

5

10

15

20

25

30

CANTIDAD / FRECUENCIA



Variables cuantitativas discretas

Para las frecuencias absolutas o relativas o porcentajes

Gráfico de barras / bastones separados

ARRESTOS 30

PORCENTAJES

25 20 15 10 5 0 Uno

Dos

Tres

Cuatro

Cinco

CANTIDAD DE ARRESTOS

9

Seis

Siete

Polígono de frecuencia

ARRESTOS

CANTIDAD / FRECUENCIAS

35 30 25 20 15 10 5 0 1

2

3

4

5

6

7

CANTIDAD DE ARRESTOS

Para las frecuencias acumuladas

Gráfico de escalones

FRECUENCIAS ACUMULADAS

ARRESTOS 140 120 100 80 60 40 20 0 1

2

3

4

5

CANTIDAD DE ARRESTOS

10

6

7



Variables cuantitativas continuas

Para las frecuencias absolutas o relativas o porcentajes

Histograma

TIEMPO DE TARDANZA EN LA RESOLUCIÓN DE UN TEST

CANTIDADES / FRECUENCIAS

30 25 20 15 10 5 0 0-2

2a4

4a6

6a8

8 a 10

MINUTOS

Para las frecuencias acumuladas

Ojiva

11

10 a 12

12 a 14

TIEMPO DE TARDANZA EN LA RESOLUCION DE UN TEST

FRECUENCIAS ACUMULADAS

140 120 100 80 60 40 20 0 0a2

2a4

4a6

6a8

8 a 10

10 a 12 12 a 14

MINUTOS

El Gráfico de torta se puede usar para las frecuencias absolutas, relativas o porcentajes de las variables cualitativas como así tambien de las variables cuantitativas, aunque por lo general se grafican los porcentuales. Para su graficación, es necesario asimilar la superficie del círculo al total de la población / muestra que se quiere graficar. Por ejemplo:

x. = Enfermedades

p

Histeria

11

11 . 360 / 100 = 39.60 grados

Neurosis obsesiva

21

21 . 360 / 100 = 75.60 grados

Fobias

39

39 . 360 / 100 = 140.40 grados

Psicosis

29

29 . 360 / 100 = 104.40 grados 360 grados

P = 100

12

ENFERMEDADES

Histeria 11%

Psicosis 29%

Neurosis obsesiva 21%

Fobias 39%

Otro ejemplo

TIEMPO DE TARDANZA EN LA RESOLUCION DE UN TEST EN MINUTOS

12 a 14 9% 10 a 12 11%

0a2 14%

2a4 16%

8 a 10 13%

4a6 20%

6a8 17%

13

EJERCITACION PRACTICA 1

Definir en cada caso, el tipo de variable, ejemplificar sus categorías o dimensiones según corresponda. A- Edad de una muestra de alumnos del Jardín de Infantes. B- Peso de los recién nacidos durante el período 1998/1999 en la ciudad de Resistencia. C- Sexo de los recién nacidos en el mismo período. D-Nacionalidad de los habitantes de un barrio de la Colonia 3 en 1948. E- Número de respuestas correctas en un test F- Cantidad de años de educación cursados. G- Tiempo de reacción medido en segundos ante un estímulo sensorial visual. H- Satisfacción de los empleados en un organismo de trabajo estatal. I- Clases sociales de los residentes en una Colonia de ancianos. J- Ingresos en una empresa. K- Nivel de ingresos en una empresa.

1. Con el objeto de estudiar la capacidad de atención de un grupo de alumnos, se seleccionaron 80 alumnos con problemas afectivo-emocionales. Entre los test que se les suministraron figuró el referido al tiempo, medido en segundos, que tardaron en leer un determinado texto. Los resultados figuran en el siguiente cuadro de frecuencia: x. 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

A- Definir la población y sus unidades estadísticas B- Definir la variable en estudio y el tipo de variable.

14

2. Para un análisis de perfiles de familias, se realizó una prueba piloto con las familias del Barrio de las Lomas, 45 en total. Entre otros datos, se estudió la cantidad de hijos esas familias y se obtuvieron los siguientes resultados: Familia 1Familia 2Familia 3Familia 4Familia 5Familia 6Familia 7Familia 8Familia 9– Familia 10Familia 11Familia 12Familia 13 – Familia 14Familia 15Familia 16 – Familia 17Familia 18Familia 19 Familia 20Familia 21Familia 22Familia 23Familia 24Familia 25-

3 hijos 0 4 6 1 5 2 3 4 0 4 1 5 4 3 2 1 3 4 2 3 0 3 2 1

Familia 26 – Familia 27 – Familia 28 – Familia 29 – Familia 30 Familia 31Familia 32 – Familia 33 Familia 34 – Familia 35 Familia 36 – Familia 37 Familia 38 – Familia 39 – Familia 40 Familia 41 – Familia 42 Familia 43 – Familia 44 – Familia 45 –

A-Definir la población y sus unidades estadísticas B- Definir la variable en estudio y el tipo de variable. C- Construir la distribución de frecuencias absolutas

15

3 hijos 1 4 2 6 5 3 7 0 7 2 5 1 4 6 3 5 2 4 3

3. En la investigación sobre consumo de drogas realizado en una villa del conurbano, se relevaron los tipos de bebidas alcohólicas que se consumían. Se encuestaron 28 personas y se obtuvieron los siguientes resultados: Habitante 1 - cerveza Habitante 2 - vino Habitante 3 – bebidas blancas Habitante 4- cerveza Habitante 5 - cerveza Habitante 6 - vino Habitante 7 -vino Habitante 8 -vino Habitante 9 -vino Habitante 10 -cerveza Habitante 11 -cerveza Habitante 12 – bebidas blancas Habitante 13 - cerveza Habitante 14 - vino Habitante 15 – bebidas blancas Habitante 16 - otros Habitante 17 - otros Habitante 18 – bebidas blancas Habitante 19 - cerveza Habitante 20 -vino Habitante 21 –bebidas blancas Habitante 22 - cerveza Habitante 23 - cerveza Habitante 24 - vino Habitante 25 - otros Habitante 26 - vino Habitante 27 - vino Habitante 28 – bebidas blancas A- Definir la población y sus unidades estadísticas B- Definir la variable en estudio y el tipo de variable. C- Construir la distribución de frecuencias absolutas

16

4. Se quiso determinar el coeficiente intelectual de los niños del ciclo EGB del colegio XX que propone la integración de niños con habilidades diferentes a los grupos de alumnos regulares. Para ello se les administró un test a sus 120 alumnos del mencionado ciclo el cual arrojó los siguientes resultados medidos en puntajes:

Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

A – Definir la población y sus unidades estadísticas B – Definir la variable de estudio y tipo de variable

17

EJERCITACION PRACTICA 1

Definir en cada caso, el tipo de variable, ejemplificar sus categorías o dimensiones según corresponda. A- Edad de una muestra de alumnos del Jardín de Infantes. Cuantitativa continua B- Peso de los recién nacidos durante el período 1998/1999 en la ciudad de Resistencia. Cuantitativa continua C- Sexo de los recién nacidos en el mismo período. Cualitativa nominal D-Nacionalidad de los habitantes de un barrio de la Colonia 3 en 1948. Cualitativa Nominal E- Número de respuestas correctas en un test de 10 preguntas (0.25 puntos por pregunta) Cuantitativa discreta F- Cantidad de años de educación cursados. Cuantitativa discreta G- Tiempo de reacción ante un estímulo sensorial visual. Cuantitativa continua H- Satisfacción de los empleados en un organismo de trabajo estatal. Cualtitativa ordinal I- Clases sociales de los residentes en una Colonia de ancianos. Cualitativa ordinal J- Ingresos en una empresa. Cuantitativa continua K- Nivel de ingresos en una empresa. Cualitativa ordinal 1. Con el objeto de estudiar la capacidad de atención de un grupo de alumnos, se seleccionaron 80 alumnos con problemas afectivo-emocionales. Entre los test que se les suministraron figuró el referido al tiempo, medido en segundos, que tardaron en leer un determinado texto. Los resultados figuran en el siguiente cuadro de frecuencia:

x. 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

18

A - Definir la población y sus unidades estadísticas Población - 80 alumnos Unidades estadísticas –Cada uno de los 80 alumnos B - Definir la variable en estudio y el tipo de variable. Variable - Tiempo (medido en segundos) que tardaron en leer el texto Tipo de variable – Cuantitativa continua. 2. Para un análisis de perfiles previo al lanzamiento publicitario de un producto para niños, se realizó una prueba piloto con las familias del Barrio de las Lomas, 45 en total. Entre otros datos, se estudió la cantidad de hijos esas familias y se obtuvieron los siguientes resultados:

Cantidad de hijos 0 1 2 3 4 5 6 7

f. 4 6 7 10 8 5 3 2 45

A-Definir la población y sus unidades estadísticas Población – 45 familias del barrio de las Lomas Unidad estadística – Cada una de las familias B- Definir la variable en estudio y el tipo de variable. Variable - Número de hijos de las familias Tipo de variable – Cuantitativa discreta

3. En la investigación sobre consumo de drogas realizado en una villa del conurbano, se relevaron los tipos de bebidas alcohólicas que se consumían. Se encuestaron 28 personas mayores de 16 años y se obtuvieron los siguientes resultados:

A- Definir la población y sus unidades estadísticas Población - Habitante mayores de 16 años de la villa del conurbano Unidad estadística - Cada uno de los habitantes B- Definir la variable en estudio y el tipo de variable. Variable - Tipo de bebida alcohólica Tipo de variable – Cualitativa nominal

19

C- Construir la distribución de frecuencias

Tipo de bebida alcohólica

f.

Cerveza Vino Bebidas blancas otros

9 10 6 3 28

4. Se quiso determinar el coeficiente intelectual de los niños del ciclo EGB del colegio XX que propone la integración de niños con habilidades diferentes a los grupos de alumnos regulares. Para ello se les administró un test a sus 120 alumnos del mencionado ciclo el cual arrojó los siguientes resultados medidos en puntajes:

Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

A – Definir la población y sus unidades estadísticas Población – 120 niños del ciclo EGB del colegio XX Unidades estadísticas – Cada uno de los niños B – Definir la variable de estudio y tipo de variable Variable – Coeficiente intelectual Tipo de variable – Cuantitativa continua

20

NIVELES DE MEDICION Cuando se hace una investigación, lo que se obtiene son datos referentes a la variable o característica en estudio con el objeto de dar respuestas a los problemas que se plantean. Para poder llegar a conclusiones válidas sobre esos datos es que se aplican diferentes tipos de análisis matemáticos cuyo objetivo es poder diferenciar dichos datos. Se entra en el campo de la medición. La medición es un instrumento esencial de la investigación científica, ya que por ella se pueden verificar las diferencias existentes entre los individuos o las unidades estadísticas objeto de análisis. Es la asignación de números a las propiedades o características de las unidades de análisis de acuerdo a ciertas reglas. Por ejemplo, una persona no es medible en sí misma, son medibles sus características, peso, estatura, edad, nivel de opinión respecto a infinidad de temas, nacionalidad, sexo, profesión, nivel de estudios, coeficiente intelelectual, memoria, capacidad de adaptación, etc. Por la medición se establece una relación de formas o isomorfismo, entre la estructura lógica del sistema numérico y la estructura de la naturaleza de la característica a medir.. Esa lógica matemática proporciona modelos que pueden ser utilizados para la descripción de la naturaleza en la medida que la estructura de esa naturaleza, el pensamiento del hombre o sus actitudes, sus actos, sus preferencias, poseen propiedades que desde el punto de vista lógico son suficientemente similares a la estructura de los sistemas matemáticos. Sirven de modelos de los objetos y sus relaciones , se sustituyen objetos y se describen relaciones. Por ejemplo, la correlación y regresión pone de manifiesto la relación existente entre dos variables (cumpliendo ciertas condiciones), la distribución normal de Gauss es aplicable a la forma en que se distribuyen la mayoría de los fenómenos o características humanos, la ordenación de los números es posible asimilarlo al grado de acuerdo o aceptación hacia una idea o concepto, etc. Si, como se dijo anteriormente, medir es asignar números a objetos o hechos de acuerdo a ciertas reglas, es necesario algún tipo de mecanismo por el que dichas mediciones puedan ser llevadas a cabo. Ese mecanismo son las escalas de medición. Toda escala de medida se basa en el principio de isomorfismo entre las relaciones existentes entre los hechos y las reglas matemáticas de cada escala. A medida que las reglas matemáticas sean más complejas, las características observadas en los sujetos sobre las cuales se aplicarán dichas reglas matemáticas deberán ser más complejas. Es importante destacar que las mediciones más complejas no son aplicables al campo de la Psicología ni al de las Ciencias de la conducta, es decir, no todas las operaciones matemáticas corresponden exactamente a operaciones empíricas que se pueden aplicar a los fenómenos de la conducta. Ello se debe a que la existencia de un cero absoluto y una unidad de medida constante no tiene su correlato en los fenómenos de la conducta.

21

Las escalas de medición suponen un escalamiento, una complejidad de menor a mayor, es por ello que se las puede clasificar en “Escalas débiles”, cuando suponen mediciones de tipo cualitativo y “Escalas fuertes”, cuando suponen mediciones de tipo cuantitativo. Cada una de ellas tiene determinadas características que las hace aplicables a cierto tipo de datos y no a otros. El ir de los menos complejo a lo más complejo significa que el rigor y precisión de cada una de las escalas supone una serie de restricciones a los fenómenos observados. A medida que las restricciones sean más rigurosas, aumenta el poder de medición y su capacidad para describir los fenómenos observados. Conocer dichas restricciones o reglas es importante para saber cuáles son los datos sobre los que se puede aplicar una determinada escala y no otra y además, saber qué tipo de operaciones matemáticas son permitidas realizar en esos datos. Consecuentemente, conocer las características de los datos observados (a qué tipo de variable pertenecen, si cualitativa o cuantitativa) lleva a saber qué tipo de escala es aplicable en los mismos y qué tipo de operaciones matemáticas es permitido realizar en ellos. De acuerdo con ello, los Niveles de medición pueden clasificarse en cuatro tipos: 1 - Nominal - Es el tipo de medición más simple, algunos autores no la consideran ni siquiera una medición. Implica solamente una clasificación, no habiendo ningún tipo de relación entre las categorías, ni siquiera de orden ni de espaciamiento. Las categorías de esta escala son mutuamente excluyentes y la forma de asignar los números a cada una de ellas es arbitrario, no implica ningún tipo de ordenamiento, es al solo efecto de identificar las diferentes categorías, es decir, los números asignados a las categorías pueden ser intercambiados entre sí y esto no afecta el análisis. Asimismo, estos números no permiten que se realicen operaciones matemáticas con ellos, pero sí se pueden realizar operaciones con las frecuencias o cantidad de casos observados en cada una de las categorías, calcular porcentajes, determinar el modo o frecuencia más alta / probable o hacer una tabulación cruzada entre dos variables de tipo nominal y medir el grado de asociación entre esas dos variables a través de la prueba de chi cuadrado. En Investigación de mercados se usan para codificar las respuestas de los cuestionarios, facilitando la carga y procesamiento. El isomorfismo está dado porque cada uno de los números son diferentes entre sí, de la misma manera que las dimensiones. La regla matemática que rige este tipo de escalas es la de “igual a” o “diferente a”, lo que permite incluir o no a un miembro en una determinada categoría. La utilización de los números es para identificar a cada una de las categorías y poder llegar a la conclusión de qué cantidad de individuos pertenecen o no a una determinada categoría. Este tipo de escalas se basan en variables o características o atributos nominales, tales como sexo, nacionalidad, zona de residencia, profesión, área laboral, tipos de enfermedades, tipos de medicamentos, marcas de productos, tipos de productos, nombre de empresas, atributos, etc. 2 - Ordinal - En este tipo de medición se tiene en cuenta la magnitud o volumen con que una propiedad es poseída por cada uno de los miembros pertenecientes a una determinada categoría.. A cada una de las categorías se le puede asignar cualquier ordenamiento de números: 1,2,3,4,5 – 10,20,30,40,50, - 2,5,10,80, etc, siempre y cuando en esa asignación se respete el ordenamiento de mayor a menor o viceversa, la asignación de números a cada categoría implica un orden, Como

22

cada una de estas ordenaciones pueden implicar distancias diferentes, no nos permite conocer la distancia que efectivamente existe en la realidad entre una categoría y otra, solamente podemos decir que es mayor, o que es menor. La regla matemática que rige a este tipo de escala es “mayor que” y un “menor que”, una comparación pero no un espaciamiento, interesa saber si un individuo ubicado en una categoría es superior a otro, si una categoría es superior a otra. El isomorfismo está dado porque el ordenamiento de los números se corresponde con un ordenamiento similar en las categorías a los que están asignados dichos números Como en la medición nominal, los números asignados no permiten que se realicen operaciones matemáticas con ellos pero sí se pueden calcular la mediana y los cuartiles, además de todas aquellas medidas que se pueden calcular con las escalas nominales (el modo, las frecuencias y los porcentajes). Asimismo, y según Boyd y Westfall, estas escalas sirven para clasificar por rangos a los entrevistados de acuerdo a alguna característica y la distancia entre las diferentes posiciones puede variar ampliamente. “Todo lo que dice la escala es que el individuo o particular tiene más, menos o la misma cantidad de la característica que se está midiendo que algún otro”. Estas escalas se basan en variables o atributos ordinales, tales como Nivel educacional (Primario, secundario, etc. ), Nivel ocupacional (Categorías sin personal a cargo, Categorías con personal a cargo, Niveles gerenciales, etc.) Niveles de inteligencia (Brillante, Normal superior, Normal medio, Normal inferior, etc), Clases sociales (Alta, Media, Baja). Aquí es necesario hacer una diferenciación entre variables ordinales y variables nominales tratadas a nivel ordinal. Las primeras son intrínsecamente ordinales, como por ejemplo el Nivel educacional y permite la aplicación de todas las medidas anteriormente mencionadas. Las segundas son variables nominales, como por ejemplo, marcas o atributos, y se le pide al encuestado que las ponga en orden; en ellas, la asignación de números reflejan el orden pedido. 3 - De Intervalo - Este tipo de medición da origen a las escalas de intervalo, que si bien cumplen con todas las características de las escalas ordinales (“mayor que” y “menor que”), permiten establecer que las distancias numéricamente iguales representan distancias iguales empíricas en la variable que miden. La regla matemática que las rige es “cuánto mas” o “cuánto menos” se posee esa característica en términos de distancia pero no en términos de volumen o magnitud por dos razones: 1) la asignación de números es arbitraria, a pesar de tener una unidad constante de medición, esa unidad es arbitraria y 2) No hay un cero significativo, real, el cero no significa ausencia de atributo. No se centra en la magnitud o volumen en que un individuo posee una determinada característica sino en el tamaño de la diferencia entre un individuo y otro. Indica el orden y distancia en unidades de intervalos iguales. El isomorfismo está dado porque los números asignados a cada categoría implican incrementos iguales en el atributo que se está midiendo, a pesar de que son arbitrarios y no tienen un punto cero significativo. No se mide el atributo de forma absoluta en cada individuo, lo que significa que las

23

relaciones entre las posiciones pueden ser establecidas en términos de distancia entre ellas pero no en término de razones. El ejemplo típico es la temperatura. Para Celsius, el punto de congelamiento del agua es 0 grado, y el punto de ebullición es 100 grados. Para Fahrenheit, los valores son 32 y 212 grados respectivamente. En ambos, la ubicación del 0 es arbitraria y no significa ausencia de temperatura. Es así que no se puede decir, en ninguno de los dos casos, que una temperatura de 40 es el doble que una de 20, no hay un 0 real al que hacer referencia. Otros ejemplos típicos son los puntajes en los test de inteligencia y los Indices de precios. Según Aaker, “Una pregunta que se repite en la mayor parte de las medidas de actitudes es si son escalas de intervalos. Por lo general, es dudoso que los intervalos entre categorías sean exactamente iguales pero puede ser que no sean tan diferentes como para impedir que se le trate como una escala de intervalos”. Es por ello que las Escalas de medición de Actitudes pueden ser consideradas como escalas de intervalos: Las distancias entre las categorías son semejantes, la asignación de números es arbitraria y no tienen un 0 real al que hacer referencia, de manera que una respuesta de Muy de acuerdo, representada por el Nro 5 no puede decirse que pone de manifiesto un acuerdo del doble de magnitud con respecto a Poco de acuerdo, representada por el Nro 2. MB B 5 4 2 1

R 3 0

M 2 -1

MM 1 -2

5 / 4 = 1.25 2/1=1

Como a cada categoría se le asigna un número, este tipo de escalas permite aplicar algunas medidas como la Media Aritmética y el Desvío Standard, además de las medidas que se pueden calcular en las escalas nominales y ordinales. 4 - De razón o proporción – Es el nivel más alto de medición ya que es posible determinar la magnitud absoluta de la característica poseída por un individuo, asignan valores absolutos más que relativos. Tiene un punto cero significativo, real (el 0 de la escala coincide con la “nada” en la variable a medir, es ausencia de atributo) y una unidad de medida constante.. Un resultado de 4 es dos veces mayor que un resultado de 2 . Todas las medidas aritméticas se pueden calcular en este tipo de escala. Se las utiliza en las “ciencias exactas”, y debido a sus características, las escalas de actitudes y los niveles de inteligencia no pueden ser consideradas como escalas de razón. Como ejemplo de variables o características medidas a nivel de razón, pueden mencionarse la edad, el peso, los ingresos, y cualquier otra variable que implique una cantidad.

24

EJEMPLOS 1 – Quisiera que me dijera si ir al cine es su actividad preferida del fin de semana. 1 – SI 2 - NO Es una pregunta medida a Nivel Nominal 2 – Quisiera que ordenara, de acuerdo a su preferencia, las siguientes actividades que puede realizar durante el fin de semana: 1- Ir al cine 4 - Realizar un deporte 2 - Salir a comer 3 - Ir al teatro Es una pregunta medida a Nivel Ordinal 3 – Podría decirme en qué medida está Ud de acuerdo con la siguiente afirmación? “Ir al cine es mi actividad preferida durante el fin de semana” 4 - MA -

3-A -

2 - PA - 1 - NA

Es una pregunta medida a Nivel Intervalar. 4 – Cuántas veces por mes va Ud al cine? Una vez Dos veces Tres veces Es una pregunta medida a Nivel de Razón

25

EJERCITACION PRACTICA 2 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, relativas y relativas acumuladas B – Interpretar los resultados (solo de las frecuencias absolutas y absolutas acumuladas) C – Representar gráficamente las frecuencias absolutas y absolutas acumuladas D – Determinar el nivel de medición. 2 – En el Ejercicio 2 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, porcentajes y porcentajes acumulados B – Interpretar los resultados (solo de los porcentajes absolutos y porcentajes acumulados) C – Representar gráficamente los porcentajes absolutos y porcentajes acumulados D – Determinar el nivel de medición. 3 – En el Ejercicio 3 de la Ejercitación Práctica 1: A – Calcular las frecuencias relativas y los porcentajes B – Se pueden calcular las frecuencias absolutas, relativas y porcentajes acumulados? Por qué? C – Representar gráficamente las frecuencias absolutas y los porcentajes. D – Interpretar los resultados de los porcentajes. E – Determinar el nivel de medición. 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, porcentajes y porcentajes acumulados. B – Interpretar los resultados (solo de los porcentajes absolutos y porcentajes acumulados) C – Representar gráficamente los porcentajes absolutos y porcentajes acumulados D – Determinar el nivel de medición.

26

EJERCITACION PRACTICA 2 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, relativas y relativas acumuladas.

x. 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

F 4 9 15 23 35 55 70 80

r. 0.05 0.0625 0.075 0.1 0.15 0.25 0.1875 0.125 1

R 0.05 0.1125 0.1875 0.2875 0.4375 0.6875 0.8750 1

B – Interpretar los resultados (solo de las frecuencias absolutas y absolutas acumuladas) La mayor parte de los alumnos tardó entre 60 y 70 segundos en leer el texto. Son más los alumnos que tardan más de 50 / 60 segundos en leer el texto que los que tardan menos. C – Representar gráficamente las frecuencias absolutas y absolutas acumuladas. Frecuencias absolutas – Histograma Frecuencias absolutas acumuladas – Ojiva D – Determinar el nivel de medición. De razón – Hay un 0 real, existe y además, los que tardaron 80 segundos en leer el texto tardaron el doble que los que tardaros 40 segundos. 2 – En el Ejercicio 2 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, porcentajes y porcentajes acumulados

27

Cantidad de hijos 0 1 2 3 4 5 6 7

f. 4 6 7 10 8 5 3 2 45

F 4 10 17 27 35 40 43 45

% 8.89 13.33 15.56 22.22 17.78 11.11 6.67 4.44 100

% acumulados 8.89 22.22 37.78 60.0 77.78 88.89 95.56 100

B – Interpretar los resultados (solo de los porcentajes absolutos y porcentajes acumulados) La mayor parte de las familias tienen 3 hijos El 60% de las familias tienen hasta 3 hijos C – Representar gráficamente los porcentajes absolutos y porcentajes acumulados Porcentajes absolutos – Gráfico de barras o bastones – Gráfico de torta Porcentajes acumulados – Gráfico de escalones D – Determinar el nivel de medición. De razón- Hay un 0 real, hay familias que no tienen ningún hijo. Además, las familas que tienen 6 hijos tienen el doble de hijos que las que tienen 3. 3 – En el Ejercicio 3 de la ejercitación Práctica 1: A – Calcular las frecuencias relativas y los porcentajes

Tipo de bebida alcohólica Cerveza Vino Bebidas blancas otros

f. 9 10 6 3 28

r. 0.3214 0.3571 0.2149 0.1071 1

% 32.14 35.71 21.49 10.71 100

B – Se pueden calcular las frecuencias absolutas, relativas y porcentajes acumulados? Por qué? No se puede calcular ningún tipo de frecuencias acumuladas porque se trata de una variable nominal, esto significa que el orden de las dimensiones puede intercambiarse sin alterar para nada el análisis.

28

C – Representar gráficamente las frecuencias absolutas y los porcentajes. Frecuencias absolutas – Gráfico de barras o de bastones Porcentajes – Idem – Gráfico de torta D – Interpretar los resultados de los porcentajes. La mayor parte de la población encuestada (casi un 36%), toma vino. E – Determinar el nivel de medición. Nominal – Se trata solamente de una clasificación de las bebidas 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: A – Calcular las frecuencias absolutas acumuladas, porcentajes y porcentajes acumulados.

Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

F 4 20 45 85 104 115 120

% 3.33 13.33 20.83 33.33 15.83 9.17 4.17

% acumulados 3.33 16.66 37.49 70.82 86.65 95.82 100

B – Interpretar los resultados (solo de los porcentajes absolutos y porcentajes acumulados) Más del 30% de los alumnos tienen un coeficiente intelectual entre 90 y 100 puntos. Casi la tres cuarta parte de los alumnos (71%) tiene un coeficiente intelectual que llega a 100 puntos. C – Representar gráficamente los porcentajes absolutos y porcentajes acumulados Porcentajes absolutos – Histograma – Gráfico de torta Porcentajes acumulados – Ojiva D – Determinar el nivel de medición. Intervalar – No hay un cero real, significativo, lo que significa que no se puede afirmar que el alumno con un coeficiente intelectual de 120, sea el doble de inteligente de aquel que tenga un puntaje de 60.

29

MEDIDAS DE POSICION Las Medidas de Posición resumen la información en un único punto. Pueden ser:  Medidas de Tendencia Central: Concentran los datos ponderados alrededor de las mismas, dan un valor central de la distribución. Son el Modo, la Mediana y la Media Aritmética.  Medidas No de Tendencia Central. Ponen de manifiesto otros aspectos de la distribución no necesariamente centrales. Son los Fractiles. Una sola medida no caracteriza suficientemente una distribución, por lo general es necesario utilizar más de una para tener una idea más concreta de la naturaleza de los datos analizados 

Modo – Esta medida de posición está definida como el valor de variable al que le corresponde la mayor frecuencia o mayor número de casos, por lo tanto puede aplicarse en distribuciones de variables cuantitativas como cualitativas. Es la medida más simple, sin embargo, es necesario ser cautos en su interpretación: tomar el Modo como un valor representativo de la población podría inducir a errores, ya que no da la tendencia de la distribución. Para considerarlo como una medida de Tendencia Central es necesario conocer de antemano la frecuencia de los valores de variable restantes.

El cálculo del Modo para variables discretas surge directamente de la lectura del cuadro de distribución de frecuencias. En el caso de que la variable sea continua, se hace necesario determinar el valor particular del Modo en el intervalo modal. En ese caso, será necesario aplicar la siguiente fórmula:

Mo = Li + c

d1 d.1 + d.2

En la que: Li : Límite inferior del intervalo modal c. : Amplitud del intervalo modal d.1 : Diferencia entre el valor de frecuencia del intervalo modal y el valor de frecuencia del intervalo anterior d.2 : Diferencia entre el valor de frecuencia del intervalo modal y el valor de frecuencia del intervalo posterior.  Mediana – Es el valor de variable que es superado por la mitad de las observaciones y supera a no más de la mitad de las observaciones. En otras palabras, divide a la población en dos partes, 50% de las observaciones a la izquierda y 50% de las observaciones a la derecha del valor mediana. Como medida de Tendencia Central es más representativa que el Modo y debido a que su cálculo se realiza en base a las frecuencias acumuladas y no teniendo en cuenta los valores de variable, está menos expuesta a los valores extremos.

30

De la misma manera que el Modo, en las variables discretas el valor Mediana surge de la lectura del cuadro: se calculan las frecuencias acumuladas y el Orden de Mediana (N / 2), de manera que el valor de variable al que le corresponde el Orden de mediana es la Mediana de la distribución. En el caso de las variables continuas, también se calculan las frecuencias acumuladas y el Orden de mediana, pero como éste caerá en un intervalo, se hace necesario determinar el valor de variable entre ambos límites que será el valor mediana. Para ello se aplica la siguiente fórmula:

Me = Li + c N / 2 - F f. En la que: Li : Límite inferior del intervalo que contiene el Orden de Mediana c. : Amplitud del intervalo que contiene el Orden de Mediana N / 2 : Orden de Mediana F : Frecuencia acumulada correspondiente al intervalo anterior f. : Frecuencia absoluta correspondiente al intervalo en el que está contenido el Orden de Mediana  Fractiles – Son valores de variable que dividen a la distribución en más de dos partes Los más usados son: -

Cuartiles – Es una medida muy semejante a la Mediana, divide a la distribución en 4 partes.

En las variables discretas el valor de los cuartiles surgen de la lectura del cuadro: se calculan las frecuencias acumuladas y el Orden de los cuartiles correspondientes. En el caso de las variables continuas, también se calculan las frecuencias acumuladas y el Orden de los cuartiles, pero como éstos caerán en un intervalo, se hace necesario determinar el valor de variable entre ambos límites que será el valor del cuartil correspondiente. Para ello se aplica la siguiente fórmula: Cuartil 1 – Es el valor de variable que supera al 25% de las observaciones y es superado por el 75% restante. C1 = Li + c N / 4 – F f. En la que: Li = Límite inferior del intervalo en el que cae el Orden del Cuartil 1 c. = amplitud del intervalo de clase N / 4 = Orden del Cuartil 1 F = Frecuencia acumulada del intervalo anterior al del Orden del Cuartil 1

31

f. = Frecuencia absoluta del intervalo al que corresponde el Orden del Cuartil 1 Cuartil 2 – Es el valor Mediana Cuartil 3 – Es el valor de variable que supera al 75% de las observaciones y es superado por el 25% restante. C3 = Li + c N.3 / 4 – F f. En la que: Li = Límite inferior del intervalo en el que cae el Orden del Cuartil 3 c. = amplitud del intervalo de clase N . 3/ 4 = Orden del Cuartil 3 F = Frecuencia acumulada del intervalo anterior al del Orden del Cuartil 3 f. = Frecuencia absoluta del intervalo al que corresponde el Orden del Cuartil 3

-

Deciles: Dividen a la población u observaciones en 10 partes. Su cálculo es similar al de la Mediana y Cuartiles de la misma manera que su interpretación.

Por ejemplo, el Decil 4 es el valor de variable que supera al 40% de las observaciones o casos y es superado por el 60% de las mismas. Si la variable es continua, se aplicará la siguiente fórmula: D4 = Li + c N . 4 / 10 - F f En la que: Li = Límite inferior del intervalo en el que cae el Orden del Decil 4 c. = amplitud del intervalo de clase N . 4 / 10 = Orden del Decil 4 F = Frecuencia acumulada del intervalo anterior al del orden del Decil 4 f. = Frecuencia absoluta del intervalo al que corresponde el Orden del Decil 4 -

Percentiles: Dividen a la población u observaciones en 100 partes. Su cálculo es similar al de la Mediana, Cuartiles y Deciles de la misma manera que su interpretación.

Por ejemplo, el Percentil 60 es el valor de variable que supera al 60% de las observaciones o casos y es superado por el 40% de las mismas. Si la variable es continua, se aplicará la siguiente fórmula:

32

P60 = Li + c N . 60 / 100 - F f En la que: Li = Límite inferior del intervalo en el que cae el Orden del Percentil 60 c. = amplitud del intervalo de clase N . 60 / 100 = Orden del Percentil 60 F = Frecuencia acumulada del intervalo anterior al del Orden del Percentil 60 f. = Frecuencia absoluta del intervalo al que corresponde el Orden del Percentil 60 De lo dicho precedentemente se deduce que: Mediana = Cuartil 2 = Decil 5 = Percentil 50 Cuartil 1 = Percentil 25 Cuartil 3 = Percentil 75  Media Aritmética – Dentro de las Medidas de Tendencia central es la más usada y la más conocida. Es el valor de variable promedio, el que equilibra a la distribución y la representa como un resumen. Estadísticamente está definida como la sumatoria del producto de los valores de variable por sus respectivas frecuencias y dividido por el total de la población. En las variables de tipo discreta, la fórmula a aplicar es: MA =  x.f... N En la que: x. : Valores de variable f. : Frecuencias absolutas correspondientes a cada valor de variable N : Total de observaciones o población En el caso de una variable continua, será necesario calcular el Punto Medio de cada uno de los intervalos como reemplazo de cada valor de variable: PM = Ls + Li... 2 De manera que la fórmula resultante será la siguiente: MA =  PM . f N

33

Es de destacar que presentar la información solamente en función de los promedios, puede llevar a conclusiones erróneas o engañosas, ya que una misma MA puede ser la expresión de diferentes distribuciones de frecuencias. Propiedades de la media aritmética 1 – Es un valor de variable contenido dentro del campo de variabilidad dela variable. Li  x  Ls 2

- La Media aritmética de una constante es igual a la constante. c. = c

3 – La Media aritmética de una constante más una variable es igual a la constante más la Media aritmética de la variable. c. + x = c + x 4 – La media artimética de una constante por una variable es igual a la constante por la Media artimética de la variable c. x = c . x 5 – La Media aritmética de una suma de variables correspondientes a diferentes poblaciones, es igual a la suma de las medias aritméticas ponderadas por sus respectivas poblaciones. x. + y + z

Nx

Ny

= x . Nx + y . Ny + z . Nz Nx + Ny + Nz Nz

6 – La sumatoria de los desvíos respecto de la Media aritmética es igual a 0

 (x – x) = 0 7 – El cuadrado de la sumatoria de los desvíos respecto de la Media aritmética es un mínimo  ( x – x) ² = mínimo

Conveniencia del uso de cada una de las medidas Uso de la Media Aritmética -

Cuando los valores de variable están distribuídos simétricamente, es decir, cuando la distribución no está muy sesgada.

34

-

Cuando haya que calcular con posterioridad otros estadísticos, tales como las Medidas de Dispersión o el Coeficiente de correlación, ya que su cálculo se basa en la MA. Solo se la puede calcular en variables cuantitativas discretas y continuas. No se la puede calcular si la variable cuantitativa continua presenta intervalos abiertos. No se la puede calcular en variables cualitativas. No es conveniente su aplicación cuando la distribución de frecuencias presenta valores extremos.

Uso de la Mediana -

Cuando se desee el punto medio exacto de la distribución, es decir, el 50%. Cuando la distribución presente puntajes extremos, lo que afecta el cálculo de la MA y su resultado no sería representativo de la misma. Cuando la distribución presenta intervalos abiertos. No permite el cálculo de demasiadas operaciones algebraicas. Se la puede calcular en variables cualitativas ordinales y cuantitativas discretas y continuas

Uso del Modo -

Cuando se quiere tener una interpretación rápida y fácil de lo que es una medida de Tendencia Central. Cuando se quiere conocer el valor típico, más usado o más corriente. Se la puede calcular en cualquier tipo de variable

Relación entre la Media Aritmética, Mediana y Modo Estas tres medidas mantienen una relación entre sí como la siguiente: 1. Modo < Mediana < Media Aritmética 2. Modo > Mediana > Media aritmética Teniendo en cuenta estas relaciones y conociendo el valor puntual de cada una de estas medidas, puede inferirse cómo es la distribución sin tener necesidad de conocer cómo se distribuyen las frecuencias en esa distribución, es decir, puede inferirse su asimetría. Es así que una distribución en la que se observe una relación del tipo 1, significa que la mayor parte de las observaciones tenderá a concentrarse en los valores extremos de la izquierda de la distribución. Inversamente, si en una distribución se observa una relación del tipo 2, significa que la mayor parte de las observaciones tenderá a concentrarse en los valores extremos de la derecha de la distribución. Obviamente, si las tres medidas coinciden, si tienen un mismo valor numérico, la distribución será simétrica.

35

EJEMPLOS DE CALCULO DE MEDIDAS DE POSICION  Variable cualitativa nominal – Atributo nominal = Enfermedades psíquicas

x. = Enfermedades Histeria Neurosis obsesiva Fobias Psicosis



f 8 15 27 20  f = N = 70

Modo = Fobias

Las fobias son las enfermedades psíquicas más comunes en esta población.  Variable cualitativa ordinal – Atributo ordinal = Nivel educacional

x. = N. educacional Primario Secundario Universitario Posgrado 

f 16 26 28 10  f = N =80

F 16 42 70 80

Modo = Universitario

La mayor cantidad de personas tienen nivel universitario. 

Mediana = Secundario

Orden de Mediana = 80 / 2 = 40

El 50% de las personas han alcanzado hasta un nivel secundario. 

Cuartil 1 = Secundario

Orden del Cuartil 1 = 80 / 4 = 20

El 25% de las personas han alcanzado hasta un nivel secundario. 

Cuartil 3 = Universitario

Orden del Cuartil 3 = 80 x 3 / 4 = 60

El 75% de las personas han alcanzado hasta un nivel universitario.

36

 Variable cuantitativa discreta – penitenciaria A

x. =Arrestos 1 2 3 4 5 6 7



Cantidad de arrestos de los delincuentes en la Unidad

f. 8 15 25 30 22 16 10  f = N = 126

F 8 23 48 78 100 116 126

x.f 8 30 75 120 110 96 70 509

Modo = 4 arrestos

Cuántas veces ha sido arrestado la mayoría de los delincuentes? La mayor parte / mayoría de los delincuentes han sido arrestados 4 veces. 

Mediana = 4 arrestos

Orden de Mediana 126 / 2 = 63

Hasta cuántos arrestos tuvo el 50% de los delincuentes que menos arrestos tuvo? El 50% de los delincuentes que menos arrestos tuvo, ha sido arrestado hasta 4 veces. El 50% restante, más de 4 veces. 

Cuartil 1 = 3 arrestos

Orden del Cuartil 1 = 126 / 4 = 31.5

Cuál es la cantidad máxima de arrestos que tuvo el 25% de los delincuentes con menos arrestos? (O cantidad mínima de arrestos del 75% de delincuentes con más arrestos) La cantidad máxima de arrestos que tuvo el 25% de los delincuentes con menos arrestos es de 3 arrestos. El 75% restante ha sido arrestado más de 3 veces. El 25% de los delincuentes ha sido arrestado hasta 3 veces. El 75% restante, más de 3 veces. 

Cuartil 3 = 5 arrestos

Orden del Cuartil 3 = 126 . 3 / 4 = 94.5

Cuál es la cantidad máxima de arrestos que tuvo el 75% de los delincuentes con menos arrestos? (O cantidad mínima de arrestos que tuvo el 25% de los delincuentes con más arrestos). La cantidad máxima de arrestos que tuvo el 75% de los delincuentes con menos arrestos es de 5 arrestos. El 25% restante ha sido arrestado más de 5 veces. El 75% de los delincuentes ha sido arrestado hasta 5 veces. El 25% restante, más de 5 veces.

37



Decil 8 = 6 arrestos

Orden del Decil 8 = 126 . 8 / 10 = 100.8

Cuál es la cantidad máxima de arrestos que tiene la 8 / 10 partes de los delincuentes con menos arrestos? (O cantidad mínima de la 2 / 10 parte de los delincuentes con más arrestos) La cantidad máxima de arrestos que tiene la 8 / 10 partes de los delincuentes con menos arrestos es de 6 arrestos. El 80% de los delincuentes ha sido arrestado hasta 6 veces. El 20% restante, más de 6 veces. 

Percentil 95 = 7 arrestos

Orden del Percentil 95=126 .95/100 = 119.7

Cuál es la cantidad máxima de arrestos que tiene el 95% de los delincuentes con menos arrestos? (O cantidad mínima de arrestos que tiene el 5% de los delincuentes con más arrestos) La cantidad máxima de arrestos que tiene el 95% de los delincuentes con menos arrestos es de 7 arrestos. El 95% de los delincuentes ha sido arrestado hasta 7 veces. 

Media aritmética =  x.f = 509 = 4.04 arrestos N 126

En promedio, los delincuentes han sido arrestados 4 veces. (El promedio de arrestos de esta población ha sido de 4). Propiedades: -

Si al cabo de un año, todos los delincuentes tuvieron 3 arrestos más, cuál es el nuevo promedio de arrestos?

Propiedad 3 = c. + x = c + x = 3 + 4.04 = 7.04 arrestos El nuevo promedio de arrestos es de 7.04 arrestos

-

Si al cabo de un año, cada uno de los delincuentes fue arrestado un 20% más, cuál es el nuevo promedio de arrestos?

Propiedad 4 = c. . x = c . x = 1.2 . 4.04 = 4.85 El nuevo promedio de arrestos es de 4.85 arrestos

-

Si en la Unidad penitenciaria B, que cuenta con 80 detenidos, el promedio de arrestos es de 5 (designado como variable y), cuál es el promedio de arrestos de los delincuentes de ambas unidades?

38

Propiedad 5 = x. + y = x . NA + y . NB NA + NB

= 4.04 . 126 + 5 . 80 126 + 80

= 509.04 + 400 = 909.04 = 4.41 206 206

El promedio de arrestos de ambas unidades es de 4.41 arrestos



Variable cuantitativa continua – Tiempo en minutos que los alumnos de un gabinete psicopedagógico tarda en resolver un test de aptitud psicomotriz.

x. = Tiempo 0–2 2-4 4-6 6–8 8 – 10 10 – 12 12 - 14



Modo = Li + c .

f 18 20 25 22 17 14 12  f = N = 128

F 18 38 63 85 102 116 128

PM 1 3 5 7 9 11 13

PM . f 18 60 125 154 153 154 156 820

d1 d.1 + d2

Intervalo modal = 4 - 6

Límite inferior del intervalo modal Li = 4

Amplitud del intervalo modal c = 2

Mo = 4 + 2

5 3+5

= 4 + 2 . 0.63 = 4 + 1.26 = 5.26 minutos

Cuánto tarda la mayoría / mayor parte de los alumnos en resolver el test? La mayor parte de los alumnos tardan 5.26 minutos en resolver el test. 

Mediana = Li + c . N / 2 – Fa f.

Intervalo de la Mediana = 6 - 8

Orden de mediana = N / 2 = 128 / 2 = 64

Amplitud del intervalo c = 2

Límite inferior del intervalo mediana = 6

39

Me = 6 + 2

64 – 63 = 4 + 2 22

1 22

= 6 + 2 . 0.045 = 6 + 0.09 = 6. 09 minutos

Cuál es el tiempo mínimo que tarda el 50% de los alumnos más lentos en resolver el test? (O tiempo máximo que tarda el 50% de los alumnos más rápidos) El tiempo mínimo que tarda el 50% de los alumnos más lentos en resolver el test es de 6.09 minutos. El 50% de los alumnos tarda hasta 6.09 minutos en resolver el test, el 50% restante, más de 6.09 minutos. 

Cuartil 3

Orden del Cuartil 3 = N . 3 / 4 = 128 . 3 / 4 = 96

C3 = Li + c N 3 / 4 – F f Intervalo del Cuartil 3 = 8 – 10

Amplitud del intervalo c = 2

Límite inferior del intervalo del Cuartil 3 = 8

C3 = 8 + 2

96 – 85 17

= 8 + 2 . 0.647 = 8 + 1.294 = 9.3 minutos

Cuál es el tiempo máximo que tarda el 75% de los alumnos más rápidos en resolver el test? (O tiempo mínimo que tarda el 25% de los alumnos más lentos) El tiempo máximo que tarda el 75% de los alumnos más rápidos en resolver el test es de 9.3 minutos. El 75% de los alunnos tarda hasta 9.3 minutos en resolver el test; el 25% restante tarda más de 9.3 minutos. 

Cuartil 1

Orden del Cuartil 1 = N . 1 / 4 = 128 / 4 = 32

C1 = Li + c N . 1 / 4 - F f. Intervalo del Cuartil 1 = 2 – 4

Amplitud del intervalo c = 2

Límite inferior del intervalo del Cuartil 1 = 2 C1 = 2 + 2 32 – 18 = 2 + 2 . 0.7 = 2 + 1.4 = 3.4 minutos 20 Cuál es el tiempo mínimo que tarda el 75% de los alumnos más lentos en resolver el test? (O tiempo máximo que tarda el 25% de los alumnos más rápidos) El tiempo mínimo que tarda el 75% de los alumnos más lentos en resolver el test es de 3.4 minutos

40

El 25% de los alumnos tarda hasta 3.4 minutos en resolver el test; el 75% restante, tarda más. 

Decil 7

D7=

Li + c N . 7 / 10 – F f

Orden del D 7= 128 . 7 / 10 = 89.6

Intervalo del Decil 7 = 8 – 10

Amplitud del intervalo = 2

Límite inferior del intervalo = 8 D7 = 8 + 2 89.6 – 85 = 8 + 2 . 0.27 = 8 + 0.54 = 8.54 minutos 17 Cuál es el tiempo mínimo que tarda la 3 / 10 parte de los alumnos más lentos en resolver el test? (O tiempo máximo que tarda la 7 / 10 parte de los alumnos más rápidos) El tiempo mínimo que tarda la 3 / 10 parte de los alumnos más lentos en resolver el test es de 8.54 minutos. La 7 / 10 parte de los alumnos tarda hasta 8.54 minutos en resolver el test, la 3/10 parte restante tarda más de 8.54 minutos. 

Percentil 35

P 35 = Li + c N . 35 / 100 – F f

Orden del P 35= 128 . 35 / 100 = 44.8

Intervalo del Percentil 35 = 4 - 6

Amplitud del intervalo = 2

Límite inferior del intervalo = 4 P 35 = 4 + 2 44.8 – 38 = 4 + 2 . 0.272 = 4 + 0.544 = 4.544 minutos 25 Cuál es el tiempo máximo que tarda el 35% de los alumnos más rápidos en resolver el test? (O tiempo mínimo que tarda el 65% de los alumnos más lentos) El tiempo máximo que tarda el 35% de los alumnos más rápidos en resolver el test es de 4.544 minutos. El 35% de los alumnos tarda hasta 4.5 minutos en resolver el test. El 65% restante, tarda más. 

Media aritmética MA =  PM . f N

= 820 = 6.4 minutos 128

41

El tiempo promedio que tardan los alumnos en resolver el test, es de 6.4 minutos. Los alumnos tardan 6.4 minutos en promedio en resolver el test. Propiedades: -

Cuál es el nuevo promedio de resolución del test si todos los alumnos tardaron 3 minutos más en resolverlo?

Propiedad 3 = c. + x = 6.4 + 3 = 9.3 minutos El nuevo promedio de resolución del test es de 9.3 minutos

-

Cuál es el nuevo promedio de resolución del test si todos los alumnos tardaron un 10% más de tiempo en resolverlo?

Propiedad 4 = c. . x = 1.1 . 6.4 = 6.71 minutos El nuevo promedio de resolución del test es de 6.71 minutos

-

Los alumnos del gabinete psicopedagógico B, que cuenta con 70 alumnos, tardan 5 minutos promedio en resolver el test, y los del Gabinete psicopedagógico C, que cuenta con 60 alumnos, tardan 6 minutos en resolver el test. Si se consideran a los alumnos de los 3 gabinetes, cuánto tardan todos ellos en promedio en resolver el test?

Propiedad 5 = (x. + y + z) = 6.4 . 128 + 5 . 70 + 6 . 60 = 820 + 350 + 360 = 1530 = 5.93 minutos 128 + 70 + 60 258 258

El tiempo promedio que tardan los alumnos de los 3 gabinetes psicopedagógicos en resolver el test, es de 5.93 minutos.

42

EJERCITACION PRACTICA 3 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: A – Cuántos segundos tarda la mayor parte de los alumnos en leer el texto?- Interprete el resultado B – Cuál es el tiempo máximo que tarda el 50% de los alumnos más rápidos en leer el texto? – Interprete el resultado C – Cuál es el tiempo mínimo que tarda el 75% de los alumnos más lentos en leer el texto? – Interprete el resultado D – Es necesario calcular el Cuartil 2? Por qué? 2 – En el Ejercicio 2 de la Ejercitación Práctica 1: A – Cuántos hijos tienen la mayoría de las familias? – Interprete el resultado B – Cuál es el número de hijos que divide a la población de familias en dos mitades? – Interprete el resultado. C – Si se quisiera conocer la cantidad mínima y máxima de hijos que tiene el 50% central de la población de familias, qué medidas aplicaría? Calcúlelas e interprete el resultado. 3 – En el Ejercicio 3 de la Ejercitación Práctica 1: A – Se pueden calcular el Modo, Mediana y Cuartiles? Por qué? Calcule la o las medidas de posición que se pueden calcular 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: A – Qué coeficiente intelectual tienen la mayoría de los alumnos? – Interprete el resultado. B – Cuál es el puntaje máximo de coeficiente intelectual que obtuvieron el 50% de los alumnos más retrasados? – Interprete el resultado. C – Cuál es el puntaje mínimo de coeficiente intelectual que obtuvo el 25% de los alumnos más capaces? – Interprete el resultado

43

EJERCITACION PRACTICA 3 1 – En el Ejercicio 1 de la Ejercitación Práctica 1:

Segundos 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

F 4 9 15 23 35 55 70 80

A – Cuánto tarda la mayor parte de los alumnos en leer el texto? Modo = Li + c

= 60 + 10

d1 d.1 + d2 8 = 60 + 10 . 0.62 = 66.20 segundos 8+5

La mayor parte (la mayoría) de los alumnos tarda 66.20 segundos en leer el texto. B – Cuál es el tiempo máximo que tarda el 50% de los alumnos más rápidos en leer el texto? Mediana = Li + c N / 2 – F F

Orden de Mediana = N/2 = 80/2 = 40

= 60 + 10 40 – 35 = 60 + 10. 0.25 = 62.25 segundos 20 El 50% de los alumnos tarda hasta 62.25 segundos en leer el texto. El otro 50% restante, tarda más. C – Cuál es el tiempo mínimo que tarda el 75% de los alumnos más lentos en leer el texto? Cuartil 1 = Li + c N/4 – F f.

Orden del C1 = 80/4 = 20

= 40 + 10 20 – 15 = 40 + 10 . 0.625 = 40 + 6.25 = 46.25 segundos 8 El tiempo mínimo que tarda el 75% de los alumnos más lents en leer el texto, es de 46.25 segundos.

44

D – Es necesario calcular el Cuartil 2? Por qué? No, porque el Cuartil 2 es la Mediana, que ya se calculó. 2 – En el Ejercicio 2 de la Ejercitación Práctica 1:

Cantidad de hijos 0 1 2 3 4 5 6 7

f. 4 6 7 10 8 5 3 2 45

F 4 10 17 27 35 40 43 45

A – Cuántos hijos tienen la mayoría de las familias? Modo = 3 hijos La mayoría de las familias tienen 3 hijos. El número de hijos más frecuente es de 3 por familia. B – Cuál es el número de hijos que divide a la población de familias en dos mitades? Mediana = 3 hijos

Orden de mediana = 45 / 2 = 22.5

Tres es el número de hijos que divide a la poblaci n en dos mitades. El 50% de las familias (la mitad de las familias que menos hijos tienen) tienen hasta 3 hijos. El 50% restante (la mitad que tiene más hijos), más de 3. C – Si se quisiera conocer la cantidad mínima y máxima de hijos que tiene el 50% central de la población de familias, qué medidas aplicaría? Calcúlelas. Cuartil 1 = 2 hijos

Orden del C1 = N/4 = 45 / 4 = 11.25

Cuartil 3 = 4 hijos

Orden del cuartil 3 = N 3 / 4 = 33.75

El 50% central de las familias tiene entre 2 y 4 hijos.

45

3 – En el Ejercicio 3 de la Ejercitación Práctica 1: A – Se pueden calcular el Modo, Mediana y Cuartiles? Por qué? Calcule la o las Medidas de posición que se pueden calcular.

Tipo de bebida alcohólica Cerveza Vino Bebidas blancas Otros

f. 9 10 6 3 28

r. 0.3214 0.3571 0.2149 0.1071 1

% 32.14 35.71 21.49 10.71 100

Como se trata de una variable cualitativa nominal que solo clasifica a las unidades estadísticas, se puede calcular solamente el Modo = Vino 4 – En el Ejercicio 4 de la Ejercitación Práctica 1:

Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

F 4 20 45 85 104 115 120

A – Qué coeficiente intelectual tienen la mayoría de los alumnos? Modo = Li + c

d1 d.1 + d2

= 90 + 10

15 15 + 21

= 90 + 10 0.42 = 90 + 4.2 = 94.2 puntos

El puntaje más frecuente entre los alumnos encuestados es de 94.2 puntos B – Cuál es el puntaje máximo de coeficiente intelectual que obtuvo el 50% de los alumnos más retrasados?

46

Mediana = Li + c N / 2 – F f.

Orden de Mediana = 120 / 2 = 60

= 90 + 10 60 – 45 = 90 + 10 . 0.375 = 90 + 3.75 = 93.75 puntos 40 El coeficiente intelectual de la mitad de los alumnos que más bajo coeficiente tienen, es de hasta 93.75 puntos. El 50% de los alumnos con coeficiente intelectual más bajo, llega a 93.75 puntos. C – Cuál es el puntaje mínimo de coeficiente intelectual que obtuvieron los alumnos más capaces? – Interprete el resultado Cuartil 3 = Li + c N . 3 / 4 – F f.

Orden del C3 = N.3 / 4 = 120 . 3 / 4 = 90

= 100 + 10 90 – 85 = 100 + 10 . 0.263 = 100 + 2.63 = 102.63 puntos 19

El 75% de los alumnos, tiene un coeficiente intelectual de hasta 102.63 puntos. El 25% de los alumnos que tienen coeficiente intelectual más alto, tienen un puntaje mínimo de 102.63 puntos.

47

EJERCITACION PRACTICA 4 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: A – Cuál es el tiempo máximo que tarda la 3 / 10 parte de los alumnos más rápidos en leer el texto? – Interprete el resultado B – Cuál es el tiempo máximo que tarda el 85% de los alumnos más rápidos en leer el texto? – Interprete el resultado C – Cuál es el tiempo promedio que tardan todos los alumnos en leer el texto? – Interprete el resultado. D – El segundero con que se realizó la prueba estaba mal calibrado, midiendo en todos los casos 2 segundos menos. Cuál sería el nuevo promedio? Qué propiedad aplica? 2 – En el Ejercicio 2 de la Ejercitación Práctica 1: A – Cuál es el número de hijos máximo que tiene la 8 / 10 partes de las familias con menos hijos? – Interprete el resultado. B – Cuál es la cantidad de hijos mínima que tiene el 80% de las familias con más hijos? – Interprete el resultado. C – Cuál es el promedio de hijos de las 45 familias? Interprete el resultado. D – El mismo estudio se hizo en un barrio cercano de 62 familias y arrojó un promedio de 2.hijos Cuál es el promedio de hijos de los dos barrios? Qué propiedad aplica? 3 – En el Ejercicio 3 de la Ejercitación Práctica 1: A – Se pueden calcular los Deciles, Percentiles y Media aritmética? Por qué? Calcule la o las medidas de posición que a su criterio se pueden calcular. 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: A – Qué puntajes de coeficiente de inteligencia mínimo y máximo obtuvo el 60% central de la población de 120 alumnos? – Interprete el resultado B – Cuál es el puntaje promedio de estos 120 alumnos? – Interprete su resultado. C – Suponiendo que se quisiera utilizar un test para medir el coeficiente de inteligencia absolutamente equivalente al utilizado, pero cuyos puntajes en lugar de iniciarse en 80, lo hicieran en un valor 30% más alto para cada puntaje (80 + 30% = 80 . 1.3 = 104 puntos; 90 + 30% = 90 . 1.3 = 117 puntos, y así sucesivamente), cuál sería el nuevo promedio?. Qué propiedad aplica?

48

EJERCITACION PRACTICA 4 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: Segundos 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

F 4 9 15 23 35 55 70 80

PM 15 25 35 45 55 65 75 85

PM . f 60 125 210 360 660 1300 1125 850 4690

A – Cuál es el tiempo máximo que tarda la 3 / 10 parte de los alumnos más rápidos en leer el texto? – Interprete el resultado Decil 3 = Li + c N 3 / 10 – F f.

Orden del Decil 3 = 80 . 3 / 10 = 24

= 50 + 10 24 – 23 = 50 + 10 . 0.083 = 50 + 0.83 = 50.83 segundos 12 El 30% de los alumnos más rápidos, tardan hasta 50.83 segundos en leer el texto. El 70% restante tarda más de ese tiempo. B – Cuál es el tiempo máximo que tarda el 85% de los alumnos más rápidos en leer el texto? – Interprete el resultado Percentil 85 = Li + c N 85 / 100 – F f.

Orden del percentil 85 = 80 . 85 / 100 = 68

= 70 + 10 68 – 55 = 70 + 10 . 0.867 = 70 + 8.67 = 78.67 segundos 15 El 85% de los alumnos más rápidos, tardan como máximo 78.67 segundos en leer el texto. C – Cuál es el tiempo promedio que tardan todos los alumnos en leer el texto? – Interprete el resultado. MA =  PM . f = 4690 / 80 = 58.63 segundos N

49

El tiempo promedio que tardan los alumnos en leer el texto, es de 58.63 segundos D – El segundero con que se realizó la prueba estaba mal calibrado, midiendo en todos los casos 2 segundos menos. Cuál sería el nuevo promedio? Qué propiedad aplica? Propiedad = La MA de una variable más una constante es igual a la constante más la MA de la variable x. + c = x + c = 58,63 + 2 = 60.63 segundos 2 – En el Ejercicio 2 de la Ejercitación Práctica 1:

Cantidad de hijos 0 1 2 3 4 5 6 7

f. 4 6 7 10 8 5 3 2 45

F 4 10 17 27 35 40 43 45

x.f 0 6 14 30 32 25 18 14 139

A – Cuál es el número de hijos máximo que tiene la 8 / 10 partes de las familias con menos hijos? – Interprete el resultado Decil 8 = 5 hijos

Orden del D8 = 45 . 8 / 10 = 36

La 8 /10 partes de las familias con menos hijos (el 80%) tiene hasta 5 hijos. El 20% restante supera ese valor. B – Cuál es la cantidad de hijos mínima que tiene el 80% de las familias con más hijos? – Interprete el resultado Percentil 20 = 1

Orden del P20 = 45 . 20 / 100 = 9

El mínimo de hijos que tiene el 80% de las familias con más hijos es de 1 hijo. C – Cuál es el promedio de hijos de las 45 familias? MA =  x.f = 139 / 45 = 3.09 hijos N

50

Las 45 familias tienen en promedio 3 hijos cada una. D – El mismo estudio se hizo en un barrio cercano de 62 familias y arrojó un promedio de 2 hijos. Cuál es el promedio de hijos de los dos barrios? Qué propiedad aplica? Propiedad = La MA de una suma de variables correspondiente a diferentes poblaciones es igual a la suma de las medias aritméticas ponderadas por sus respectivas poblaciones. MA total = 45 x 3.09 + 62 x 2 = 139.05 + 124 = 263.05 = 2.46 hijos 45 + 62 107 107 3 – En el Ejercicio 3 de la Ejercitación Práctica 1: A – Se pueden calcular los Deciles, Percentiles y media aritmética? Por qué? Calcule la o las medidas de posición que a su criterio se pueden calcular. No, por tratarse de una variable cualitativa nominal. Se puede calcular el Modo. 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

F 4 20 45 85 104 115 120

PM 65 75 85 95 105 115 125

PM . f 260 1200 2125 3800 1995 1265 625 11270

A – Qué puntajes de coeficiente de inteligencia mínimo y máximo obtuvo el 60% central de la población de 120 alumnos? – Interprete el resultado Percentil 20 = Li + c N 20 / 100 – F f.

Orden del P20 = 120 . 20 / 100 = 24

= 80 + 10 24 – 20 = 80 + 10 . 0.16 = 80 + 1.6 = 81.6 puntos 25 Percentil 80 = Li + c N 80 / 100 – F F

Orden del percentil 80 =120 . 80 / 100 = 96

51

= 100 + 10 . 96 – 85 = 100 + 10 . 0.579 = 100 + 5.79 = 105.79 puntos 19 El 60% central de la población de alumnos obtuvo un puntaje entre 81.6 y 105.79 puntos. B – Cuál es el puntaje promedio de estos 120 alumnos? – Interprete su resultado. MA =  PM . f = 11270 = 93.92 puntos N 120 El puntaje promedio de los alumnos es de 93.92 puntos C – Suponiendo que se quisiera utilizar un test para medir el coeficiente de inteligencia absolutamente equivalente al utilizado, pero cuyos puntajes en lugar de iniciarse en 80, lo hicieran en un valor 30% más alto cada puntaje (80 + 30% = 80 . 1.3 = 104 puntos, 90 + 30% = 90 . 1.3 = 117 puntos, y así sucesivamente), cuál sería el nuevo promedio?. Qué propiedad aplica? Propiedad = La Media aritmética de una constante por una variable es igual a la constante por la media aritmética de la variable. c . x = c . x = 1.3 . 93.92 = 122.1 puntos

52

MEDIDAS DE DISPERSION

Debido a que solo las Medidas de posición no son suficientes para caracterizar una distribución, se utilizan otras medidas que indican la forma o variabilidad en que se distribuyen las observaciones alrededor de estas medidas. Son las llamadas Medidas de Dispersión o Variabilidad y expresan la homogeneidad o heterogeneidad de la distribución. Ellas ponen de manifiesto que a pesar de que dos distribuciones tengan, por ejemplo, un mismo Promedio, pueden ser muy diferentes entre sí. Es así que las Medidas de variabilidad o dispersión pueden considerarse como una medida del grado de representatividad de las Medidas de tendencia central. Las más importantes son:  Amplitud total – Es la medida más simple de variabilidad, ya que considera el primer y el último valor del campo de variabilidad de la variable.. Es la forma más rápida de calcular la dispersión de las observaciones pero tiene la desventaja de que al basarse en solo los dos casos extremos, no da una idea muy clara de cómo puede ser la distribución en el resto de los valores. No se las puede calculr en las variables cualitativas. En el caso de las variables cuantitativas, la diferencia entre el valor mayor y el valor menor de la variable recibe el nombre de Rango.  Desvío Semi intercuartílico – Se lo define como la mitad de la distancia entre los percentiles 75 (o Cuartil 3) y 25 (o Cuartil 1). DSI = C3 – C1 2 Entre el C3 y el C1 se encuentra el 50% de la distribución; la distancia entre ellos se llama Amplitud Intercuartílica. Si esa distancia se divide por 2, se obtiene el DSI, que indica la distancia promedio de los valores de los Cuartiles respecto de la Mediana. Si la distribución es simétrica, el C1 más el DSI ( ó C3 menos DSI) dará el valor mediana, indicando que exactamente el 25% de los casos estarán por encima y el 25% por debajo de la Mediana de ese 50% central.  Desvío Standard – También conocido como Dispersión, puede definírselo estadísticamente como la raíz cuadrada del promedio de los desvíos ponderados de los valores de variable con respecto a la media aritmética elevados al cuadrado.

=

 (x – x ) ² . f.. N

En la que: x. : Valor de variable x. : Media aritmética f.: Frecuencia absoluta correspondiente a cada valor de variable N : Población

53

Esta fórmula es aplicable al caso de las variables discretas. En el caso de variables continuas, será necesario reemplazar cada valor de variable por el Punto Medio de los respectivos intervalos. El Desvío Standard es la medida de dispersión más comúnmente utilizada porque permite medir el grado de concentración de los valores de variable alrededor del promedio o media aritmética. Desde el punto de vista práctico, la Media aritmética será más representativa de la distribución cuanto menor sea su Dispersión. Si se grafica la distribución, a medida que la dispersión de los valores de variable es mayor, la distribución tiende a ser más achatada, lo que significa que las frecuencias correspondientes a cada valor de variable se distribuyen más uniformemente entre los diferentes valores de variable; inversamente, si la dispersión es menor, la distribución tiende a ser más campanular, las frecuencias tienden a concentrarse en los valores centrales, cercanos a la Media Aritmética. Es así que las diferentes distribuciones pueden clasificarse en platocúrticas (mayor Desvío Standard), mesocúrticas o leptocúrticas (menor Desvío Standard). En una distribución simétrica o normal, la dispersión medida por encima y por debajo de la MA, marca los límites de aproximadamente el 68% central de las observaciones.

Propiedades del Desvío Standard 1 - La Dispersión (Desvío Standard) de una constante es igual a 0. c=0 2 - La Dispersión (Desvío Standard) de una constante más una variable es igual a la Dispersión de la variable.  (c + x) =  x 3 - La Dispersión (Desvío Standard) de una suma de variables no es igual a la suma de las dispersiones de las variables.  (x + y) ≠  x +  y 4 - La Dispersión (Desvío Standard) del producto de una variable por una constante es igual a la constante por la Dispersión de la variable.  (c . x) = c .  x Si se eleva al cuadrado el Desvío Standard se obtiene la Varianza cuyas propiedades son similares a las del Desvío Standard con excepción de que la Varianza de una suma de variables es iguala la suma de las Varianzas respectivas.  Desvío Medio – No es muy utilizado debido a los problemas que presenta para su tratamiento algebraico. Consiste en tomar los desvíos ponderados de cada variable respecto de la MA en

54

sus valores absolutos (si se los toma con sus signos positivos y negativos, la sumatoria daría 0, debido a la propiedad de la MA), sumarlos y dividirlos por la población. DM = 

x–x .f N

 Coeficiente de Variación Puede definírselo como el cociente entre el Desvío Standard y la Media aritmética. C.V. =  x. Es la proporción de la Dispersión o Desvío Standard respecto de la Media aritmética. Se lo utiliza para comparar la variabilidad de dos distribuciones aún cuando estén expresadas en medidas diferentes (por ejemplo, una distribución en la que se ha estudiado la edad de los individuos y otra en la que se ha estudiado su cociente intelectual). Lo que se quiere saber es en cuál de ellas los individuos presentan menor o mayor variabilidad). También, cuando dos distribuciones están medidas en unidades similares (por ej. el CI en niños y en personas mayores), presentarán diferentes medias aritméticas, por lo tanto al utilizar el Coeficiente de Variación se podrá determinar cuál distribución tiene menor o mayor dispersión. A medida que el Coeficiente de variación disminuye, se observará una mayor homogeneidad en los datos, o lo que es lo mismo, los datos estarán más concentrados alrededor del promedio. Las variables nominales no permiten el cálculo de ninguna Medida de dispersión. Las variables ordinales permiten el cálculo de la Amplitud total. Las variables cuantitativas, tanto discretas como continuas, permiten el cálculo de la Varianza, Desvío standard, Rango y Coeficiente de variación. En el caso de las escalas de medición de actitudes, en el que una variable ordinal como puede serlo el nivel de acuerdo, satisfacción, etc, es tratada como si fuera una variable a nivel intervalar (se le asignan números a cada valor de variable para poder operar matemáticamente con cada una de las dimensiones de la variable), es posible calcular las Medidas de dispersión.

Conveniencia del uso de las Medidas de Dispersión Uso de la Amplitud total -

Cuando los datos son demasiado escasos o dispersos como para justificar el cálculo de una medida de variabilidad más precisa. Cuando únicamente se desea conocer la amplitud total

Uso del Desvío semiintercuartílico -

Cuando la Mediana es la medida de tendencia central

55

-

Cuando la distribución presenta puntajes extremos o dispersos, lo que influirá negativamente en el cálculo del DS. Cuando lo que interesa es conocer de qué manera se concentra los casos en el 50% central de la distribución.

Uso del Desvío Standard -

Cuando posteriormente se deban calcular otros estadísticos o coeficientes de correlación.

56

EJEMPLOS DE CALCULO DE MEDIDAS DE DISPERSION  Variable cualitativa ordinal – Atributo ordinal - Nivel educacional x. = Nivel educacional Primario Secundario Universitario Posgrado

f 16 26 28 10  f = N =80

F 16 42 70 80

Amplitud total - Primario – Posgrado  Variable cuantitativa discreta – Cantidad de arrestos de los delincuentes

x. =Arrestos 1 2 3 4 5 6 7

(x – x)² 9.2416 4.1616 1.0816 0.0016 0.9216 3.8416 8.7616

f. 8 15 25 30 22 16 10  f = N = 126

(x – x)².f 73.9328 62.424 27.04 0.048 20.2752 61.4656 87.616 332.8016

Amplitud total - 1 - 7 arrestos Rango – 6 arrestos Desvío Standard / Dispersión DS =  =

 (x – x)² . f = N

332.8016 126

=

2.6413

57

= 1.6252 arrestos

Propiedades: A - Si al cabo de un año todos los delincuentes hubieran sido arrestados 3 veces más cada uno, cómo se vería afectado el Desvío Standard / dispersión? No se vería afectado, sería igual, ya que la distribución no modifica su forma. Propiedad 2: La Dispersión de una constante más una variable es igual a la Dispersión de la variable. B - - Si al cabo de un año todos los delincuentes hubieran sido arrestados un 20% más cada uno, cómo se vería afectado el Desvío Standard / dispersión? 1.6252 . 1.2 = 1.9504 arrestos Propiedad 4 : La Dispersión del producto de una variable por una constante es igual a la constante por la Dispersión de la variable.

Varianza ² = 1.6252 ² = 2.64 arrestos ²

Coeficiente de Variación CV =  = 1.6252 arrestos = 0.4023 ó 40.23% x. 4.04 arrestos  Variable cuantitativa continua – Tiempo en minutos que se tarda en resolver un test

x. = Tiempo 0–2 2-4 4-6 6–8 8 – 10 10 – 12 12 - 14

f 18 20 25 22 17 14 12  f = N = 128

(x – x)² 29.16 11.56 1.96 0.36 6.76 21.16 43.56

PM 1 3 5 7 9 11 13

Amplitud total - 0 – 14 minutos Rango – 14 minutos

58

(x – x)².f 524.88 231.2 49.0 7.92 114.92 296.24 522.72 1746.88

Desvío Standard / Dispersión DS =  =

 (x – x)² . f = N

1746.88 128

=

13.6475

= 3.69 minutos

Propiedades: A - El minutero con que se realizó la prueba estaba mal calibrado, ya que midió 2 minutos más de lo correcto. Cómo se ve afectada la Dispersión? La dispersión o Desvío Standard no se ve afectada, la distribución no modifica su forma, se traslada. Propiedad 2 - La Dispersión de una constante más una variable es igual a la Dispersión de la variable B – Si todos los alumnos hubieran tardado un 20% menos en resolver el test, cómo se ve afectada la Dispersión? 3.69 / 0.8 = 2.95 minutos Propiedad 4 : La Dispersión del producto de una variable por una constante es igual a la constante por la Dispersión de la variable.

Varianza ² = (3.69)² = 13.62 minutos ² Coeficiente de Variación CV =  = x.

3.69 minutos 6.4 minutos

= 0.5766 = 57 66%

59

DESVIO SEMIINTERCUARTILICO Variable cuantitativa discreta – Cantidad de arrestos DSI = C3 – C1 = 5 – 3 2 2

= 2 =1 2

Esta es una distribución simétrica ya que el C1(3) + 1 = 4 que es el valor Mediana. El 50% central de las observaciones se distribuye equitativamente alrededor de la Mediana Variable cuantitativa continua – Tiempo en minutos que los alumnos de un gabinete psicopedagógico tardan en resolver un test de aptitud psicomotriz. DSI = 9.3 – 3.4 = 5.9 = 2.95 2 2 En este caso, al ser el valor Mediana (6.09) menor que el C1 + el DSI (3.4 + 2.95) = 6.35, la concentración del 25% de las observaciones a la izquierda de la Mediana es mayor que la de la derecha. El 50% central de las observaciones no se distribuye equitativamente alrededor de la Mediana.

60

EJERCITACION PRACTICA 5 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: A – Cuáles son los tiempos máximos y mínimos que tardan los alumnos en leer el texto? – Qué medida aplica? B – Calcular el Desvío Standard – Interprete sus resultados. C – Si todos los alumnos hubieran tardado un 30% más en leer el texto, cómo se vería afectado el Desvío Standard? Qué propiedad aplica? – Qué sucede con la forma de la distribución? En qué valores de variable se inicia y finaliza? D – Qué otra medida de dispersión utilizaría para comparar la distribución original y la aumentada en un 30%? 2 – En el Ejercicio 2 de la Ejercitación Práctica 1: A – Cuál es el rango de esta distribución? B – Calcule el Desvío Standard – Interprete su resultado C – Suponiendo que despùés de un tiempo todas las familias tuvieran 2 hijos más, cómo se vería afectado el Desvío Standard? Qué propiedad aplica? 3 – En el Ejercicio 3 de la Ejercitación Práctica 1: Qué medidas de Dispersión se pueden aplicar en este caso? Fundamente. 4 – En el Ejercicio 4 de la Ejercitación Práctica 1: A – Se ha calculado el Desvío Standard de esta distribución y arrojó un valor de 13.89 puntos. A el mismo grupo de 120 alumnos se les tomó una prueba de destreza manual (tiempo, medido en minutos, que tardaban en resolver las diferentes pruebas), la cual tuvo como resultado que los alumnos tardaban en promedio 11.1 minutos con un Desvío Standard de 4.25 minutos. Qué medida de dispersión utilizaría para saber cuál de las dos distribuciones (la de los puntajes y la de los minutos) es más variable (dispersa o heterogénea)?

61

EJERCITACION PRATICA 5 1 – En el Ejercicio 1 de la Ejercitación Práctica 1: Segundos 10 – 20 20 – 30 30 – 40 40 – 50 50 – 60 60 - 70 70 – 80 80 - 90

f. 4 5 6 8 12 20 15 10 N = 80

PM 15 25 35 45 55 65 75 85

(x – x)² 1903.58 1130.98 558.38 185.78 13.18 40.58 267.98 695.38

(x - x)² .f 7614.32 5654.90 3350.28 1486.24 158.16 811.60 4019.70 6953.80 30049

A – Cuáles son los tiempos máximos y mínimos que tardan los alumnos en leer el texto? – Qué medida aplica? Los valores máximos y mínimos son 90 y 10 segundos – Se aplica la Amplitud total. B – Calcular el Desvío Standard – Interprete sus resultados. =

=

 (x – x)² f N 30049 80

MA = 58.63 segundos

=

375.61 = 19.38 segundos

La distancia promedio de cada una de las unidades respecto de la media es de 19.38 segundos. C – Si todos los alumnos hubieran tardado un 30% más en leer el texto, cómo se vería afectado el Desvío Standard? Qué propiedad aplica? – Qué sucede con la forma de la distribución? En qué valores de variable se inicia y finaliza? Propiedad : El DS de una constante por una variable es igual a la constante por el DS de la variable. 19.38 . 1.3 = 25.19 segundos En este caso, la distribución se extiende, iniciándose en 13 segundos y finalizando en 117. D – Qué otra medida de dispersión utilizaría para comparar la distribución original y la aumentada en un 30%?

62

Se utiliza el Rango. En la distribución original el rango es de 80 segundos (90 – 10), mientras que en la aumentada en un 30%, es de 104 segundos (117 – 13). 2 – En el Ejercicio 2 de la Ejercitación Práctica 1:

Cantidad de hijos 0 1 2 3 4 5 6 7

(x – x)² 9.5481 4.3681 1.1881 0.0081 0.8281 3.6481 8.4681 15.2881

f. 4 6 7 10 8 5 3 2 45

(x – x)².f 38.1924 26.2086 8.3167 0.081 6.6248 18.2405 25.4043 30.5762 153.6445

A – Cuál es el rango de esta distribución? R=7–0=7 B – Calcule el Desvío Standard MA = 3.09 hijos =

 (x – x)² .f N

=

153.6445 = 1.85 hijos 45

La distancia promedio de cada una de las unidades respecto de la media es de 1.85 hijos. C – Suponiendo que después de un tiempo todas las familias tuvieran 2 hijos más, cómo se vería afectado el Desvío Standard? Qué propiedad aplica? Propiedad = El Desvío Standard de una constante más una variable es igual al DS de la variable.  (c + x) =  x En este caso la distribución no se modifica (se mantiene la misma amplitud y rango), mantiene su misma forma, solamente se traslada y en lugar de iniciarse en 0 hijo y finalizar en 7 hijos, se inicia en 2 y finaliza en 9 hijos.

63

3 – En el Ejercicio 3 de la Ejercitación Práctica 1: Qué medidas de Dispersión se pueden aplicar en este caso? Fundamente. Ninguna, por tratarse de una variable nominal. 4 – En el Ejercicio 4 de la Ejercitación Práctica 1:

Puntajes 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130

f. 4 16 25 40 19 11 5 120

PM 65 75 85 95 105 115 125

(x – x)² 836.3664 357.9664 79.5664 1.1664 122.7664 444.3664 965.9664

(x – x)².f 3345.4656 5727.4624 1989.16 46.656 2332.5616 4888.0304 4829.832 23159.167

A – Se ha calculado el Desvío Standard de esta distribución y arrojó un valor de 13.89 puntos. A el mismo grupo de 120 alumnos se les tomó una prueba de destreza manual (tiempo, medido en minutos, que tardaban en resolver las diferentes pruebas), la cual tuvo como resultado que los alumnos tardaban en promedio 11.1 minutos con un Desvío Standard de 4.25 minutos. Qué medida de dispersión utilizaría para saber cuál de las dos distribuciones (la de los puntajes y la de los minutos) es más variable (dispersa o heterogénea)?

DS =

23159.167 = 13.89 puntos 120

Se usa el Coeficiente de variación: DS / MA Tiempo que tardan los alumnos en resolver los items de la prueba. CV = 4.25 minutos / 11.1 minutos = 0.3829 ó 38.29% Puntajes de coeficiente intelectual CV = 13.89 puntos / 93.92 puntos = 0.1479 ó 14.79% Los alumnos son más homogéneos en cuanto a su coeficiente intelectual y menos en cuanto a sus habilidades manuales.

64

MEDIDAS DE DISTRIBUCION

Son medidas que indican la variación o no similitud de una distribución empírica respecto de una distribución normal o completamente simétrica. • •

Asimetría Kurtosis

Asimetría La Asimetría se refiere al sesgo que presenta una distribución respecto de otra distribución completamente simétrica. Esto significa que un extremo o cola es mayor que el otro y no iguales como lo son en una simétrica. De acuerdo con ello, la asimetría puede ser: -

Positiva o hacia la derecha. En una curva con este tipo de asimetría, la cola más larga será la de la derecha, el sesgo será en esa dirección, mientras que la mayor cantidad de información se concentrará a la izquierda. Los desvíos positivos respecto a la media aritmética superan a los negativos.

Mo < Me < MA Asimetría > 0

-

Negativa o hacia la izquierda. En una curva con este tipo de asimetría, la cola más larga será la de la izquierda, el sesgo será en esa dirección, mientras que la mayor cantidad de información se concentrará a la derecha. Los desvíos negativos respecto a la Media aritmética superan a los positivos.

65

Mo > Me > MA Asimetría < 0

En términos generales, la fórmula a aplicar para el cálculo de la Asimetría es: A = MA – Mo

σ

El resultado obtenido puede ser positivo, negativo o igual a 0. Un valor igual a 0 indica que no hay asimetría; un número positivo, indica que la asimetría es hacia la derecha y un resultado negativo, que la asimetría será hacia la izquierda.

Kurtosis La curtosis se refiere al grado de apuntamiento de la distribución en relación a una curva normal. De acuerdo con ello, las distribuciones o curvas pueden ser -

Platocúrticas , cuando la curva es más plana que la normal. K < 0.263

-

Leptocúrticas, cuando presenta un apuntamiento más pronunciado que el de la normal. K > 0.263

-

Mesocúrtica, cuando su grado de apuntamiento es el normal. K = 0.263

66

El resultado obtenido puede ser positivo, negativo o igual a 0,263. Un valor igual a 0,263 indica que la curva o distribución es mesocúrtica; un número mayor a 0.263, indica que la curva es leptocúrtica y un resultado menor a 0.263, que la distribución es platocúrtica. Si bien los paquetes informáticos calculan automáticamente la Kurtosis, en términos estadísticos la fórmula para su cálculo es la siguiente: K=

DSI P90 – P10

Es de destacar que tanto la Asimetría como la Kurtosis solo se pueden calcular en variables cuantitativas.

67

EJEMPLOS ASIMETRIA

Variable cuantitativa discreta – Cantidad de arrestos A = MA – Mo = 4.04 – 4 = 0.04 = 0.0246 σ 1.6252 1.6252 Asimetría positiva o hacia la derecha. Esto significa que la mayor parte de la información se concentra a la izquierda de la distribución.

Asimetría > 0 Mo < Me < MA 4 < 4.04

Variable cuantitativa continua – Tiempo en minutos que los alumnos de un gabinete psicopedagógico tardan en resolver un test de aptitud psicomotriz. A = 6.4 – 5.26 = 0.31 3.69 Asimetría positiva o hacia la derecha. Esto significa que la mayor parte de la información se concentra a la izquierda de la distribución. Esto coincide con las conclusiones del DSI.

68

KURTOSIS

Variable cuantitativa discreta – Cantidad de arrestos K=

DSI = P90 – P10

1 = 1 = 0.2 6–1 5

En este caso, al ser el valor de K levemente inferior a 0,263 la curva es platocúrtica, es decir, menos apuntalada que la normal.

Variable cuantitativa continua – Tiempo en minutos que los alumnos de un gabinete psicopedagógico tardan en resolver un test de aptitud psicomotriz. K=

2.95 11.86 – 1.4

=

2.95 = 0.27 10.46

En este caso, al ser el valor de K levemente superior a 0,263 la curva es leptocúrtica, es decir, más apuntalada que la normal.

69