Julio Deride Silva. 27 de agosto de 2010

Estad´ıstica Descriptiva Estad´ıstica Descriptiva Julio Deride Silva ´ Area de Matem´ atica Facultad de Ciencias Qu´ımicas y Farmc´ euticas Universid...
23 downloads 0 Views 590KB Size
Estad´ıstica Descriptiva

Estad´ıstica Descriptiva Julio Deride Silva ´ Area de Matem´ atica Facultad de Ciencias Qu´ımicas y Farmc´ euticas Universidad de Chile

27 de agosto de 2010

Estad´ıstica Descriptiva Tabla de Contenidos

Estad´ıstica Descriptiva Julio Deride Silva ´ Area de Matem´ atica Facultad de Ciencias Qu´ımicas y Farmc´ euticas Universidad de Chile

27 de agosto de 2010

Estad´ıstica Descriptiva Tabla de Contenidos

Tabla de Contenidos 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Representaciones Gr´ aficas

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Representaciones Gr´ aficas

Introducci´ on Con las medidas estudiadas anteriormente, una muestra ha sido analizada desde un punto de vista descriptivo, exclusivamente a trav´es del estudio cualitativo de estad´ısticos representativos. Es as´ı, como se ha estudiado la forma en que una variable aleatoria toma valores para una muestra y se ha descrito con medidas de tendencia central, dispersi´ on, simetr´ıa y apuntamiento. Para finalizar el estudio descriptivo, es necesario hacer una revisi´ on de las distintas representaciones gr´ aficas, que entreguen una intuici´ on visual, precisa y concisa del comportamiento de una variable aleatoria.

Estad´ıstica Descriptiva Histogramas y Diagramas de Barra.

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Histogramas y Diagramas de Barra.

Histogramas y Diagramas de Barra. Estos gr´ aficos consisten en representar las clases en el eje de las ordenadas y la frecuencias (absolutas o relativas, simple o acumulada) en el eje de las abscisas. Si se utiliza la frecuencia simple, entonces el histograma se dir´ a diagrama direfencial. Para frecuencias acumuladas, se dir´ a diagrama integral. Se dice diagrama de barra cuando la variable en estudio sea del tipo cualitativa o discreta. Finalmente, hablaremos de histogramas cuando la variable en estudio sea cuantitativa continua. En este ´ ultimo caso, se complementa el gr´ afico con el pol´ıgono de frecuencias, correspondiente a la uni´ on de los segmentos de rectas que unen la frecuencia de cada clase, desde su respectiva marca de clase, como se ilustra en la figura 1.

Estad´ıstica Descriptiva Histogramas y Diagramas de Barra.

Histograma

Figura: Histograma y pol´ıgono de frecuencia.

Estad´ıstica Descriptiva Histogramas y Diagramas de Barra.

Construcci´ on Para la construcci´ on de histogramas, se considera el siguiente criterio: el ´ area que ocupa cada una de las barras debe ser proporcional a la frecuencia (absoluta o relativa, simple o acumulada). Es as´ı como, en los histogramas, si cada intervalo de clase tiene igual ancho, s´ olo se debe satisfacer que la altura sea proporcional a la frecuencia, considerando que lo t´ıpico es usar directamente la frecuencia como altura. Para graficar m´ as de una muestra, se utilizan barras adyacentes, y frecuencias relativas, para aislar el efecto del tama˜ no de cada una.

Estad´ıstica Descriptiva Diagrama de sectores y tortas.

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Diagrama de sectores y tortas.

Diagrama de sectores y tortas. Este tipo de diagrama consiste en dividir un c´ırculo en la cantidad total de clases, de manera tal que cada sector circular contenga un ´ area proporcional a la frecuencia relativa. Esto es, el ´ angulo central de la clase i, αi , debe cumplir la siguiente relaci´ on ni αi = , 2π n donde ni corresponde a la cantidad de observaciones en la clase i y n el tama˜ no de la muestra (ver figura 2).

Estad´ıstica Descriptiva Diagrama de sectores y tortas.

Ejemplo

Figura: Diagrama de tortas.

Estad´ıstica Descriptiva Diagrama de sectores y tortas.

Observaciones Si se desea comparar dos poblaciones, se utilizan semi-c´ırculos, donde los radios deben capturar las diferencias en los tama˜ nos de la muestra. Para obtener una relaci´ on entre los radios, se establece que el ´ area de cada semi-c´ırculo sea proporcional al tama˜ no de la muestra respectiva. Esto es, sean dos muestras, de tama˜ no n1 y n2 respectivamente. La relaci´ on que deben cumplir sus radios es π 2 2 r1 π 2 2 r2

n1 = ⇒ r1 = r2 n2

r

n1 n2

Estad´ıstica Descriptiva Diagrama de sectores y tortas.

Ejemplo

Estad´ıstica Descriptiva Pictograma.

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Pictograma.

Pictograma Este diagrama corresponde a dibujos alusivos a la variable en estudio, donde su construcci´ on es tal que el ´ area de cada dibujo sea proporcional a la frecuencia. Por ejemplo, si analizamos el ingreso, un pictograma se nota en la figura 4

Estad´ıstica Descriptiva Pictograma.

Pictograma

Figura: Pictograma.

Estad´ıstica Descriptiva Boxplot o gr´ afico de cajas.

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Boxplot o gr´ afico de cajas.

Boxplot Es un tipo de representaci´ on usada para resumir informaci´ on muestral. Para cada muestra se construye el diagrama de la siguiente forma: 1

Se ubica una caja, ya sea vertical u horizontal, entre los cuartiles Q1 y Q3 .

2

Con una l´ınea se unen a la caja los percentiles P2,5 y P97,5 , respectivamente.

3

Se marca la mediana Q2 dentro de la caja.

4

Se denota con un punto las observaciones xmin y xmax .

Finalmente, el dibujo se realiza como en la figura 5

Estad´ıstica Descriptiva Boxplot o gr´ afico de cajas.

Ejemplo Boxplot

Figura: Boxplot.

Estad´ıstica Descriptiva Diagramas de Tallo-Hoja.

Outline 1 Representaciones Gr´ aficas 2 Histogramas y Diagramas de Barra. 3 Diagrama de sectores y tortas. 4 Pictograma. 5 Boxplot o gr´ afico de cajas. 6 Diagramas de Tallo-Hoja.

Estad´ıstica Descriptiva Diagramas de Tallo-Hoja.

Tallo-Hoja Una forma de representaci´ on alternativa para un conjunto de observaciones es el Diagrama de Tallo-Hoja del cual se muestra un ejemplo en el cuadro PROF 11 14 6 1

N´ umero de Hojas 11 5 8 5 1

Tallo 5 6 7 8 9

: : : : :

Hojas 11233345669 34799 00123488 23467 5

Estad´ıstica Descriptiva Diagramas de Tallo-Hoja.

Elementos Este diagrama contiene la siguiente informaci´ on: Tama˜ no de la muestra: Es la suma de la cantidad de hojas. En el ejemplo n = 11 + 5 + 8 + 5 + 1 = 30. Rango: Es la diferencia entre el ´ ultimo valor y el primero. En el ejemplo, R = 9,5 − 5,1 = 4,3. Mediana: Se encuentra en el tallo (l´ınea) donde no se se˜ nala profundidad. En el ejemplo, corresponde a la observaci´ on n´ umero 15, y por lo tanto, ˜x = 6,9. La profundidad indica la cantidad de hojas por bajo y por sobre el tallo de la mediana correspondiente a cada tallo. En el ejemplo, Prof(5) = 11, Prof(7) = 8 + 5 + 1 = 14, Prof(8) = 5 + 1 = 6, Prof(9) = 1.

Estad´ıstica Descriptiva Diagramas de Tallo-Hoja.

Construcci´ on 1

Ordenar los datos de menor a mayor.

2

Calcular la cantidad de l´ıneas que tendr´ a el diagrama mediante L = [10 · log10 n], representando n el tama˜ no de la muestra y [x] la parte entera de x.

3

Estimamos el intervalo de valores para cada l´ınea seg´ un r=

R , L

redondeando a la potencia de 10 m´ as pr´ oxima, siendo R el rango de la muestra.

Estad´ıstica Descriptiva Diagramas de Tallo-Hoja.

Diagrama Prof: Para cada fila, excepto en la l´ınea central que contiene la mediana, muestra la m´ axima profundidad correspondiente a los datos de la fila. N´ umero de Hojas: Indica la cantidad de hojas de cada tallo (fila). Tallo: Los tallos est´ an ordenados, en columna, desde la menor observaci´ on xmin y la mayor xmax ; y en l´ıneas separadas, aparecen todos los valores posibles de tallos dentro del rango observado, con la precisi´ on dada por los intervalos calculados anteriormente. Hoja: Se representa el d´ıgito de cada observaci´ on correspondiente a cada tallo. As´ı, por ejemplo, la primera observaci´ on de la muestra aparece en la primera l´ınea, y as´ı sucesivamente.