TEMA 6 MUESTRAS ALEATORIAS Y DISTRIBUCIONES EN EL MUESTREO

Probabilidad y Estadística (I.I.) Tema 6 TEMA 6 MUESTRAS ALEATORIAS Y DISTRIBUCIONES EN EL MUESTREO 1.- Introducción: Los análisis estadísticos que...
3 downloads 2 Views 276KB Size
Probabilidad y Estadística (I.I.)

Tema 6

TEMA 6 MUESTRAS ALEATORIAS Y DISTRIBUCIONES EN EL MUESTREO

1.- Introducción: Los análisis estadísticos que se realizan en el mundo real tienen como objetivo estudiar las propiedades características de las poblaciones (cuyos individuos pueden ser personas, animales o cosas).  el porcentaje de tornillos defectuosos producidos por una máquina en un determinado período de tiempo  el gasto (en alimentación, vestido, vivienda, etc…) de las familias españolas.  el coeficiente intelectual de los alumnos universitarios europeos Pero estudiar todos los individuos de la población supone:  Elevados costes económicos  Mucho tiempo de trabajo  Errores de medición  En algunos casos, la destrucción del elemento objeto del estudio (vida media de un motor, tiempo de duración de determinado tipo de cubiertas de automóvil,…) Se recurre entonces a considerar conjuntos de elementos representativos de dicha población, llamadas muestras, cuyas propiedades nos permiten inducir las propiedades que nos interesan de la población. El estudio de poblaciones mediante muestras adecuadas tomadas de ellas constituye la llamada

Inferencia Estadística, Estadística Inductiva, Teoría de la Estimación o Teoría de Muestras Para inferir resultados de las poblaciones a partir de datos de las muestras cabe distinguir dos formas generales de actuar:

Estimación: Entenderemos por estimación de un parámetro poblacional al cálculo del valor de este a través de una muestra. Por ejemplo, si pretendemos determinar el valor de la media poblacional, podríamos calcular la media de la muestra elegida y atribuir este valor a aquella. Para que esta estimación sea correcta debe cumplir ciertas condiciones.

Prueba o contraste de hipótesis: En este caso se realiza una conjetura (hipótesis) sobre el valor del parámetro poblacional desconocido, basándonos en informaciones o conocimiento previo del problema y se trata de elaborar una regla que nos permita dilucidar sobre su validez. Esta regla se denomina contraste o test de la hipótesis. Ambas formas de actuar para producir una inferencia son complementarias.

2.- Noción y tipos de muestras: Para que las conclusiones de la teoría del muestreo y de la inferencia estadística sean válidas, las muestras deben escogerse representativas de la población. El análisis de los métodos de muestreo y los problemas relacionados con ellos se llama diseño del experimento.

1

Probabilidad y Estadística (I.I.)

Tema 6

Existen varias formas de seleccionar muestras de las poblaciones: Muestra aleatoria: cuando los elementos de la población se eligen de forma aleatoria, usando cualquier mecanismo de azar aleatoria simple (m.a.s.): Se garantiza que todos los individuos de la población tengan la misma probabilidad de ser elegidos en la muestra y que los miembros de esta se elijan de forma independiente.

sistemática: se obtiene eligiendo al azar, mediante m. a. s., un elemento de los k primeros (xi). El resto de los elementos muestrales vendrán dados por xi+k, xi+2k,…. Siendo k el entero más próximo a N/n, donde N es el tamaño de la población y n el de la muestra. estratificada: se dividen los elementos de la población en clases o estratos (edad, renta, etc…) y dentro de cada uno de ellos se eligen los elementos por m. a. s. o sistemático. Muestra no aleatoria: Se seleccionan los individuos de forma subjetiva (opinática), lo que puede introducir cierto sesgo a los resultados obtenidos. Nosotros supondremos a partir de ahora que utilizamos siempre el muestreo aleatorio simple. Una muestra aleatoria simple puede obtenerse de una población usando mecanismos que den igual oportunidad de selección a todo miembro de la población, entre los que podemos nombrar:  lanzar una moneda  sacar bolas numeradas, cada una de las cuales representa a un elemento de la población, tomadas de una urna donde han sido mezcladas  generar números aleatorios por medio de un ordenador En definitiva cualquier mecanismo que cumpla con las reglas conocidas del azar, es confiable para seleccionar una muestra aleatoria simple. De manera más formal, para seleccionar una muestra aleatoria simple de tamaño n de una población f(x)1, debe definirse una variable aleatoria Xi: i=1,2,...,n, que represente la medición o valor muestral iésimo que se observe. Las variables aleatorias X1,, X2,, ..., Xn (o la variable aleatoria multidimensional (X1,X2,...Xn)), constituirán entonces una muestra aleatoria de la población f(x) con valores numéricos x1,, x2,, ..., xn, si las mediciones se obtienen repitiendo el experimento n veces, independientemente, esencialmente bajo las mismas condiciones. Debido a las condiciones idénticas bajo las cuales se seleccionan los elementos de la muestra, es razonable suponer que las n variables aleatorias X1,, X2,, ..., Xn son independientes, y que cada una tiene la misma distribución de probabilidad f(x). Esto es, las distribuciones de probabilidad de X1,, X2,, ..., Xn son, respectivamente, f(x1), f(x2), ..., f(xn) y su distribución de probabilidad conjunta es:

f(X1,X2, ... Xn) = f(X1).f(X2)....f(Xn) .

1

Entendiendo por tal, a la población cuyas observaciones son valores de una variable aleatoria que tiene una distribución f(x). Por ejemplo, si inspeccionamos artículos que salen de una línea de ensamblaje para verificar los defectos; entonces cada observación de la población puede ser un valor de 0 ó 1 de la variable aleatoria binomial con distribución de probabilidad f(x)=px.q1-x x=0,1,...

2

Probabilidad y Estadística (I.I.)

Tema 6

3.- Estadísticos o estimadores: Un parámetro es una caracterización numérica de la distribución de la población de manera que describe total (λ de una de Poisson) o parcialmente (µ de una normal N(µ,σ)), la función de densidad de probabilidad de la característica de interés de la población. Es un valor fijo y desconocido, puesto que para conocerlo necesitaríamos estudiar toda la población. Como los parámetros poblacionales son difíciles de obtener directamente, se recurre a los estadísticos o estadigrafos para estimarlos. Un estadístico no es más que una función de las variables aleatorias que constituyen la muestra y que no contiene ningún valor desconocido. Es una caracterización numérica de la muestra (media, varianza, et…) Su valor no es fijo sino que depende de la muestra particular seleccionada. El estadístico es a la muestra lo que el parámetro es a toda la población. Más formalmente, dada una m.a.s. X1, X2, ..., Xn, de una población en la que se estudia la variable aleatoria X, se define Y = H(X1, X2, ..., Xn), donde H es cualquier función real, como un estadístico o estadigrafo, que, para cada realización de la muestra, definida por el n-tuplo (x1, x2, ... xn) toma un valor diferente y = H(x1, x2, ..., xn). Dicho de otra forma, un estadigrafo es una función real de la muestra. El estadístico calculado desde la muestra aleatoria rara vez, si es que alguna, concuerda exactamente con el parámetro de la población de donde fue tomada la muestra y además, el estadístico calculado a partir de una muestra de la población por lo general no concuerda exactamente con el estadístico calculado a partir de otra muestra de la misma población. Esta diferencia se presenta porque el mecanismo azaroso, empleado para seleccionar la muestra, puede hacerlo cada vez de forma ligeramente diferente. De acuerdo con la definición anterior un estadigrafo es una variable aleatoria, que como tal, tiene una distribución de probabilidad. Consideremos todas las posibles muestras de tamaño n en una población dada (con o sin reposición). Para cada muestra podemos calcular un estadístico (tal como la media o la desviación típica), cuyo valor variará de muestra a muestra. De esta manera obtenemos una distribución del estadístico que se llama distribución en el muestreo. Si, por ejemplo, el estadístico utilizado es la media muestral, entonces la distribución se llama distribución de muestreo de la media. Análogamente podríamos tener distribución de muestreo de la desviación típica, de la varianza, de la mediana, de las proporciones, etc... Para cada distribución de muestreo podemos calcular, a su vez, la media, varianza, etc.... Así pues, podemos hablar de la media y la desviación típica de la distribución de muestreo de la media, etc... La distribución muestral de un estadístico depende del tamaño de la población, del tamaño de las muestras y del método de selección de estas últimas. En el resto de este tema se estudiarán varias de las distribuciones muestrales de uso más frecuente en Estadística. Las aplicaciones de estas distribuciones muestrales a problemas de inferencia estadística se verán en los temas siguientes. En el resto de este tema se estudiarán varias de las distribuciones muestrales de uso más frecuente en Estadística. Las aplicaciones de estas distribuciones muestrales a problemas de inferencia estadística se verán en los temas siguientes. Ejemplo: Tenemos una población con los siguientes N = 3 elementos: X = {1, 2 y 3}, donde µ =2 σ2 = 0,67.

3

Probabilidad y Estadística (I.I.)

Tema 6

Se extraen muestras de n = 2 elementos: Con reposición, tenemos 9 posibles muestras: (1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); y (3, 3). Sin reposición, tenemos 6 posibles muestras: (1, 2); (1, 3); (2, 1); (2, 3); (3, 1); y (3, 2). En cada una de las muestras pueden calcularse los correspondientes estadísticos descriptivos: Por ejemplo, con reposición: Las medias muestrales ( x ) serían: 1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; y 3 Las varianzas muestrales (S2) serían: 0; 0,25; 1; 0,25; 0; 0,25; 1; 0,25; y 0 Por tanto, los estadísticos son variables aleatorias que pueden adoptar diferentes valores y que tienen su propia distribución de probabilidad. En el ejemplo vemos que x puede tomar 5 posibles valores y que la probabilidad que corresponde a cada uno de ellos (f ( xi ), su distribución) es:

No es necesario construir la distribución de un estadístico (p.e. de cada estadístico tiene su propia distribución muestral conocida.

x ) en todos los casos ya que

4.- Principales distribuciones en el muestreo: Las distribuciones muestrales de uso más frecuente en Estadística que aquí estudiaremos serán:

DISTRIB. MUESTREO Media Muestral Proporción Muestral p Cuasivarianza muestral S2 Diferencias y sumas

4.1.- Distribución de muestreo de la media muestral: La primera distribución muestral importante a considerarse es la de la media muestral X . Esta estadística tiene un papel muy importante en problemas de toma de decisiones para medias poblacionales desconocidas. Supóngase que se toma una muestra aleatoria de n observaciones de una población (con cualquier

4

Probabilidad y Estadística (I.I.)

Tema 6

distribución) con media µ y con varianza finita σ2. Cada observación Xi : i=1, 2, ..., n, de la muestra aleatoria constituye una variable aleatoria independiente, con la misma distribución que la población que está siendo muestreada. (E[Xi] = µ; V(Xi) = σ2). Entonces, la estadística:

X =

X 1 + X 2 + ... + X n = n

n

1

∑n X

i

i=1

se define como la media de las n v.a.i.i.d. o, sencillamente, media muestral. Nótese que una vez que se conocen las realizaciones x1, x2, ..., xn de X1, X2, ..., Xn, respectivamente, la realización obtiene promediando los datos muestrales. La media (esperanza) de la distribución de esta media muestral, simbolizada

x de X se

µ x es la misma que la

media de la población, esto es:

1 1 n  1 n E [X ] = µ X = E  ∑ xi  = ∑ E [X i ] = ⋅ n ⋅ E [ X ] = E [ X ] = µ n  n i =1  n i =1 La varianza de la distribución de la media muestral, que se simboliza por

σ x2 , es igual a la varianza

de la población σ2 dividida por el tamaño n de la muestra. Esto es:

1 n  1 2  n  1 xi  = 2 ∑ xi  = 2 σ ∑ i =1  n  n i =1  n

n

∑ σ X2 =

σ X2 = σ 2 

i

i =1

1 σ2 2 σ n ⋅ ⋅ = n n2

La desviación típica (error típico) de la distribución de la media muestral sería:

σ X = σ X2 =

σ

n

Si la variable original sigue una distribución Normal, la media muestral sigue también una

distribución Normal

X ∈ N (µ ,σ 2 ) ⇒

(

X ∈ N µ ,σ

2

n

)

Si la variable original sigue una distribución cualquiera, pero el tamaño de la muestra es suficientemente grande (≥ 30), dado que la media muestral es igual a la suma de variables independientes de igual media y varianza, aplicando el Teorema Central del Límite (que veremos a continuación), podemos decir que el estadístico media muestral se distribuye también según una Normal, como antes. Ejemplo: El CI de los alumnos de un centro especial se distribuye normalmente con media 80 y desviación típica 10. Si extraemos una muestra aleatoria simple de 25 alumnos: a) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que obtenga como mínimo una puntuación en CI de 75? b) ¿Cuál es la probabilidad de que su media aritmética sea mayor de 75? c) ¿Cuál es la probabilidad de que su media aritmética sea como máximo 83? d) ¿Qué valor debería tomar la media aritmética para que la probabilidad de obtenerlo en esa muestra sea como máximo 0,85?

5

Probabilidad y Estadística (I.I.)

Tema 6

4.2.- Distribución en el muestreo de proporciones: Supongamos que una población es infinita y que la probabilidad de ocurrencia de un suceso (su éxito) es p, mientras que la probabilidad de que no ocurra es q=1-p. (Por ejemplo todas las posibles tiradas de una moneda, en la que la probabilidad de cara es p=1/2). Esta población sigue una distribución de Bernoulli. Queremos estimar la proporción de éxitos poblacional (proporción de caras que han salido en todas las tiradas posibles). Para ello consideramos todas las posibles muestras de tamaño n de tal población, y para cada una de ellas determinamos la proporción muestral de éxitos p, que viene dada por: n

X + X 2 + ... + X n X p= 1 = = n n

∑X

i

i=1

n

donde cada Xi se distribuye como una Bernoulli(p). X = nº de éxitos en n intentos, por lo que X ≈ B(n,p), cuya media sería n.p, y desviación típica sería

npq La media (esperanza) de la distribución de esta proporción muestral, así como su varianza y su desviación típica (error típico) vienen dadas por las siguientes expresiones:

E ( pˆ ) = p



σ p2ˆ =

p⋅q n



σ pˆ =

p⋅q n

La distribución en el muestreo del estadístico proporción muestral de éxitos seguiría una Binomial, cuya media y varianzas son los indicados arriba, que no es más que el resultado de dividir por n los correspondientes a la distribución Binomial de la variable original X (de hecho las probabilidades ˆ se obtienen de la tabla de la binomial de X. asociadas al estadístico p Cuando n es suficientemente grande (≥ 30), se hace válida la aproximación de la Binomial a la

Normal, por lo que podemos considerar que el estadístico proporción muestral sigue una distribución normal con los parámetros siguientes:

µ pˆ = p



σ p2ˆ =

p*q n

⇒ 6

σ pˆ =

p* q = n

p(1 - p) n

Probabilidad y Estadística (I.I.)

Tema 6

Ejemplo Distribución del número de aciertos en un test de 5 ítems con p = 0,50

Aproximación a la Normal:

4.3.- Distribución de muestreo de la cuasivarianza s2 Otra estadística importante empleada para formular inferencias con respecto a las varianzas de la población es la varianza muestral denotada por σˆ . Recuérdese que σˆ es una medida de la variabilidad e indica la dispersión o extensión entre las observaciones. Dado que la dispersión es una 2

2

consideración tan importante como la tendencia central, el significado de 2

inferencias de σ es comparable con el que tiene

σˆ 2

para formular

X para formular inferencias con respecto a µ.

7

Probabilidad y Estadística (I.I.)

Tema 6

σˆ 2 cuando este se lleva a cabo sobre una población

Vamos a estudiar la distribución de muestreo de que tiene una distribución normal.

( -µ) σˆ 2 = ∑ X i

2

n

n

i=1

en donde X1, X2, ..., Xn constituyen una muestra aleatoria de una distribución normal con media µ y varianza σ2 desconocida y lo que queremos es determinar una distribución de muestreo que permita hacer inferencias sobre σ2 con base a

σˆ 2

como la hemos definido.

Desde un punto de vista práctico, la varianza muestral tal y como la hemos definido tiene poco uso, ya que es muy raro que se conozca el valor de la media poblacional µ. De acuerdo con lo anterior, si se muestrea una distribución normal con media µ y varianza σ2, la varianza muestral (cuasivarianza) se tendría que definir como: 2

n

( -X) V (X ) = ∑ X i n i=1

donde se ha reemplazado la media desconocida µ por la muestral otra estadística en la definición de V(X).

X , dando origen a la presencia de

La media o esperanza de la distribución en el muestreo de este estadístico sería:

E [V ( X )] = σ 2 −

σ2

 n −1 = σ 2 ⋅  n  n 

como podemos comprobar numéricamente en el ejemplo inicial. El problema que tenemos con este estadístico es que no conocemos qué distribución muestral sigue, (aunque sepamos que la distribución de partida es Normal). Debemos buscar por tanto otro estadístico del que si conozcamos su distribución en el muestreo, al menos, cuando la población de partida es Normal. Este estadístico es la cuasivarianza muestral que se define como: 2

n

( Xi - X ) S =∑ n-1 i=1 2

(1)

donde también se ha reemplazado la media desconocida µ por la muestral X , y se divide por (n - 1) para que sea un estimador insesgado de σ2. Si la distribución de partida es normal, entonces: 2 S (n - 1)

σ2 que es la estadística cuya distribución en el muestreo nos permite hacer inferencias sobre σ2 con base en S2, es una χ2 con (n - 1) grados de libertad. La media (esperanza) de este estadístico, su varianza y desviación típica vienen dados por:

E (S 2 ) = σ 2



σ S2 = 2

2σ 4 n



σS = 2

2σ 4 n

Veamos por que esta estadística sigue la distribución indicada. Partiendo de (1) obtenemos: n

2 s (n - 1) = ∑( X i - X )

2

i=1

Sumando y restando la media desconocida µ, se observa que:

8

Probabilidad y Estadística (I.I.)

n

∑( X

2

i

i=1

-X)

Tema 6

n

= ∑ [( X

i

- µ ) - ( X - µ )]

i=1

n

n

= ∑( X

∑( X - µ ) = n ( X - µ ) 2

2

- µ ) + ∑( X - µ ) -2( X - µ ) ∑( X i - µ )=

i

∑( X

n

∑( X

y

i

- µ )= n( X - µ )

i=1

2

- µ ) - n( X - µ ) 2

i

i=1

i=1

i=1

n

n

2

2

i=1

n

como

2

(2)

i=1

n

∑( X

2

Dividiendo cada término de la igualdad entre σ y sustituyendo

2

i

- X ) por el nuevo valor

i=1

calculado en (2), obtenemos: n

(n - 1) S

σ2

∑( X

2

=

i

- µ )2

(X − µ ) −

2

i=1

σ2

σ2

n que sigue siendo la misma fórmula de partida, pero puesta de otra forma. Lo que nos interesa es conocer la distribución en el muestreo de este estadístico, que lo podemos deducir de la expresión anterior, sabiendo que: n

∑( X

i

- µ )2

i=1

σ2 es una variable aleatoria χ2 con n grados de libertad. Dado que, si la distribución de la que se parte es N (µ, σ), cada Xi de la muestra sigue la misma distribución: Xi ∈ N (µ, σ) i=1, 2, ..., n; Z i = (Xi -µ)/σ define n variables aleatorias normales estándar independientes, se tiene: n

Y = ∑ Z i 2 es una variable χ2con n grados de libertad i=1

( X - µ )2 es el cuadrado de una v. a. normal estándar y por lo tanto puede considerarse una v. a. χ2 con 1 grado de libertad. Si partimos de una distribución normal, entonces X es una 2

σ

n

normal de media µ y desviación típica

X -µ

σ

σ n

: 2

es una N(0,1)y por tanto

( X -µ )

σ

2

es una N(0,1 ) o una χ 12 2

n

n

Utilizando técnicas avanzadas por encima del nivel que se pretende en este curso, se puede demostrar que las v. a. χ2 anteriores son independientes, y por el siguiente teorema, podemos concluir que la distribución de muestreo de (n - 1) S2 / σ2 es una distribución χ2 con (n -1) grados de libertad, cuando se muestrea una población cuya distribución es normal con media y varianza desconocidas. Teorema: Si X1, X2 son dos variables aleatorias independientes y cada una tiene una distribución χ2 con n1 y n2 grados de libertad respectivamente, entonces las variables: Y1 = X1 + X2 e Y2 = X1 - X2 siguen distribuciones χ2 con ( n1 + n2 ) y ( n1 - n2 ) grados de libertad respectivamente.

9

Probabilidad y Estadística (I.I.)

Tema 6

4.4.- Distribuciones en el muestreo de diferencias y sumas: Supongamos que estamos interesados en estudiar dos poblaciones. Para cada muestra de tamaño n1 de la primera, calculamos un estadístico T1; eso da una distribución de muestreo para T1, cuya media y desviación típica denotaremos por E[T1] y σT1. Del mismo modo, para una muestra de tamaño n2 de la segunda, calculamos un estadístico T2; Eso da una distribución de muestreo para T2 cuya media y desviación típica denotaremos por E[T2] y σT2. De todas las posibles combinaciones de estas muestras de las dos poblaciones podemos obtener una distribución de las diferencias T1 - T2, que se llama DISTRIBUCION DE MUESTREO DE DIFERENCIAS DE LOS ESTADISTICOS. La media y la desviación típica de esta distribución de muestreo, denotadas respectivamente por E[T1-T2] y σ(T1 T2), vienen dadas por:

E [T1 − T2 ]= E[T1 ] − E[T2 ]

σ ( T -T ) = σ T2 + σ T2 1

2

1

2

supuesto que las muestras escogidas no dependen en absoluto una de otra (sean independientes). Si T1 y T2 son las medias muestrales de ambas poblaciones, que denotaremos por X 1 y X 2 respectivamente, entonces la distribución de muestreo de las diferencias de medias viene dada para poblaciones infinitas con medias y desviaciones típicas (µ1, σ1) (µ2, σ2), respectivamente por:

E [X 1 − X 2 ] = E [X 1 ] − E [X 2 ]= µ 1 - µ 2

σ(X

= σ 2X + σ 2X = 1- X 2 ) 1 2

σ 12 + σ 22 n1

n2

A veces es útil hablar de DISTRIBUCION DE MUESTREO DE LA SUMA DE ESTADISTICOS. La media y la desviación típica de tal distribución son:

E [T1 + T2 ] = E [T1 ] + E [T2 ]

σ ( T +T ) = σ T2 + σ T2 1

1

2

2

supuesto que las muestras sean independientes.

5.-Teorema central del límite: Si X es la media de una muestra aleatoria de tamaño n que se toma de una población con cualquier distribución (oblicua a la derecha, oblicua a la izquierda, con forma de tina, etc...), cuya media es µ y varianza finita σ2, entonces la forma límite de la distribución de:

Z=

X -µ

σ n

conforme n → ∞, es la distribución normal estándar N (0,1). ¿Qué tan grande debemos hacer el tamaño de la muestra para facilitar la obtención de una buena aproximación, empleando este procedimiento? Esta aproximación normal para X generalmente será buena si n ≥ 30 sin importar la forma de la población. Si la población es simétrica, es posible obtener una buena aproximación con una n ≥ 10. Si se sabe que la población es normal, la distribución muestral de X seguirá exactamente una distribución normal, sin importar qué tan pequeño sea el tamaño de la muestra. Ejemplo:

10

Probabilidad y Estadística (I.I.)

Tema 6

Considere la población formada por 6 bolas, en cada una de las cuales hay pintado uno de los números 1, 1, 1, 2, 2, 3. El histograma de esta población es oblicuo hacia la derecha alrededor de una media igual a 5/3. La población tiene una varianza de 5/9. Valores posibles de la variable original (xi) Prob. de aparición de cada valor xi (pi)

n

µ = ∑ xi ⋅ p i = i =1

σ = 2

1

2

3

3 =1 6 2

2 = 1 6 3

1 6

1 ⋅ 3 + 2 ⋅ 2 + 3 ⋅ 1 10 5 = = 6 6 3

1 n 1 ( xi - µ )2 * pi= [0.4356 * 3 + 0.1156 * 2 + 1.7956] = 0.5556 = 5/9 ∑ n i=1 6 población original 3/5 1/2 2/5 1/3 1/5 0 0 1

Supongamos ahora que seleccionamos, con reemplazamiento, una muestra de tamaño 2 (n=2) de esta población. La distribución de la media muestral tiene la media y varianza siguientes: Casos totales : Valores posibles de 1  (11)

1.5  (12,21)

2

 (13,31,22)

2.5  (32,23) 3

 (33)

X

2

C6 = 6 2 = 36 Probabilidad de aparición de los valores 2

9

36

= Pr(11) =

C3 32 = 2 62 C6 1

12

36

= Pr(12) + Pr( 21) =

1

1

1

10

36

= Pr( 32) + Pr( 23) = 1

1

1

1

1

1

1

C .C C .C C .C 3 3 4 = Pr(13) + Pr(31) + Pr( 22) = 3 2 1 + 1 2 3 + 2 2 2 = + + 36 36 36 36 C6 C6 C6 1

4

1

C3 .C 2 C .C 6 6 + 2 23 = + 2 36 36 C6 C6

36

= Pr(33) =

1

1

1

1

C1 .C2 C2 .C1 2 2 + = + 2 2 36 36 C6 C6

C1 .C1 12 = 2 62 C6 11

Probabilidad y Estadística (I.I.)

µX = µ =

Tema 6

10 5 = 6 3

σ 2X =

σ 2 = 5/9 = 5 n

2

18

Podemos apreciar por su histograma que esta distribución de X sigue siendo aún oblicua hacia la derecha. Pero aunque la población X no tiene tendencia para suponer una forma de campana, la distribución para

X comienza a mostrar algo de una forma de campana. 1/3 2/7 1/4 1/5 1/7 0 0 0 1

Si tomamos todas las posibles muestras de tamaño 3 (n=3), la distribución de siguientes media y varianza:

µX = µ =

10 2 = 1+ 6 3

σ X= 2

X tendría las

σ 2 = 5/9 = 5 n

3

27

1/3 2/7 1/4 1/5 1/7 0 0 0 1

La forma de campana de este histograma es más pronunciada que el de la figura anterior. Si tomamos n cada vez mayor, veríamos los resultados del Teorema del Límite Central demostrados visiblemente. El histograma llegaría a tomar la suave forma de campana de la distribución normal. Podemos demostrar el mismo fenómeno si muestreamos una población en la cual la proporción p tenga una característica dada. En este caso la distribución tiene una media µp = p y una varianza σ2p = p (1 - p)/n.

12