DISTRIBUCIONES DE PROBABILIDAD (RESUMEN)

DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) VARIABLE ALEATORIA: un experimento produce observaciones numéricas que varían de muestra a muestra. Una VARIA...
6 downloads 0 Views 658KB Size
DISTRIBUCIONES DE PROBABILIDAD (RESUMEN) VARIABLE ALEATORIA: un experimento produce observaciones numéricas que varían de muestra a muestra. Una VARIABLE ALEATORIA se define como una función con valores numéricos definida sobre un espacio muestral. Y es aleatoria porque los valores implican un suceso numérico aleatorio. CLASIFICACIÓN. VAR. ALEA. DISCRETA.-es una variable que solo puede asumir un conjunto numerable de valores. Ejemplos: el número de tornillos en un lote de una producción industrial, el número de hogares que tienen luz eléctrica en cierta zona, el número de personas en una fila que compraran su boleto para una función de cine, etc. VAR. ALEA. CONTINUA.- es una variable que puede asumir el número infinitamente grande de valores correspondientes a los puntos sobre un intervalo de línea recta. Ejemplos: La estatura de una persona, la presión arterial, tiempo de vida de una célula, volumen de lluvia que cae en un día en una selva, la resistencia a la tensión, en kilos por centímetro cuadrado, de un cable de acero de 1 cm de diámetro. Distribuciones de probabilidad para var. alea. discretas; binomial, hipergeométrica, geométrica, poisson. Distribuciones de probabilidad para var. alea. continuas; normal, gamma, exponencial, t-student, chi-cuadrada y F- snedecor. Para cada distribución se deben conocer sus propiedades y aprender a utilizar las tablas de distribución que faciliten el cálculo de las probabilidades. DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS DISCRETAS

Binomial 

El experimento consiste en n intentos repetidos



Los resultados de cada uno de los intentos puede ser éxito o fracaso



La probabilidad de éxito “p”, permanece constante para todos los intentos.



Los intentos repetidos son independientes.



Formula b(x, n, p) = xCn px qn-x donde x: 0, 1, 2, …n

1

Ma. Guadalupe Medina Torres, E A 2010

µ = np σ2 = npq

Hipergeométrica 

Una muestra aleatoria de tamaño n se selecciona sin reemplazo de un total de N resultados o artículos totales.



K resultados o artículos del total de N pueden clasificarse como éxitos y N – K como fracasos



Fórmula h(x, N, N, k) = KCX k/N)

(N – K) C (n – x)

/ Nc n

µ = nk/N

σ2 = (N-n) / (N-1) . n . k/N (1-

Geométrica 

Si repetidos intentos independientes pueden resultar en un éxito con una probabilidad p y en un fracaso con una probabilidad de q = 1-p, entonces la distribución de probabilidad de la variable aleatoria X, el número del intento en el cual ocurre el primer éxito es:



g(x, p) = p qx-1 donde x= 1, 2, 3,… µ = 1 / p σ2 = (1-p) / p2

Poisson 

La distribución de probabilidad de la variable aleatoria de Poisson X, que representa el número de resultados que ocurren en un intervalo de tiempo dado o región específica indicado por t, es:



p(x, µ) = p(x, t) = e-t (t) x / x! x: 0, 1, 2, …. Donde t es la tasa promedio de resultados por unidad de tiempo o región y e = 2.71828…



µ = σ2 = t



Cuando n tiende a ∞ y p tiende a 0 y µ = np permanece constante: se aproxima binomial a la poisson, esto es b(x, n, p) →p(x, µ)

DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS

Distribución normal o gaussiana  La función de densidad de la curva normal está definida por la siguiente ecuación:

1 F(x) =

2

2

(-1/2)[(x- )/]

e

Ma. Guadalupe Medina Torres, E A 2010

2



 

La curva normal tiene forma de campana. La media, la moda y la mediana de la distribución son iguales y se localizan en el centro de la distribución. La distribución de probabilidad normal es simétrica alrededor de su media. Por lo tanto, la mitad del área bajo la curva está antes del punto central y la otra mitad después. El área total bajo la curva es igual a 1. La curva normal se aproxima de manera asintótica al eje horizontal conforme se aleja de la media en cualquier dirección. Esto significa que la curva se acerca al eje horizontal conforme se aleja de la media, pero nunca lo llega a tocar. La distribución normal estándar.

z=

x–



TIPIFICACIÓN

3

Ma. Guadalupe Medina Torres, E A 2010

Por tanto su función de densidad es

y su función de distribución es

siendo la representación gráfica de esta función

a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada.

Característica de la distribución normal tipificada (reducida, estándar)

4

Ma. Guadalupe Medina Torres, E A 2010

    

No depende de ningún parámetro Su media es 0, su varianza es 1 y su desviación típica es 1. La curva f(x) es simétrica respecto del eje OY Tiene un máximo en este eje Tiene dos puntos de inflexión en z =1 y z = -1



Si x es una variable aleatoria binomial con µ = np σ2 = npq, entonces la forma de límite de la distribución de :

z=

x–



Cuando n →∞, es la distribución normal estándar n(z, 0, 1)

Distribución t-student       

Es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño n≤ 30 y la desviación estándar poblacional no se conoce. Es una distribución continua. Tiene forma de campana. La distribución t tiene una media de cero, es simétrica respecto de la media. y se extiende hasta el infinito en ambas direcciones. No hay una distribución t, sino una "familia" de distribuciones t. todas con la misma media cero, pero con su respectiva desviación estándar diferente de acuerdo con el tamaño de la muestra n. La distribución t es más baja y dispersa que la distribución normal. Cuando el tamaño de la muestra se incrementa, la distribución t se aproxima a la normal. Su función de densidad es:

f(t)=

5

  

(1+

t² 



)

Ma. Guadalupe Medina Torres, E A 2010



-µ T= s n



Con grados de libertad ν = n - 1 Grados de Libertad Los grados de libertad son el número de valores que se pueden elegir libremente para llegar a un resultado, por ejemplo, supongamos que tenemos una muestra de tres elementos, la cual tiene una media de 8. a+b+c =8 3

Para asignar valores a los elementos que forman la muestra, podemos hacerlo libremente en dos de ellos pero al asignar el valor al tercero debemos hacer un cálculo para que el resultado sea correcto. Entonces se dice que hay 2 grados de libertad, porque dos valores (n - 1) se asignaron libremente y uno en función de los otros valores y el resultado.

6

Ma. Guadalupe Medina Torres, E A 2010

Distribución chi cuadrada



La distribución chi cuadrada es una curva asimétrica a la derecha, se dice que tiene sesgo positivo.



Se utiliza en estadística inferencial para pruebas de hipótesis.

 Teorema. Si

y S2 son la media y la varianza de una muestra (n) tomada de una población normal con media  y varianza 2, entonces

 a)

y S2 son independientes.

 b) La variable aleatoria

tiene una distribución Chi Cuadrado con n-1

grados de libertad.

 Tabulación. La función de distribución no puede calcularse en forma analítica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad. En algunas tablas se presenta la cola hacia la izquierda (probabilidad acumulada), y en otras la cola hacia la derecha.

 Notación. Usaremos la notación

para denotar el valor de la distribución Chi cuadrado con  grados de libertad y una cola de P o α hacia la derecha (o una probabilidad acumulada de 1- α hacia la izquierda).

 Problema: Haciendo uso de la relación existente entre las distribuciones gama

y chi cuadrado, demuestre que la varianza de la varianza poblacional está dada por

 Ejemplo. Suponga que el espesor de un componente de un semiconductor es una dimensión crítica. El proceso de producción de tal característica se distribuye normalmente con una desviación estándar de 0.6 milésimas de pulgada. Para controlar el proceso se toman muestras periódicas de veinte

7

Ma. Guadalupe Medina Torres, E A 2010



piezas, y se define un límite de control con base en una probabilidad de 0.01 de que la varianza muestral exceda dicho límite, si el proceso está bajo control. Qué se puede concluir si para una muestra dada la desviación estándar es 0.84 milésimas de pulgada?

 Solución. La variable aleatoria de interés para nuestro caso es

. Si denotamos por LSC el límite superior de control, entonces tenemos que se debe cumplir que:

  Por lo tanto, debemos buscar en la tabla de la distribución Chi Cuadrado, con 19 grados de libertad, el valor que tenga una probabilidad hacia la derecha de 0.01 (ó hacia la izquierda de 0.99), denotado por el cual debe satisfacer la siguiente desigualdad:

 Se

O

acepta

también

, correspondiente a 36.19,

si

se

acepta

si

Por lo tanto el criterio de decisión se puede expresar en una de las dos formas siguientes:

 a) 

Se calcula = Como X2 = 37.24 > 36.19  la muestra no proviene de un proceso con una desviación estándar de 0.60. b) Se calcula S2 = .842 = 0.7056. Como 0.7056 > 0.6857 se llega a la misma conclusión de que no es probable que la muestra tomada provenga de una población con una desviación estándar de 0.60 milésimas de pulgada.

Distribucion F- Snedecor o Fisher-Snedecor DISTRIBUCIÓN F Es la distribución muestral aplicable para la relación de dos varianzas. Teorema. Si U y W son dos variables aleatorias independientes, cada una con distribución Chi Cuadrado con1 y 2 grados de libertad, respectivamente, entonces la distribución de la siguiente variable aleatoria

8

Ma. Guadalupe Medina Torres, E A 2010

está

dada

por:

y se denomina "distribución F con 1 y 2 grados de libertad" (1 grados de libertad en el numerador y 2 grados de libertad en el denominador). Notación. Usaremos la notación para denotar el valor de la distribución F con 1 grados de libertad en el numerador, 2 grados de libertad en el denominador y una probabilidad acumulada de P o α hacia la derecha (o una probabilidad de 1-P(1- α) hacia la izquierda). Puede demostrarse que de la distribución F.

, si se invierte la definición

La aplicación principal para la cual se desarrolló la distribución F es la comparación de dos varianzas (de poblaciones normales). Sea

una muestra aleatoria (n1) tomada de una población normal con

varianza

, y sea

otra muestra aleatoria (n2) tomada de una

población normal con varianza . Si queremos realizar alguna inferencia sobre la igualdad o no de las varianzas, nos podemos basar en el hecho que las siguientes relaciones

son variables aleatorias con distribuciones Chi cuadrada con1 y 2 grados de libertad, respectivamente, y con las cuales podemos construir la distribución F. El siguiente teorema clarifica este aspecto. Teorema. Si y son las varianzas muestrales de dos variables aleatorias independientes de tamaños n1 y n2 tomadas de poblaciones normales con varianzas y

, entonces, la relación

tiene una distribución F con n1 -1 y n2 -1 grados de libertad.

9

Ma. Guadalupe Medina Torres, E A 2010

Tabulación. De nuevo, la función de distribución no puede calcularse en forma analítica; sin embargo, ha sido tabulada para diferentes valores de la probabilidad acumulada, y para varios grados de libertad en el numerador y en el denominador. Para cada valor de la probabilidad debe calcularse una tabla diferente. Los valores de las probabilidades dados en las tablas corresponden a las probabilidades de exceder los respectivos valores de F, es decir, presentan las colas a la derecha del valor respectivo de F. Las tablas están construidas bajo la suposición de que la distribución original de las variables aleatorias es normal.

10

Ma. Guadalupe Medina Torres, E A 2010