03 Variables aleatorias y distribuciones de probabilidad

03 – Variables aleatorias y distribuciones de probabilidad Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Maniza...
5 downloads 4 Views 3MB Size
03 – Variables aleatorias y distribuciones de probabilidad

Diego Andrés Alvarez Marín Profesor Asistente Universidad Nacional de Colombia Sede Manizales

1

Contenido ●







Variables aleatorias discretas: función de probabilidad y de distribución Variables aleatorias continuas: función de densidad y de distribución Características de las variables aleatorias: valor esperado, varianza Aplicación práctica, representaciones

2

Variable aleatoria Sea Ω un espacio muestral. Una función

se conoce como variable aleatoria

Nota: la definición real es en verdad algo más complicada. Ver: http://en.wikipedia.org/wiki/Random_variable#Formal_definition







La variable aleatoria transforma los resultados del espacio muestral en cantidades numéricas. La letra mayúscula X denota la función (la variable aleatoria). La letra minúscula x denota el valor que toma la variable aleatoria, es decir, x=X(ω)

Lanzamientos de dos dados X denota la suma de los resultados de las dos caras Valor de la variable aleatoria

Resultado (ω) (1,1) (1,2), (1,3), (1,4), (1,5), (1,6), (2,6), (3,6), (4,6), (5,6), (6,6)

(2,1) (2,2), (2,3), (2,4), (2,5), (3,5), (4,5), (5,5), (6,5)

(3,1) (3,2), (3,3), (3,4), (4,4), (5,4), (6,4)

(4,1) (4,2), (5,1) (4,3), (5,2), (6,1) (5,3), (6,2) (6,3)

x := X(ω) 2 3 4 5 6 7 8 9 10 11 12

Número de Probabilidad ocurrencias 1 1/36 2 2/36 3 3/36 4 4/36 5 5/36 6 6/36 5 5/36 4 4/36 3 3/36 2 2/36 1 1/36

∑=1





Una variable aleatoria X es discreta si D tiene una cardinalidad finita o infinita contable (es decir si los elementos de D se pueden poner en una correspondencia uno a uno con los números naturales) Una variable aleatoria X es continua si D tiene una cardinalidad infinita no contable, es decir si D está formado por intervalos de la recta real

Descripción probabilista de las variables aleatorias ●



Las variables aleatorias discretas se describen mediante: –

Función de Masa de Probabilidades (FMP)



Función de Distribución de Acumulada (FDA)

Las variables aleatorias continuas se describen mediante: –

Función de Densidad de Probabilidades (FDP)



Función de Distribución de Acumulada (FDA)

Función de Masa de Probabilidades Definición matemática

Función de Masa de Probabilidades Una función de masa de probabilidades (FMP) es una funcion que dice la probabilidad que una variable aleatoria discreta tome exactamente un valor.

Una FMP. Observe que todos los valores de esta función son nonegativos y suman 1.

Una FMP de un dado equilibrado. Todos los números en el dado tienen igual probabilidad de aparecer.

Graficando FMPs en MATLAB

Propiedades de la FMP Las FMP deben satisfacer las siguientes propiedades:

La función Delta de Dirac

Representación de una FMP utilizando Deltas de Dirac

Ejemplo Para verificar la calidad de un lote de cilindros de concreto, un ingeniero extrae al azar 3 muestras. Suponiendo que la probabilidad que el cilindro no cumpla las especificaciones es del 10%, cual es la probabilidad que: ●

a) los tres cilindros cumplan con las especificaciones



b) sólo dos cilindros cumplan con las espeficicaciones



c) sólo un cilindro cumpla con las espeficicaciones



d) ninguno de los cilindros cumpla con las especificaciones

s – cilindro que cumple con las especificaciones n – cilindro que NO las cumple P(s) = p

P(n) = 1-p

P[0 OK] = (n,n,n) = (1-p)(1-p)(1-p) = (1-p)3 P[1 OK] = (n,n,s)+(n,s,n)+(s,n,n) = 3(1-p)2p P[2 OK] = (n,s,s)+(s,s,n)+(s,n,s) = 3p2(1-p) P[3 OK] = (s,s,s) = p3

En el caso del ejemplo p = 0.90, siendo la FMP:

P[0 OK] = (1-p)3 = (0.1)3 = 0.001 P[1 OK] = 3(1-p)2p = 3 (0.1)2 x 0.9 = 0.027 2 2 P[2 OK] = 3p (1-p) = 3 (0.9) x 0.1 = 0.243 3 3 P[3 OK] = p = (0.9) = 0.729

En la práctica de control de calidad, el ingeniero debe tomar la decisión acerca de si el material se encuentra dentro de las especificaciones o no basado en una observación de dos muestras malas en una muestra de tamaño tres. Suponiendo que el material es satisfactorio, la probabilidad de tal suceso es muy pequeña (2,7%), y por lo tanto, el ingeniero decidirá usualmente que el material no cumple con las especificaciones.

Ejemplo lanzamiento de una moneda

Función de Densidad de Probabilidades (FDP)

Motivación ●



Las FDPs se pueden entender como el límite de un histograma cuando el ancho de cada subintervalo tiende a cero. Cuando la altura de una persona es 172 cm, es lógico entender como [171.5 cm, 172.5 cm]; por lo tanto, en el caso continuo es más lógico visualizar las probabilidades de intervalos que de un punto en particular.

Interpretación de la FDP ●





La FDP fX del caso continuo se debe entender de forma diferente a la FMP pX del caso discreto. Con las FMPs, la probabilidad que x tome un valor específico puede ser diferente de cero. Con las FDPs, la probabilidad que x tome un valor específico x es cero.

Interpretación de la FDP ●



Por lo tanto, la FDP no representa la probabilidad que X=x. Mas bien proporciona un medio para determinar la probabilidad de un intervalo a≤X≤b. El valor de fX(x) solo es una medida de la densidad o intensidad de la probabilidad en el punto.

Ejemplo 1 de FDPs

Ejemplo 2 de FDPs

Variables aleatorias mixtas ●

http://www.virtual.unal.edu.co/cursos/sedes/maniza



http://caminos.udc.es/info/asignaturas/obras_public

Función de Distribución de Acumulada (FDA)

FDA de una función de masa de probabilidades (FMP)

FDA de una función de densidad de probabilidades continua

FDA de una función de densidad de probabilidades que tiene un componente continuo y una parte discreta.

Función de Distribución de Acumulada (FDA)

Continuidad por la derecha y por la izquierda

Función continua por la derecha

Función continua por la izquierda

Función de Distribución de Acumulada (FDA)

FMP vs FDA

Gráfico 1 de la FDA discreta

Gráfico 2 de la FDA discreta

Propiedades de la FDA discreta

Ejemplo 1 FDA discreta

Ejemplo 2 FDA discreta

FDP vs FDA

Gráfico 2 de la FDA continua

Propiedades de la FDA continua

Ejemplo 1 FDA continua

Ejemplo 2 FDA continua

FDP de una función g(X)

Valor esperado de una variable aleatoria El valor promedio de una variable aleatoria después de un número grande de experimentos es su valor esperado.

Valor esperado de una variable aleatoria

Valor esperado de una variable aleatoria

Ver: –

http://en.wikipedia.org/wiki/Riemann-Stieltjes_Integration



http://en.wikipedia.org/wiki/Cauchy_distribution

Propiedades del valor esperado



http://en.wikipedia.org/wiki/Expected_value

● ●

El valor esperado se puede asociar al centro de gravedad de la FDP.

● ● ●

Otra propiedad del valor esperado es:

Valor esperado de una función g(X)

Valor esperado de una función g(X) ●

Tenga en cuenta que



Otra propiedad del valor esperado es:

Importancia práctica del valor esperado En un problema físico, en que un fenómeno tiene como modelo una variable aleatoria, generalmente el número más significativo que el ingeniero puede obtener es el valor medio de esa variable; es una medida de la tendencia central de la variable y muchas veces, si se van a hacer observaciones repetidas del fenómeno, del valor alrededor del cual se pude esperar la dispersión. La media muestral de muchas de tales observaciones estará con alta probabilidad muy cerca a la media de la variables aleatoria fundamental.

Ejemplo 1 valor esperado

Ejemplo 2 valor esperado

FDP condicional ●



Suponga que estamos interesados en la distribución de la demanda o carga X dado que sea mayor que algún valor de umbral x0. HACER GRAFICO FDP truncada

Esperanza condicional

Ejemplo 1 esperanza condicional

Ejemplo 2 esperanza condicional

Momentos de una variable aleatoria Los momentos de una variable aleatoria X son los valores esperados de ciertas funciones de X. Estas forman una colección de medidas descriptivas que pueden emplearse para caracterizar la distribución de probabilidad de X y especificarla si todos los momentos de X son conocidos. A pesar de que los momentos de X pueden definirse alrededor de cualquier punto de referencia, generalmente se definen alrededor del cero (momentos no centrales) o del valor esperado de X (momentos centrales).

Momentos no centrales

Momentos centrales

Algunos momentos centrales





Tenga en cuenta que todas las proposiciones anteriores con respecto a los momentos se encuentra sujetas a la existencia de las sumas o integrales que las definan. El uso de los momentos de una variable aleatoria para caracterizar a la FDA es útil especialmente en un medio en el que el experimentador conozca la FDA.

Media en MATLAB y MS EXCEL

Varianza ●

La varianza es una medida de la dispersión de una variable aleatoria.

Propiedades de la varianza

Varianza en MATLAB y MS EXCEL

Coeficiente de variación (C.O.V.) ●

Se utiliza en control de calidad



No confundir con la covarianza

Coeficiente de asimetría (skewness)

G1 < 0 distribución asimétrica negativamente

G1 > 0 distribución asimétrica positivamente

Tercer coeficiente de asimetría en MATLAB y MS EXCEL

Coeficiente de apuntalamiento (curtosis)

Coeficiente de apuntalamiento en MATLAB y MS EXCEL

Otras medidas de tendencia central y dispersión ●

La media de una variable aleatoria es generalmente la medida preferida de tendencia central. Sin embargo, en algunas situaciones la mediana y en menor grado la moda, pueden ser mediadas de tendencia central mucho más apropiadas. Por ejemplo, en distribuciones unimodales cuya asimetría es grande, el valor esperado de la variable aleatoria puede verse afectado por los valores extremos de la distribución, mientras que la mediana no lo estará.



Para distribuciones unimodales se tiene que:

Desigualdad de Chebyshev

Mediana de una CDF... ver notas

http://en.wikipedia.org/wiki/Median

mode won't. # ExceptModa for extremely small samples, the mode de una FMP/FDP is insensitive to "outliers" (such as occasional, rare, false experimental readings). The median is also very robust in the presence of outliers, while the mean is rather sensitive. ●

# In continuous unimodal distributions the median lies, as a rule of thumb, between the mean and the mode, about one third of the way going from mean to mode. In a formula, median ≈ (2 × mean + mode)/3. This rule, due to Karl Pearson, is however not always true and the three statistics can appear in any order.[ ●

● 76



77

FDA empírica ●

Hay una función en MATLAB...

78

Quantiles ●

http://en.wikipedia.org/wiki/Quantile



En MATLAB quantile



79



http://en.wikipedia.org/wiki/Law_of_total_varian ce

80