Distribuciones de probabilidad

Estadística Distribuciones de probabilidad Prof, Dr. Jose Jacobo Zubcoff Departamento de Ciencias del Mar y Biología Aplicada Estadística Intro...
23 downloads 0 Views 970KB Size
Estadística

Distribuciones de probabilidad

Prof, Dr. Jose Jacobo Zubcoff

Departamento de Ciencias del Mar y Biología Aplicada

Estadística Introducción

Inferencia estadística: Parte de la estadística que estudia grandes colectivos a partir de una pequeña parte de éstos (Población - Muestra) Características de la muestra

• Representativa de la población • Alcanzar objetivos precisión fijados

Tipos de procedimientos: • Inferencia paramétrica: Se admite que la distribución de la pob. pertenece a una familia paramétrica de distribuciones • Inferencia no paramétrica: No supone una distribución de prob. y las hipótesis son más generales (como simetría)

Estadística Introducción Inferencia Estadística

Muestra

Población

x

µ

s

σ

Estadística Introducción

Tipos de variables • Variables cualitativas, categóricas o atributos: No toman valores numéricos y describen cualidades. Ej. Clasificación en base a una cualidad. • Variables cuantitativas discretas: Toman valores enteros, por lo generar contar el nº de veces que ocurre un suceso. • Variables cuantitativas continuas: Toman valores en un intervalo, por lo general medir magnitudes continuas. Variables aleatorias

Estadística Introducción

Variables aleatorias Variable aleatoria: Cualquier función medible que asocia a cada suceso en un experimento aleatorio un número real Variable aleatoria discretas: Una variable aleatoria es discreta si toma valores aislados o puntuales Variable aleatoria continua: Una variable aleatoria es continua si puede tomar cualquier valor dentro de uno o varios intervalos determinados

Estadística Introducción Ejemplo: Estudio de dejar de fumar con parches de nicotina respecto a la edad de dichos pacientes sobre 189 pacientes. 1.00

0.40

0.90

0.35

0.80

0.30 0.70 0.60

fr acum.

fr

0.25

0.20

0.50 0.40

0.15 0.30

0.10 0.20

0.05

0.10 0.00

0.00 30-39 40-49

50-59 60-69

70-79 80-89

Edad

Nº de intervalos entre 4 y 10

0

1

2

3

4

5

Intervalo

r = 1 + 1.33 ln(n) r = 1 + 3.33(log 189) = 8.558 ≈ 9

6

Estadística Introducción

Caracterización: Variables aleatorias discretas (v.a.d.): Función de probabilidad: Asigna a cada posible valor de una variable discreta su probabilidad. Para valores x1, x2, …, xn,… se asocia una p1, p2, …, pn,… donde (n / ∞)

P( X = xi )

y

∑p

i

i =1

=1

Función de distribución: F(x) en un valor x es la probabilidad de que X tome valores menores o iguales a x. Acumula toda la probabilidad entre menos infinito y el punto considerado

F ( x) = P( X ≤ x)

Estadística Introducción

Caracterización: Variables aleatorias continuas (v.a.c.): Función de densidad: Es una función no negativa de integral 1 Función de distribución: Para las v.a.c. queda definida por: x

F ( x) = P( X ≤ x) = ∫ f (u )du −∞

b

P(a < X < b) = P(a ≤ X ≤ b) = ∫ f ( x)dx = F (b) − F (a) a

Estadística Introducción Función de Probabilidad frente a Función de densidad

Función de Distribución

Estadística Introducción

Función esperanza matemática: Variables aleatorias discretas:

E[ X ] = ∑ xi pi i ≥1

Variables aleatorias continuas con función de densidad f: +∞

E[ X ] = ∫ xf ( x)dx −∞

E[X] es el primer momento respecto al origen y por tanto representa la media, esperanza o valor de X

Estadística Introducción

Función Varianza: El momento de orden 2 respecto a la media responde a V[X] y se define como: 1. Discretas:

V [ X ] = µ2 = ∑ ( xi − E[ X ]) 2 pi 2. Continuas: +∞

V [ X ] = µ 2 = ∫ ( x − E[ X ]) 2 f ( x)dx −∞

Estadística

Modelos de distribución discreta

Estadística Proceso de Bernoulli

Ejemplo: Se ha efectuado un experimento sobre avistamientos de cetáceos en un punto determinado. En 200 salidas efectuadas se han anotado 10 avistamientos de cachalote. Describir el experimento: Solución: X = Avistar cachalotes • X=1 (éxito) = 10/200 = 0.05 (5%) • X=0 (fracaso)

q ≈ 1 − p = 0.95

p ≈ 0.05

Estadística Distribución Binomial Resultado de ejecutar n veces un experimento de Bernoulli. Condiciones: • Condiciones no varían • Experimentos independientes (prob. no condicional) Definición del proceso: •  X

≡ Nº de éxitos en los n intentos independientes

• Cantidad de veces que se ejecuta (n) • Prob. de éxito (p) • Veces que se obtiene el éxito en las veces que se ejecuta (k)

Estadística Distribución Binomial

Definición: Distribución discreta aplicable a poblaciones con solo dos elementos complementarios (ser o no ser). Condición: Las definidas por las pruebas de Bernoulli: • Solo pueden darse dos resultados • Pruebas independientes entre si • Probabilidades constantes Ejemplos de aplicación: • Situaciones duales día seco/ día húmedo

µ = np

σ 2 = npq

Estadística Distribución Binomial

Expresión: Para p=prob. de éxito y q=1-p=prob. de fracaso

⎧⎛ n ⎞ x n − x ⎪⎜⎜ ⎟⎟ p q P( X = x) = ⎨⎝ x ⎠ ⎪ 0 ⎩

0≤ x≤n ∀otrox

¿Cuándo utilizarla? • Cuando nos dan una determinada cantidad de elementos • Cada elemento puede o no cumplir la condición • Dan o se puede calcular la prob. de que se de la condición • La pregunta es ¿Cuál es la prob. de que determinados elementos cumplan la condición?

Estadística Distribución Binomial

Ejemplo De una población de cetáceos se sabe que el 60% son machos. Si se extrae un conjunto de 10 de ellos, ¿cuál es la probabilidad de que en ese conjunto haya 7 hembras? • X = Nº de hembras en el conjunto • n = 10 • P = 0.4

⎛10 ⎞ 7 10−7 P( X = 7) = ⎜⎜ ⎟⎟0.4 0.6 = 0.042 ⎝ 7 ⎠

¿Cuál es la probabilidad de que hayan 3 o menos hembras?

P( X ≤ 3) = P( X = 0) + P( X = 1) + P( X = 2) + P( X = 3) = 0.382 Tabla Binomial

Estadística Distribución Binomial ¿Cuál es la probabilidad de que en ese conjunto haya 7 machos o menos? PROBLEMA CON LAS TABLAS (p hasta 0.5) • n = 10 • P = 0.6 • P(X3)

P( X ≥ 3) = 1 − P( X ≤ 2) = 0.1673

P( X ≤ 7) = 1 − 0.1673 = 0.8327

Estadística Distribución Binomial

Estadística Distribución de Poisson

Proceso de Poisson Generalización en un soporte continuo del proceso de Bernoulli. Características: • Proceso estable: A largo plazo produce un número medio de sucesos constante por unidad de observación • Aparece aleatoriamente de forma independiente (sin memoria) •  X

≡ Nº de éxitos en los n intentos en el soporte continuo

• La función viene caracterizada por el parámetro λ

= E[ X ] = Var[ X ]

Estadística Distribución de Poisson

Definición: La distr. De Poisson con parámetro λ (λ > 0) es la que tiene como función de masa: ⎧ −λ λx ⎪e P( X = x) = ⎨ x! ⎪⎩ 0

x≥0 x 30 p < 0.1 o con np = λ > 30 • Su función de probabilidad puede ajustarse sustituyendo el parámetro de la función por la media. Binomial

np = λ > 1

Poisson

p < 0.1

µ = np σ = npq

A partir de Peña, 2001

npq > 5

Normal

λ >5

µ =λ σ= λ

Estadística Distribución de Poisson

Estadística Distribución de Poisson

Ejemplo Los avistamientos de cachalotes sigue una distribución de Poisson de media 2 avistamientos en un transecto de muestreo de 1km de recorrido tras una salida en barco. Calcula la probabilidad de: 1.  Ningún avistamiento en el recorrido del barco: 0 2 P( X = 0) = e −2 = 0.135 0!

2.  Menos de cinco en el mismo recorrido: 2 3 4 ⎛ ⎞ 2 2 2 P( X ≤ 4) = e −2 ⎜⎜1 + 2 + + + ⎟⎟ = 0.947 2! 3! 4! ⎠ ⎝

3.  Y menos de seis si consideramos un recorrido de 5km

⎛ 10 0 101 10 2 103 10 4 105 ⎞ ⎟⎟ = 0.067 P( X ≤ 5 / λ ) = e ⎜⎜ + + + + + 1! 2! 3! 4! 5! ⎠ ⎝ 0! '

−10

λ' = λ ⋅ 5 = 10

Estadística Distribución de Poisson Y menos de nueve si consideramos un recorrido de 2km

λ' = λ ⋅ 2 = 4 P( X ≤ 8 / λ' ) = 0.018 + 0.073 + 0.147 + 0.195 + 0.195 + 0.156 + 0.104 + 0.06 + 0.03 = 0.978

Utilización de la tabla

Estadística Distribución Binomial

Comando a utilizar con R: • dbinom(x,tamaño,prob): Función de probabilidad • pbinom(x,tamaño,prob): F. prob. acumulada • qbinom(prob,tamaño,prob): Quantiles • rbinom(nobs,tamaño,prob): Números pseudoaleatorios

Estadística Distribución Poisson

Comando a utilizar con R: • dpois(x,lambda): Función de probabilidad • ppois(x,lambda): F. prob. acumulada • qpois(prob,lambda): Quantiles • rpois(nobs,lambda): Números pseudoaleatorios