Pruebas de bondad de ajuste

Pruebas de bondad de ajuste      Existen pruebas cuantitativas formales para determinar si el ajuste de una distribución paramétrica a un co...
3 downloads 0 Views 174KB Size
Pruebas de bondad de ajuste 









Existen pruebas cuantitativas formales para determinar si el ajuste de una distribución paramétrica a un conjunto de datos es buena en algún sentido probabilístico. Objetivo: Obtener evidencia en favor de que los datos fueron obtenidos de una población con una distribución probabilística hipotética. Prueba χ2 : Esencialmente compara un histograma con la distribución de probabilidad (para variables discretas) o con la función de densidad de probabilidad (para variables continuas). Esta prueba opera de forma más natural para v.a. discretas ya que para implementarla el conjunto de datos debe ser dividido en clases. Permite determinar si las frecuencias observadas en las clases difieren significativamente de las frecuencias esperadas a partir de un modelo supuesto. La hipótesis nula postula que no existe una diferencia importante entre las distribuciones que se están comparando.













El estadístico de prueba involucra el conteo de valores que caen en cada clase en relación con las probabilidades teóricas calculadas.

El número de ocurrencias esperadas no necesita ser un valor entero. Bajo la hipótesis nula de que los datos fueron obtenidos de la distribución ajustada, la distribución muestral del estadístico de prueba es la distribución χ2 con parámetro ν (= # clases - # parámetros estimados – 1) grados de libertad. La prueba es unilateral ya que el estadístico de prueba sólo toma valores positivos. No es necesario que las clases tengan el mismo ancho, pero deben evitarse clases con frecuencias esperadas muy pequeñas. Para que la aproximación de la χ2 sea válida, la frecuencia esperada debe ser al menos de 5. Esta prueba no es válida para muestras pequeñas, y si algunos de los conteos son menores que 5, es necesario combinar las clases en los extremos.

Estudiar la prueba Kolmogorov-Smirnov (kstest)

Pruebas No Paramétricas 



Son pruebas que no requieren de la suposición de distribuciones teóricas para los datos o de distribuciones muestrales teóricas del estadístico de prueba. Son apropiadas si se satisface alguna o ambas de las siguientes condiciones: a) Sabemos o sospechamos que las suposiciones requeridas para realizar una prueba paramétrica particular no se cumplen. b) El EP que es sugerido o impuesto por el problema físico en cuestión es una función complicada de los datos y su distribución muestral es desconocida y/o no puede ser derivada analíticamente.





Se siguen los mismos pasos que para las pruebas paramétricas; la diferencia estriba en los medios por los cuales se obtiene la distribución nula. Las pruebas no paramétricas se dividen en dos ramas:

a) Pruebas clásicas: emplean resultados matemáticos analíticos (fórmulas) que son aplicables a datos obtenidos de cualquier distribución. b) Pruebas de remuestreo (resampling tests): construyen una aproximación discreta a la distribución nula mediante la manipulación repetida de los datos (resampling), con lo que se llega a la distribución nula de manera empírica. Por ello se puede usar prácticamente cualquier EP que pueda ser relevante, sin importar qué tan complicado pueda ser matemáticamente.

Prueba de signo jerarquizado de Wilcoxon para muestras en pares (Wilcoxon signed-rank test) 







Toma ventaja de la correlación positiva entre las parejas de datos para evaluar posibles diferencias en su ubicación. Está basada en los rangos en lugar de los valores numéricos de los datos, por lo tanto no depende de la distribución de los datos y es resistente a valores extremos. Se basa en el conjunto de n diferencias, Di, entre las n parejas de datos (xi,yi). Hipótesis nula (Ho): Los dos conjuntos de datos representan muestras de la misma población.









Si la hipótesis nula es cierta, habrá aproximadamente tantas diferencias positivas como negativas y las magnitudes de las diferencias + y – deben ser comparables. La comparación se lleva a cabo mediante la jerarquización de las diferencias en valor absoluto, es decir, los n valores de Di son transformados en la serie de rangos:

Las parejas para las cuales │Di│son iguales se les asigna el rango promedio y las parejas para las cuales Di = 0 no se incluyen en los cálculos subsecuentes. Se denota con n' el número de parejas para las cuales xi ≠ yi. Da lo mismo tomar las parejas como (xi,yi) o como (yi,xi). El signo de Di cambia pero su valor absoluto sigue siendo el mismo.

• La característica particular de las parejas se captura sumando por separado los rangos Ti correspondientes a las parejas que tienen valores positivos o negativos de Di, denotando al estadístico de prueba como: o 





La prueba se aplica para cualquiera de estos estadísticos de prueba. Bajo Ho, hay un total de 2n' arreglos de T igualmente probables que constituyen la distribución nula. Sin embargo, para n’ moderadamente grande (>20) la distribución nula es aproximadamente Gaussiana con parámetros:

Bajo Ho, el estadístico de prueba T estará cerca de µT ya que los números y las magnitudes de los rangos serán comparables para las diferencias positivas y negativas. Si la diferencia es sustancial entre las ubicaciones de las dos variables que se están comparando, x y y, entonces T será o muy grande o muy pequeña. Estudiar la prueba de suma de rangos para dos muestras independientes Wilcoxon-Mann-Whitney