Comportamiento del test de los signos y del test de la mediana para una muestra

ESTADISTICA ESPAÑOLA Vol. 36, Núm. 136, 1994, págs. 183 a 203 Comportamiento del test de los signos y del test de la mediana para una muestra frente ...
0 downloads 1 Views 2MB Size
ESTADISTICA ESPAÑOLA Vol. 36, Núm. 136, 1994, págs. 183 a 203

Comportamiento del test de los signos y del test de la mediana para una muestra frente a cambios en el modelo por ALFONSO GARCIA PEREZ Departamento de Estadística e I. O. Facultad de Ciencias, UNED

RESUMEN EI test de los signos y el test basado en la mediana muestral tienen un comportamiento asintótico equivalente; ésto implica que también sean equivalentes desde el punto de vista de la robustez, al tener éstas un carácter asintótico.

EI presente trabajo demuestra, sin embargo, que cuando los tarnaños muestrales son pequeños el comportarniento de la función de potencia de ambos tests, ante cambios en la distribución modelo, puede ser notablemente diferente. Este hecho justifica la definición de una nueva medida de robustez en test de hipótesis con la cual el test de la mediana para una muestra es más robusto que el test de !os signos.

Pa/abras clave: robustez, tamaño muestral finito, contraste de hipótesis. Clasificación AMS: 62F04, 62F35, 62G 10.

r^ti r.•^1^^^7 ^c ^A t^.^;r ^ Ahc,^..1

INTRQDUCCION EI lema de Neyman-Pearson para tests maximin entre entornos de medidas de probabilidad dominadas por capacidades alternas de orden dos, debido a Huber (1965) y Huber-Strassen (1973), es el único resultado en robustez para contraste de hipátesis que conduce a una solución de óptimo, en el caso de muestras finitas. De él se han obtenido resultados posteriores tales como Rieder ^ 1977), Bednarski { 1984), Lambert (1985) y Bu ja (1984, 1985, 1986), de gran riqueza matemática pero de aplicación muy limitada. Por esta razón, la mayoría de los trabajos en robustez para contraste de hipótesis abordan el problema desde un punto de vista asintótico, aumentando así sus posibilidades de aplicación. No obstante, tests con el mismo grado de robusted asintótica pueden tener un comportamiento notablemente diferente con muestras de tamaño pequeño. En este artícula ponemos de manifiesto la necesidad de evaluar el comportamiento de los tests de hipótesis en el caso de muestras finitas mediante una nueva medida de robustez, al demostrar que dos tests asintóticamente equivalentes, según por ejemplo de! criterio de Rousseeuw y Ronchetti (1979, 1981) basado en ia curva de influencia de Hampel, pueden tener un comportamiento notablemente diferente en muestras finitas.

2.

PRELIMINARES

Sea X una variable aleatoria con distribución F^ depend'+ente de un parámetro de localización 6 el cual pertenece a un espacio paramétrico O. En el trabaja consideraremos contrastes de la hipótesis nula Ho : 9 eo, aunque los resultados que obtendremos pueden extrapolarse a otro tipo de hipótesis. Supondremos que la distribución de X pertenece a la clase `y= *_{ FH b: F^ b es una función de distribución (a) con densidad f^, b con respecto a la medida de

Lebesgue, (b) una familia de localización en H y de escala en b, estando el parámetro de escala determinado por la condición [1 ] fH b(8) = c, con c una constante conocida, (c) simétrica en e, (d) estrictamente creciente en un entorno de 8, (e) fuertemente unimvdal}. Esta clase incluye como miembros, por ejemplo, a la distribución normal, a la logística, a la doble exponencial, o(como límite) a la distribución uniforme.

En ocasiones exigiremos que la distribución de X pertenezca a una subclase de ^ y^ *, la de las farnilias en ^i de distribuciones de potencia exponencial, introducidas por Box y Tiao (1973, p. 15 r) con densidades,

('( )M!'Oft'! ^IMIF^.N"I'O [)l^l. T'!^ti"T I)F^: l.Oti ^1C;NOS ti' l)f^l. 1"f-.ti"I !)!: t_.1 !^1l^:UTAN ^^ ^

f ^ (x) _

1

Í

,^^ b r^ 1+'+ a^ 2^+__ 2_. 2

1

x -- H

2

b

^ x5

con - 1k ^ 0 en caso contrario

siendo el punto crítico k^ tal que F^ ;^o ( k^ )- P^o { M< k^} - 1- oc. Este contraste es uniformemente de máxima potencia para todo Fe ^`f * si n= 1, y posee buenas propiedades desde el punto de vista de fa robustez cuando el tamaño muestral es finito, Garcia Pérez (1987, 1989). Además, véase García Pérez ( 1990, 1993), su p-valor, cuando el modelo es F^E `^ * n

Pn =

^

[Feo (^]x [1 - Fgo (^^^ - x

n+ 1 x = - _--

tiene una distribución asintótica normal

IOg P^-

n

d lOg{F^o (8) [1 - F^^ (6)]} - n lOg 2--^ N 0,

feo (8) [2F^o (^) - 1 } 4c F^^ (8) [1 -- Feo (8)j

2

^

la cual permite determinar su función de influencia (de {-n -' log P„}} en el sentido de Lambert (1981), feo (^) [2 F^o (e) - 1 ^

if x < 6

4c F^o (8) [1 - Feo (8}] lF (x ; F^) _ f^o (e) [2Fdo (e) - 1 ]

ifx>8

4c F^o (6) [1 - F^o (8)] igual, salvo una constante, a la curva de influencia de Hampel para M y, por tanto, con las mismas buenas propiedades frente a outliers que ésta tiene. Además, García Pérez (1990, 1993), la sucesión {-- 1/n log P„ } es continua en F^ ,`d F^ E`^ *, lo que implica que ^m sea cualitativamente robusto en el sentid© de Lambert (1982). Aquí estudiaremos nuevos aspectos de dicho test hasta ahora no tratados. En concreto el comportamiento de su función de potencia (claramente no decreciente en s).

('OMPOR"I'AMIEN"IO F)F^:F_ TF:S"T (.)F l.OS SIC;NO:^ Y 1)F:l_ ( F^ti"I t)F-: L;^ 41F:F)f;^ti,^

^3^m (9) =

^ y^

- Fd (kn )]X ^F^ (kn )]n - x !

x=

n!

1-Fe(k^) X(n-1)^2 (1 _ X) (n-1)I2dX

[I

J o0

ante cambios en la distribución rnodelo.

4.1.

EI test de !a mediana para una muestra y la ordenación f éci ^k^ )'

Demostración: La función de densidad de una familia Box-Tiao puede expresarse como 1

x-8

2

b

^ d (X ) _ ^ (R) eXP { -

l

2 1 + ^i

}

F^:S7.AUIti^I^IC',^1 E^^:ti!'ANOl_A

siendo c (R) la función 1 , t ^^

br(^ +'2^^2,+ 2

No obstante, por pertenecer las distribuciones a`^ *, la condición [1 j implica c(^i) = c, d ^i, lo que equivale a decir que el parámetro de escala de la familía b el cual sí depende de R, ha de elegirse de forma que c(^i) sea constante. EI punto crítico k„ también será función de beta, por lo que el cociente (k^ - 6o)lb será función de beta, pudiendo expresarse la función de densidad de la forma 1 f Hi« (k„ ) = c exp

-

[^(^)]2

2

}

siendo w{R) la función (k^ (^) > 8a b' [3, por ser a< 0,5) k„(R}`^p

w( R) =

1/(1 + ^3) ^ [i^l^)^1/(1+^3}

b ( ^i)

en donde la última igualdad se entiende como notación.

Por tanto, demostrar el lema equivale a demostrar que la función c^(a) es creciente. Observemos previamente que c,^(R) es derivabie, ya que lo son las funciones 1

b (R) _

c r((3 + [i)^2} 2(3 + ^^/2

y k^ (^i} defínida como la inversa de la función de distribución, en el punto y= S^' (1 - a), de la familia de Box-Tiao correspondiente. Par ser k„ un punto crítico será

n! X (n- ^)l2 (^ -- X ) (n- f)/2C^X

1-a0

siendo ^^(f^) F ^O(k„)=0,5+r(R)

1 exp

0

-

Z2 2

(1 +^i)Z^dZ

] y^

t't)MPOR"E'AM1EN"I-O OFE. TE5'f [)E^. l_Uti SI(;NOS l' E)E-1 1 E-Sl [)F^: I.A !^1E^,C)EAN^^

con r ( [3) la función 1

r(R) ^

.

r{(3 + R),2) 2(3 + ^,,z

Por tanto, Ilamando h(y) a la función --creciente y derivable en {0,1)

n! X( n- 1)^2 / 1 - X) t ^ T>>^^ dX

h (Y) _

tendremos la expresión u)(^)

1 exp

1- a= h 0, 5+ r( R)

z 2 (1 + R) z^ dz

2

0

de dande derivando respecto a R obtendremos que c^(^)

exp

o,5+r(R)

0=h'

1

z2 (1+R)zadz •

-

0

' ^'(R}

e-z2^2(^ +R)z^dz+r(R)• 0

'

r 1 e XP S - - ^w^a)^2

l

w(^)

[w(R)]^ (1

e -z 2^2 z ^ [1 +(1 + R) log z ] dz

+ R) w' (R) + 0

con lo que despejando será

^^^^) -

^ ' (R) =

e-Z^f2z^

^+(1+R)

o

r' (R) r ((3)

+logz

dz

exp - 2 [^(R)l2 [^(R)l^ (1 + R)

derivada que, por los demás factores que intervienen en su expresión, será positiva cuando y sólo cuando sea negativa la integral

e-z2^2z^

1 +(1 +R}

r' (R) r (R)

+logz

dz.

^,ti l AI11^ l I( A E-,^}'ANt)l.r^

^^i`^

EI integrando es una función negativa hasta el punto zo = exp {-- 1 /(1 + R) r'(^3)/r(R)}, a partir del cual siempre es positiva. Por tanto, si el R es tal que w((3) < zo, la integral será negativa.

Si es w(R) > zo, al área negativa (integral hasta zo) habrá que sumarle una área positiva, pero demostrando que e

-Z 2^2 z ^3

1+(1+R)

0

r'(R)

dz < 0

r (R)

nunca el área positiva superará a la negativa, concluyendo con que w'(R) > 0 y por tanto con la demostración del lema. Fácilmente puede demostrarse que

r' (R)

1

r (R)

2

log 2 + Digamma

Por otro lado, haciendo operaciones, es e -z 2^2 z ^

1 +(1 +^i)

r' (R)

r (R)

+logz

dz

Suggest Documents