Métodos No Paramétricos I Elena J. Martínez 81 2do cuat. 2013 Test para dos muestras independientes Test de Mann-Whitney-Wilcoxon Consideremos una situación en la cual un investigador ha obtenido dos muestras aleatorias independientes de poblaciones posiblemente diferentes y desea testear la hipótesis nula de que ambas poblaciones son idénticas. Es decir, el investigador desea detectar diferencias entre las dos poblaciones en base a muestras aleatorias de ambas. Intuitivamente se podría pensar en combinar ambas muestras, asignar rangos a las observaciones y definir el estadístico del test como la suma de los rangos de las observaciones en una de las dos poblaciones. Si la suma es demasiado pequeña o demasiado grande, ésto sería evidencia de que los valores de una de las poblaciones tienden a ser más pequeños o más grandes que los de la otra y se rechazaría la hipótesis nula. Tal como lo presentamos se trataría de un test para diferencia entre distribuciones, es decir que la hipótesis nula sería Ho: F(x) = G(x) ∀ x, siendo F la distribución de la m.a. X1,...,Xn y G la de la m.a. Y1,..., Ym. Sin embargo, nosotros lo trataremos como un test para el parámetro de posición, para lo cual supondremos que G(x)=F(x-∆), para algún ∆. Datos: Sea F ∈Ωo y sean X1,...,Xn una m.a. de una distribución F(x) e Y1,...,Ym una m.a. de una distribución F(x-∆), independiente de la primera, es decir que sólo suponemos que F es absolutamente continua con única mediana y que las dos distribuciones tienen la misma forma (en particular, igual varianza). Hipótesis a testear: A. Ho: ∆ = 0 vs H1: ∆ ≠ 0 B. Ho: ∆ = 0 vs H1: ∆ < 0 C. Ho: ∆ = 0 vs H1: ∆ > 0 Estadístico del test y zona de rechazo: Consideremos el caso C. Wilcoxon (1945) propuso el siguiente procedimiento. Se ordenan los datos de las dos muestras combinadas de menor a mayor y se define el estadístico U como la suma de los rangos de la m.a. Y1,...,Ym. Se rechaza Ho si U es grande. Si hubiésemos considerado las hipótesis B rechazaríamos Ho para valores pequeños de U, o equivalentemente para valores grandes del estadístico T definido como la suma de los rangos de la m.a. X1,...,Xn en la muestra combinada. Sea N=n+m, y llamemos R(Yi) y R(Xi) a los rangos de Yi y Xi respectivamente, en la muestra ordenada de los datos combinados. Si hay empates se asigna a los valores empatados el promedio de los rangos que les corresponderían si no hubiese empates. Se definen los estadísticos Métodos No Paramétricos I Elena J. Martínez 82 2do cuat. 2013 m n U = ∑ R(Yi ) T = ∑ R( X i ) i =1 que verifican U + T = i =1 N ( N + 1) . 2 Mann y Whitney (1947) consideraron, por analogía con el test del signo, el siguiente estadístico: W = ∑ s (Yi − X j ) i, j donde ahora las variables que intervienen en la suma no son independientes. Si no hay empates, R(Yi ) =# { X j < Yi 1 ≤ j ≤ n}+ # {Yk ≤ Yi 1 ≤ k ≤ m} entonces, U =W + m(m + 1) 2 Teorema: Bajo Ho: ∆ = 0, F ∈ Ωo, P(R(Yi ) = k ) = a) 1 N 1≤ k ≤ N 1 P (R(Yi ) = k , R(Y j ) = l ) = N ( N − 1) 0 N +1 b) E( R( Yi )) = 2 Corolario: E (U ) = m N 2 −1 V ( R( Yi )) = 12 N +1 2 E (T ) = n V (U ) = V (T ) = V (W ) = n m N +1 2 N +1 12 si k ≠ l , i ≠ j en caso contrario cov( R( Yi ), R( Y j )) = − E (W ) = ( N + 1) si i ≠ j 12 nm 2 (2) Métodos No Paramétricos I Elena J. Martínez 83 2do cuat. 2013 Si hay empates, la esperanza de U no cambia pero sí la varianza. Si s es el número de grupos de empates y dj es el número de valores empatados en el grupo j, entonces: s V (U / d 1 ,..., d s ) = m n N +1 − 12 m n∑ (d i3 − d i ) i =1 12 N ( N − 1) donde el segundo sumando se denomina “corrección por empates”. La varianza de U se puede estimar en este caso mediante N mn( N + 1) 2 mn 2 V (U ) = ∑ Ri − 4( N − 1) N ( N − 1) i =1 ^ (3) siendo R( X i ) Ri = R(Yi − n ) 1≤ i ≤ n n +1≤ i ≤ n + m Volviendo a los tests planteados inicialmente, las zonas de rechazo serán las siguientes: A. Ho: ∆ = 0 vs H1: ∆ ≠ 0 mn Se rechaza Ho si U ≤ wαmn/ 2 ó U > w1mn −α / 2 , siendo w β el cuantil β de la distribución exacta del estadístico de Wilcoxon para tamaños de muestra m y n. La Tabla A7 de Conover da los cuantiles inferiores de la distribución exacta para 2 ≤ m,n ≤ 20. N ( N + 1) , los cuantiles superiores pueden obtenerse mediante la relación: 2 N ( N + 1) = − wβnm . Si n y m son suficientemente grandes o hay empates, se utiliza la 2 Como U + T = w1mn −β aproximación Normal. En este caso, el cuantil aproximado es wp ≅ ^ m( N + 1) + z p V (U ) 2 La expresión del estimador de la varianza de U se reemplaza por (2) si no hay empates o por (3) si hay empates. Métodos No Paramétricos I Elena J. Martínez B. Ho: ∆ = 0 vs o, si las muestras son grandes o hay empates si ^ m( N + 1) − zα V (U ) . 2 C. Ho: ∆ = 0 Se rechaza Ho U> H1: ∆ < 0 si U ≤ wαmn Se rechaza Ho U≤ 84 2do cuat. 2013 vs H1: ∆ > 0 si U > w 1mn− α o, si las muestras son grandes o hay empates si ^ m( N + 1) + z α V (U ) . 2 Distribución exacta bajo Ho: Consideremos, a modo de ejemplo, el caso n=m=2 sin empates, con lo cual los rangos toman valores 1, 2, 3 y 4. En la siguiente tabla se presentan todas las configuraciones posibles y los correspondientes valores de los estadísticos: 1 y y y x x x Rangos 2 3 4 y x x x y x x x y y y x y x y x y y W U T 0 1 2 2 3 4 3 4 5 5 6 7 7 6 5 5 4 3 La distribución exacta del estadístico U, por ejemplo, será: U pU 3 1/6 4 1/6 5 2/6 6 1/6 7 1/6 Hay una fórmula recursiva que permite obtener la distribución exacta. (Hettmansperger, pag. 137) Distribución asintótica bajo Ho: ∆ = 0: Supongamos que n y m tienden a infinito, de modo tal que m →λ n+m entonces, bajo Ho, 0 < λ <1 Métodos No Paramétricos I Elena J. Martínez 85 2do cuat. 2013 W − E (W ) V (W ) U − E (U ) V (U ) d → N (0,1) W = W p → 1/ 2 nm T − E (T ) d N (0,1) → V (T ) d → N (0,1) Estimador puntual e intervalo de confianza: El test para Ho: ∆ = ∆o vs H1: ∆ ≠ ∆o se puede ~ obtener trabajando con Yi = Yi − ∆ o que tiene mediana nula bajo Ho , y el estadístico del test se basará en W (∆ o ) = ∑ s (Y j − X i − ∆ o ) =# {(i, j ) / 1 ≤ i ≤ n, 1 ≤ j ≤ m, Y j − X i > ∆ 0 } i, j De esta forma del estadístico del test se deduce el estimador de Hodges-Lehmann de ∆, ∆ˆ = med (Y j − X i ) i, j Como bajo Ho , la distribución de W es simétrica alrededor de su media nm/2, si k satisface PH o (W ≤ k ) = α , entonces 2 [ D ( k +1) , D ( nm − k ) ) será un intervalo de confianza de nivel 1 - α para ∆, siendo D (1) ≤ .... ≤ D ( mn ) los estadísticos de orden de las diferencias Dij = Y j − X i . Como U = W + m(m + 1) , el valor de k se puede obtener, a partir de la tabla del libro de 2 Conover, como k = wαmn/ 2 − m(m + 1) 2 o bien, en forma aproximada, k≅ ^ mn 1 − − zα / 2 V (U ) 2 2 ^ con V (U ) reemplazada por (3) o (2) según haya o no empates. Métodos No Paramétricos I Elena J. Martínez 86 2do cuat. 2013 Ejemplo: En una clase de una escuela de enseñanza superior hay 48 alumnos varones, de los cuáles 12 viven en el campo y 36 en la ciudad. Se desarrolló un test para determinar la condición física de los alumnos. Se aplicó este test a los 48 alumnos y se asignó a cada uno una puntuación. Una puntuación baja indica mala condición física. Los resultados obtenidos son los siguientes: Campo (Xi) 14.8 10.6 7.3 12.5 5.6 12.9 6.3 16.1 9.0 11.4 4.2 2.7 12.7 14.2 12.6 2.1 17.7 11.8 Ciudad (Yi) 7.6 2.4 11.3 6.4 8.3 9.1 6.7 6.7 3.6 18.6 1.0 3.2 16.9 7.9 16.0 10.6 5.6 5.6 6.2 6.1 15.3 10.6 1.8 5.9 9.9 10.6 14.8 5.0 2.6 4.0 Se desea testear Ho: los alumnos que viven en el campo y los que viven en la ciudad tienen la misma condición física H1: los alumnos que viven en el campo tiene mejor condición física que los que viven en la ciudad. O, equivalentemente, si se supone que ambas poblaciones tienen igual distribución, excepto quizás en la posición, que Ho: ∆ = 0 H1: ∆ < 0 vs donde ∆ = med (Yi) – med (Xi). Se ordenan las puntuaciones de ambos grupos y se les asigna el correspondiente rango: X Y 1.0 1.8 2.1 2.4 2.6 2.7 3.2 3.6 4.0 4.2 5.0 5.6 5.6 5.6 5.9 6.1 Rango 1 2 3 4 5 6 7 8 9 10 11 13 13 13 15 16 X Y 6.2 6.3 6.4 6.7 6.7 7.3 7.6 7.9 8.3 9.0 9.1 9.9 10.6 10.6 10.6 10.6 Rango 17 18 19 20.5 20.5 22 23 24 25 26 27 28 30.5 30.5 30.5 30.5 X Y 11.3 11.4 11.8 12.5 12.6 12.7 12.9 14.2 14.8 14.8 15.3 16.0 16.1 16.9 17.7 18.6 Rango 33 34 35 36 37 38 39 40 41.5 41.5 43 44 45 46 47 48 Métodos No Paramétricos I Elena J. Martínez 87 2do cuat. 2013 n ∑ R( X Calculamos el valor del estadístico T = i =1 N necesitamos calcular ∑R i =1 2 i i ) = 321 . Para utilizar la aproximación normal, = 38016 y por lo tanto el valor del estadístico standarizado será: N +1 2 = N mn( N + 1) 2 mn 2 ∑ Ri − 4( N − 1) N ( N − 1) i =1 T −n 49 2 = 0.6431 12 ⋅ 36 12 ⋅ 36 ⋅ 49 2 38016 − 48 ⋅ 47 4 ⋅ 47 321 − 12 Rechazaríamos Ho a nivel 0.05 si el valor del estadístico fuese mayor que 1.65, entonces, no rechazamos Ho . El p-valor es 0.26. Lo procesamos en R usando la función wilcox.test: campo<-c(14.8,10.6,7.3,12.5,5.6,12.9,6.3,16.1,9.0,11.4,4.2,2.7) ciudad<-c(12.7,16.9,7.6,2.4,6.2,9.9,14.2,7.9,11.3,6.4,6.1,10.6,12.6,16.0, 8.3,9.1,15.3,14.8,2.1,10.6,6.7,6.7,10.6,5.0,17.7,5.6,3.6,18.6,1.8,2.6,11.8, 5.6,1.0,3.2,5.9,4.0) wilcox.test(campo,ciudad,alternative="greater",paired=FALSE) y obtenemos la siguiente salida: Wilcoxon rank sum test with continuity correction data: campo and ciudad W = 243, p-value = 0.2639 alternative hypothesis: true location shift is greater than 0 Mensajes de aviso perdidos In wilcox.test.default(campo, ciudad, alternative = "greater", paired = FALSE) : cannot compute exact p-value with ties Distribución del estadístico bajo la alternativa: Sean X1,...,Xn e Y1,...,Ym m.a. de dos distribuciones arbitrarias continuas G(x) y H(y) respectivamente. Recordemos que el estadístico del test de Mann Whitney es equivalente a W = ∑ s (Yi − X j ) i, j que podemos escribir en la forma Métodos No Paramétricos I Elena J. Martínez 88 2do cuat. 2013 W = ∑ ∑ Tij i Tij = 1 si donde j Yi − X j > 0 y definamos, análogamente a lo que hicimos en el caso del test de Wilcoxon, ∞ ∞ −∞ −∞ p1 = P(Y > X ) = ∫ G ( y ) h( y ) dy = p 2 = P(Y1 > X 1 , Y2 > X 1 ) = ∫ [1 − H ( x)] g ( x) dx ∞ ∫ [1 − H ( x)] g ( x) dx 2 −∞ ∞ p 3 = P(Y1 > X 1 , Y1 > X 2 ) = ∫ G 2 ( y ) h( y ) dy −∞ Teorema: E (W ) = m n p1 V (W ) = m n( p1 − p12 ) + m n (m − 1)( p 2 − p12 ) + m n (n − 1)( p 3 − p12 ) Demostración: E (W ) = m n E (T11 ) = m n P (Y > X ) = m n p1 . Por otro lado, expresando 2 E (W ) = E ∑∑ Tij = E ∑∑∑∑ Tij Tkl i j i j k l 2 se obtiene E (W 2 ) = mnE (T112 ) + mn(m − 1) E (T11T12 ) + mn(n − 1) E (T12 T22 ) + mn(m − 1)(n − 1) E (T11T22 ) Pero, por ejemplo, E (T11T12 ) = P (Y1 > X 1 , Y2 > X 1 ) = p 2 y, operando con los otros términos en la misma forma, y calculando V (W ) = E (W 2 ) − [E (W )] se obtiene la expresión dada. 2 Cuando m, n → ∞ , de manera que n / N → λ , 0 < λ < 1 , usando el método de las proyecciones puede probarse que, si 0 < p1 < 1, W − E (W ) V (W ) d → N (0,1) Métodos No Paramétricos I Elena J. Martínez 89 2do cuat. 2013 Más precisamente, si W = W / mn , d N (W − p1 ) → N (0, ( p 2 − p12 ) / λ + ( p 3 − p12 ) /(1 − λ )) Consistencia: Sea µ (G , H ) = E (W ) = p1 y sea ΩM la clase de funciones de distribución continuas definida como ΩM ={(G,H) tales que G(x) ≥ H(x) ∀ x con desigualdad estricta en al menos un x} Entonces, 1/ 2 µ (G, H ) = > 1 / 2 si G ( x) = H ( x) si (G, H ) ∈ Ω M y, por lo tanto W provee un test consistente para la clase de alternativas ΩM , en particular para alternativas de posición, como las planteadas por nosotros. Eficacia: Puede hacerse una deducción rigurosa de la eficacia, verificando las condiciones de Pitman, pero daremos sólo su expresión. Consideremos G(x)=F(x) y H(x) = F(x-∆). Sabemos que la varianza asintótica es σ 2 = ( p 2 − p12 ) / λ + ( p 3 − p12 ) /(1 − λ ) Bajo Ho, σ 2 (0) = 1 . Además, 12 λ (1 − λ ) µ (∆) = p1 = ∞ ∫ [1 − F ( x − ∆)] f ( x)dx ⇒ −∞ µ ' (0) = ∞ ∫f 2 ( x)dx −∞ y por lo tanto la eficacia del test es c= µ ' (0) = 12λ (1 − λ ) ∫ f 2 ( x)dx σ (0) λ (1 − λ ) veces la eficacia del test de Wilcoxon para muestras apareadas y es máxima cuando λ = 1 / 2 o sea cuando las dos muestras son de igual tamaño. Observemos que la eficacia es Métodos No Paramétricos I Elena J. Martínez 90 2do cuat. 2013 De aquí podemos deducir cuál es la distribución asintótica del estimador de Hodges-Lehmann de ∆, ya que d N (∆ˆ − ∆) → N (0,1 / c 2 ) Respecto a la eficiencia asintótica relativa del test de Mann-Whitney respecto al test de t, fue estudiada bajo la hipótesis de que las distribuciones de ambas poblaciones difieren sólo en su media. Si ambas poblaciones son normales la eficiencia es 0.955, si son uniformes es 1.0 y si tienen distribución doble exponencial es 1.5. Bajo la hipótesis mencionada sobre las distribuciones, la eficiencia nunca es inferior a 0.864. Witting (1960) estudió la eficiencia del test de Mann-Whitney relativa al test de t para dos muestras independientes pequeñas. Usando aproximaciones numéricas, Witting mostró que aún para tamaños de muestra pequeños (m=n=10, por ejemplo), la eficiencia, bajo normalidad nunca era menor que 0.94. Problema de Fisher-Behrens: Hasta ahora supusimos que ambas distribuciones tienen la misma forma y difieren a lo sumo en la posición. Ahora supongamos que X1,...,Xn es una m.a. de una distribución G(x), G ∈ Ωo e Y1,...,Ym es una m.a. de una distribución H(y-∆), H ∈ Ωo y que deseamos testear Ho: ∆ = 0 vs H1: ∆ > 0 Cuando G y H son normales con diferentes varianzas usamos el test de Welch. La idea es usar la distribución límite de W para G y H arbitrarias e introducir un estimador consistente de la varianza de W. Sabemos que, E (W ) = nmp1 y V (W ) = m n( p1 − p12 ) + m n (m − 1)( p 2 − p12 ) + m n (n − 1)( p 3 − p12 ) Buscamos un estimador consistente de la varianza y lo haremos a partir de las siguientes expresiones p1 − p12 = (∫ G(t )h(t )dt )(∫ H (t ) g (t )dt ) p 2 − p12 = ∫ H 2 (t ) g (t )dt − p 3 − p12 = ∫ G 2 (t )h(t )dt − (∫ H (t ) g (t )d (t )) 2 (∫ G(t )h(t )d (t )) 2 Métodos No Paramétricos I Elena J. Martínez 91 2do cuat. 2013 La idea es reemplazar en estas ecuaciones las funciones de distribución por las correspondientes funciones de distribución empíricas. Sin embargo, estos estimadores se expresan en forma más simple usando las denominadas ubicaciones, que definimos a continuación. Definición: Dados X1,...,Xn e Y1,...,Ym, la ubicación de Xi entre Y1,...,Ym es ρ i ( x) =# {j / Y j ≤ X i } y la ubicación de Yj entre X1,...,Xn es ρ j ( y ) = # {i / X i ≤ Y j } ∫ Entonces, un estimador de 1 − p1 = H (t ) g (t )dt es ∫ H m (t )dGn (t ) = 1 n 1 n 1 H ( X ) = ρ i ( x) = ρ ( x) ∑ ∑ m i n i =1 nm i =1 m De la misma forma se expresan todos los otros estimadores, y llamando n s 2 ( x) = ∑ (ρ i ( x) − ρ ( x) ) 2 i =1 s 2 ( y ) = ∑ (ρ j ( y ) − ρ ( y ) ) m 2 j =1 el estimador de la varianza de W será ^ V (W ) = ρ ( x) ρ ( y ) + s 2 ( x) + s 2 ( y ) y, como las ubicaciones son funciones de los rangos, el estadístico ^ W= W − mn / 2 ^ V (W ) es un estadístico de rangos. El test rechazará Ho: ∆ = 0 a favor de H1: ∆ > 0 a nivel α cuando ^ W > zα . Métodos No Paramétricos I Elena J. Martínez 92 2do cuat. 2013 Si ∆ = 0 y G = H, Ŵ es distribución libre y su distribución ha sido tabulada para algunos ^ tamaños de muestra por Fligner y Policello (1981). Sin embargo, para asegurar que W siga siendo al menos asintóticamente distribución libre cuando ∆ = 0 y G ≠ H, debe suponerse que G, H ∈ Ωs. En la tabla que sigue (Fligner y Policello (1981)) se presentan los niveles empíricos, para un ^ nivel nominal 0.05, basados en 10000 simulaciones para W , W , t y tW , siendo este último el estadístico de Welch. Los tamaños de muestra son n=11 y m=10 y las distribuciones consideradas son la distribución Normal y la Normal contaminada con ε = 0.1, con H de la forma H(t)=G(t/σ) para diferentes valores de σ. Distribución Normal Normal contaminada σ W 0.1 0.25 1 4 10 0.1 0.25 1 4 10 0.081 0.069 0.050 0.071 0.082 0.076 0.065 0.048 0.068 0.083 ^ W 0.048 0.054 0.048 0.054 0.062 0.051 0.052 0.046 0.052 0.063 t tW 0.048 0.050 0.048 0.060 0.069 0.033 0.033 0.035 0.043 0.050 0.048 0.052 0.047 0.047 0.052 0.034 0.033 0.033 0.032 0.035 ^ Se observa que el test basado en W es el más estable, superando al test de Welch en el caso contaminado. Los mismos autores simularon otras distribuciones subyacentes e incluyeron un ^ estudio de la potencia de los tests, concluyendo que el test basado en W es superior en el sentido de que conserva su nivel y al mismo tiempo alcanza alta potencia. Scores generales: Definición: Sean N=n+m, a(1) ≤ .... ≤ a(N) una sucesión no constante y definamos V = ∑ a (R j ) m j =1 donde R j = R (Y j ) es el rango de Y j en la muestra combinada. V se denomina estadístico de scores generales con scores a(i). Métodos No Paramétricos I Elena J. Martínez 93 2do cuat. 2013 Teorema: Bajo Ho: ∆ = 0, E (V ) = m N ∑ a(i) = m a N i =1 Var (V ) = Demostración: E (V ) = N nm (a(i ) − a )2 ∑ N ( N − 1) i =1 m N i =1 s =1 ∑ E (a( R j )) = mE (a( R1 )) = m∑ a(s) N E (a 2 ( R1 )) = ∑ a 2 ( s ) s =1 1 N N entonces, Var (a ( R1 )) = N ∑a s =1 2 (s) 1 −a2 = N 1 =ma. N ∑ (a(s) − a ) 2 s =1 N Además, cov(a ( R1 ), a ( R2 )) = E ((a ( R1 ) − a )(a ( R2 ) − a ) ) = ∑ 1 (a (i ) − a )(a ( j ) − a ) = i ≠ j N ( N − 1) N N 1 1 = (a(i ) − a )∑ (a( j ) − a ) = − (a (i ) − a ) 2 ∑ ∑ N ( N − 1) i =1 N ( N − 1) i =1 j ≠i Entonces, m(m − 1) cov(a ( R1 ), a ( R2 )) = 2 j =1 N m(m − 1) N m N m = ∑ (a( s) − a ) 2 − (a( s) − a ) 2 = (a( s ) − a ) 2 ( N − 1 − m + 1) = ∑ ∑ N s =1 N ( N − 1) s =1 N ( N − 1) s =1 m Var (V ) = Var ∑ a ( R j ) = m Var (a ( R1 )) + 2 = N mn (a ( s) − a ) 2 ∑ N ( N − 1) s =1 Métodos No Paramétricos I Elena J. Martínez 94 2do cuat. 2013 Más aún, puede probarse que si a ( j ) + a ( N + 1 − j ) = K (constante) para todo j, entonces bajo Ho, V tiene distribución simétrica alrededor de m a . Definición: Sea ψ(u), 0 < u < 1, una función no decreciente. Supongamos además que 1 1 0 < ∫ (ψ (u) -ψ ) du < ∞ 2 ψ = ∫ ψ (u )du con 0 0 i , definimos el estadístico generado por la función generadora de scores ψ, N + 1 Si a (i ) = ψ como: V = 1 N ∑ a(R(Y )) m j j =1 Distribución asintótica bajo Ho: En el caso de una muestra, el estadístico V era asintóticamente normal y el resultado se obtenía aplicando el TCL. En este caso, V no es suma de v.a. independientes y es necesario usar el teorema de proyecciones para obtener su distribución asintótica. Hajek y Sidak (1967) prueban que si min(n, m) → ∞ , entonces bajo Ho, V − E (V ) d → N (0,1) Var (V ) Supongamos que n → λ , 0 < λ < 1, es decir que ninguno de los tamaños de muestra domina N asintóticamente, entonces E (V ) = m m 1 a= N N N N i ∑ψ N + 1 → (1 − λ ) ψ i =1 1 N mn N Var (V ) = 2 (a (i ) − a ) 2 → λ (1 − λ ) ∫ (ψ (u ) − ψ ) 2 du ∑ N ( N − 1) i =1 0 y, bajo Ho N V − (1 − λ ) ψ 1 λ (1 λ ) (ψ (u) - ψ ) 2 du ∫ 0 1/ 2 d → N (0,1) Métodos No Paramétricos I Elena J. Martínez 95 2do cuat. 2013 Algunos ejemplos de funciones de scores: ψ (u ) = Φ −1 (u ) , entonces el estadístico de 1) Scores normales de Van der Waerden: Sea scores normales se define como 1 N V = 1 ∫ En este caso, ψ = Φ −1 (u )du = 0 y 0 m ∑Φ −1 j =1 Rj N + 1 1 ∫ (ψ (u) − ψ ) du = 1 . Para probarlo basta hacer el cambio 2 0 de variable Φ −1 (u ) = t . N3 mn n m ≅ λ , 1 − λ ≅ y bajo Ho, Luego si N N 1/ 2 d V → N (0,1) 2) Estadístico de Mood: Sea 1/2 < u < 1 0 < u ≤ 1/2 1 ψ (u ) = 0 entonces el estadístico de Mood, que es el número de Yi’s que superan a la mediana de la muestra combinada (test de la mediana) se puede escribir como m Rj V+* = ∑ψ j =1 N + 1 1 ∫ Es fácil verificar que ψ (u )du = 1 / 2 y 0 1 ∫ (ψ (u) − ψ ) 2 du = 1 / 4 . 0 Supongamos que N = n+m = 2 r y m ≤ n, entonces i 0 a(i ) = ψ = N + 1 1 1≤ i ≤ r r +1≤ i ≤ N Métodos No Paramétricos I Elena J. Martínez 96 2do cuat. 2013 E (V+* ) = m a = m r m = = mψ N 2 1 Var (V+* ) = mn (a(s ) − a )2 = mn = mn ∫ (ψ (u ) − ψ ) 2 du ∑ N ( N − 1) 4( N − 1) N − 1 0 V+* , Por lo tanto, si denotamos V = N * + 1− λ d 2 → N (0,1) λ (1 − λ ) 4 V+* − N 3) ¿Cómo construir scores para el problema de dos muestras a partir de los de una muestra?: Sea ψ + (u ), 0 < u < 1 , una función generadora de scores para el problema de una muestra y el correspondiente estadístico V + = 1 n + Rj ∑ψ s ( X j ) n j =1 n + 1 Consideremos ahora la siguiente extensión de ψ + al (-1,1): ψ + (−u ) = −ψ + (u ) si u ∈ (0,1) Sea ψ (u ) = ψ + (2u − 1) − ψ + (1 − 2u ) ψ (u ) = + ψ (2u − 1) si 0 < u <1 0 < u <1/ 2 1/2 < u < 1 Métodos No Paramétricos I Elena J. Martínez 97 2do cuat. 2013 Se define el estadístico para el test de dos muestras en la forma V = En este caso, ψ = 0 y 1 1 0 0 ( 1 N m R(Y j ) j =1 ∑ψ N + 1 . ) 2 + ∫ (ψ (u) − ψ ) du = ∫ ψ (v) dv y se puede demostrar que la eficacia del test correspondiente a ψ es 2 λ (1 − λ ) veces la del test para una muestra generado por ψ + . Ejemplos: 3.1) Si ψ + (u ) = u , 0 < u < 1 , el estadístico V + es el del test de rangos signados de Wilcoxon. La función generadora ψ (u ) = 2u − 1, 0 < u < 1 produce el test de Mann-Whitney para dos muestras. 3.2) Si ψ + (u ) = 1, 0 < u < 1 , el estadístico V + es el del test del signo. La función generadora − 1 ψ (u ) = 1 0 < u < 1/ 2 produce el test de medianas de Mood para dos muestras. 1/ 2 < u < 1 u +1 + , 0 < u < 1 , el estadístico V es el correspondiente al test de scores 2 normales. La función generadora ψ (u ) = Φ −1 (u ) produce el test de scores normales de Van der 3.3) Si ψ + (u ) = Φ −1 Waerden para dos muestras. Eficiencia de scores generales: La eficacia del test de dos muestras generado por la función u + 1 multiplicada por 2 de scores Ψ es la del test de una muestra generado por ψ + (u ) = ψ λ (1 − λ ) y por lo tanto se preservan las eficiencias relativas.