PROBABILIDAD Y ESTADÍSTICA U8: CONTRASTES DE HIPÓTESIS ESPECIALES INTRODUCCIÓN El contraste es paramétrico cuando las hipótesis planteadas son paramétricas, es decir, cuando las hipótesis se refieren al valor de un parámetro desconocido de la población, sin embargo el contraste es no paramétrico cuando las hipótesis planteadas son no paramétricas, o lo que es lo mismo, cuando las hipótesis se refieren a otras características (forma de la distribución, localización, aleatoriedad de una muestra, etc.) En la práctica difícilmente será conocida la forma funcional de la distribución de donde proceden los datos, siendo por ello necesario considerar métodos alternativos que no requieren el conocimiento de esa distribución pero que sí nos permitan hacer inferencias sobre la población. A estos métodos los llamamos métodos no paramétricos o de libre distribución y estarán caracterizados por el desconocimiento de su distribución, aunque utilizan estadísticos cuya distribución se puede obtener con independencia de la distribución de la población de partida, siendo las condiciones menos restrictivas que las exigidas en los métodos paramétricos; evidentemente existirán condiciones, por ejemplo, que la distribución sea de tipo continuo. En general los contrastes no paramétricos, necesitan pocas hipótesis para su planteamiento y la mayoría de las veces son más fáciles de aplicar que los contrastes paramétricos. Además, hasta ahora, en los contrastes paramétricos venimos analizando caracteres cuantitativos y por tanto perfectamente cuantificables, sin embargo en los contrastes no paramétricos podemos trabajar con características (o variables) ordinales, en las que solo interesa el orden o rango, e incluso nominales, en las que los valores se utilizan para indicar las distintas modalidades o categorías, por ejemplo, el sexo, podemos utilizar el 0 para el femenino y el 1 para el masculino, pero evidentemente el número asignado es arbitrario, pues el número lo utilizamos solamente para designar la categoría. Esto nos permite ampliar el campo de aplicación de los test de hipótesis. Hay muchos posibles test no paramétricos, así pues, algunos de los test paramétricos estudiados en la unidad anterior tienen su correspondiente test no paramétrico. Un test no paramétrico es más fácil de realizar y requiere menos cálculo que su correspondientes test paramétrico y nos podemos preguntar, ¿porqué utilizamos test paramétricos? La respuesta es que los test no paramétricos generalmente son menos potentes que sus correspondientes paramétricos. Un test no paramétrico será preferido cuando el cálculo y el procedimiento de ejecución aportan una simplificación importante frente al test no paramétrico. Además los test no paramétricos, como ya hemos indicado, tienen aplicación para datos cualitativos y por tanto, en algunas ocasiones el test no paramétrico será el único que podamos aplicar. Distribución Chí - cuadrado Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 1 PROBABILIDAD Y ESTADÍSTICA Características de la distribución La función de densidad de probabilidad para ji cuadrada se representa matemáticamente con la siguiente ecuación: ( ) ( )( ) donde k depende sólo de gl, es decir de los grados de libertad, 2 es ji cuadrada, y es la base de los logaritmos naturales. No se tratará el desarrollo de la ecuación anterior, sino que se hará referencia a las características de 2 que permitirán su aplicación para la inferencia estadística. Estas características son las siguientes: 1') 2 es una variable aleatoria que no puede asumir valores negativos. 2') La distribución 2 tiene un sólo parámetro: los grados de libertad (gl). 3') La distribución 2 es continua y unimodal. Al igual que z y t, el área bajo la curva 2 representa probabilidades. 4') La distribución 2 tiene sesgo a la derecha. A medida que aumenta gl, el sesgo es menor, y se aproxima a una distribución normal. 5') La media de 2 está dada por los grados de libertad, E (2) = gl. La varianza es el doble de los grados de libertad, Var (2) = 2 gl. 6') La ecuación representa una familia de distribuciones. Hay una distribución diferente para cada grado de libertad. Uso de las tablas de Ya se estableció que la curva 2 representa probabilidades. Para cada posible valor de gl puede construirse una tabla de probabilidades. No obstante, puede utilizarse la tabla 2. Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 2 PROBABILIDAD Y ESTADÍSTICA La tabla muestra los valores críticos 2 que se denota por 2 (gl,α). El subíndice tiene dos números, gl indica los grados de libertad y α indica el porcentaje cortado bajo la cola superior de la distribución. Las probabilidades más comúnmente utilizadas se consignan en el encabezamiento de la tabla, siendo representadas por el área de la cola superior de la curva. En la columna izquierda se muestran los grados de libertad. El valor por una gl y para una probabilidad dada constituye el valor crítico 2 que corta la cola superior (o lado derecho) bajo la curva. Por ejemplo el valor 2 que corta el 5% de la distribución con 8 grados de libertad es: 2(8,0,05) = 15,507 Aplicaciones de Existen problemas donde deben realizarse inferencias acerca de la distribución de toda una población en base a observaciones muestrales donde las hipótesis de las pruebas no son aseveraciones acerca del parámetro de una población, sino verificar hipótesis tales como “una moneda es regular” o “las variables desempeño e instrucción son independientes”. Los datos son categorizados y los resultados se muestran en forma de conteo. Por ejemplo, los salarios de los empleados de una compañía representados a través de una tabla de frecuencias. Cada frecuencia se anota en una celda o clase. Las frecuencias observadas de la muestra se denotan por f01 f02, ....f0n. La suma de todas las frecuencias observadas es igual al tamaño de la muestra, o sea: f01 + f02 + .... + f0n = n Estos valores observados, se comparan con frecuencias esperadas o teóricas fe1, fe2 + ... + fen que se obtienen de distribuciones teóricas específicas, también en este caso: fe1 + fe2 + .... + f en = n La prueba consiste en determinar si las frecuencias observadas concuerdan o discrepan con las esperadas. El estadístico de prueba es: ∑ ( ) El numerador es la diferencia al cuadrado, la cual sólo puede tomar valores positivos. Mientras menor sea la diferencia, menor será el valor de 2. Los valores pequeños de 2 indican concordancia, mientras que los valores grandes indican discrepancia, entre los dos conjuntos frecuencias. Debe observarse que es común que estas pruebas son de una sola cola. Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 3 PROBABILIDAD Y ESTADÍSTICA Los valores calculados del estadístico de prueba2 se basan en datos discretos, pero la distribución 2 es continua. Si las fe son grandes, la distribución del estadístico de prueba puede aproximarse a la distribución de 2. Una regla práctica es que la fe para cada clase debe ser por lo menos 5. Las categorías que no cumplen este criterio deben combinarse con otras adyacentes cuando sea posible. El estadístico de prueba se utiliza para las pruebas de bondad de ajuste, de independencia y de homogeneidad. La distribución 2 también se utiliza para probar el valor de un parámetro, como es “la prueba de la varianza”. Prueba para la bondad de ajuste En esta prueba, H0 especifica una distribución uniforme (todos los valores posibles de una variable aleatoria son igualmente probables), binomial, Poisson, etc. Se elige una muestra y se prueba si la distribución muestral sigue a la distribución teórica especificada en H 0. La hipótesis alternativa afirma que la muestra no ha sido tomada de la distribución específica. La prueba implica n observaciones que se clasifican en k clases o categorías, donde en cada celda se anotan las frecuencias observadas que se comparan con las esperadas a través de los cálculos, utilizando el estadístico de prueba de 2. El valor que se requiere de la estadística 2 para rechazar o aceptar H0 depende del nivel de significación y de los grados de libertad (gl). Para la prueba de bondad de ajuste, los grados de libertad son iguales al número de categorías o clases menos 1, es decir: gl = k - 1 (32) Si el valor del estadístico de prueba es mayor o igual al valor crítico se dice que el ajuste es malo y se rechaza H 0. Si el valor 2 es pequeño, se dice que el ajuste es bueno y se acepta H 0. Ejemplo: Una empresa dedicada a estudios de mercados está interesada en las preferencias de las amas de casa de 4 zonas de la ciudad respecto a una marca de arroz. Selecciona una muestra al azar de 200 amas de casas con los siguientes resultados: ZONA A B C D TOTAL Preferencias (fo) 35 43 64 58 200 Estas preferencias constituyen las frecuencias observadas. Bajo la hipótesis de que p A = pB = pC = pD todas estas probabilidades son iguales a 1/4. Entonces las frecuencias esperadas son cada una igual a 50 (1/4.200). Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 4 PROBABILIDAD Y ESTADÍSTICA Planteando las hipótesis: H0: Las preferencias están distribuidas de manera uniforme en las cuatro zonas. H1: Las preferencias no están distribuidas de manera uniforme en las cuatro zonas. Las categorías son 4, por lo tanto los grados de libertad son 3, ya que: k = 4 gl = k - 1 gl = 4 - 1 = 3 Utilizando un nivel de significación del 5%, el valor crítico con 3 grados de libertad es: 2(3,0,05) = 7,814 Rechazar H0 si 2 es mayor o igual a 7,814. Los cálculos para obtener 2 se muestran a continuación: ( Zona ) ( ) A 35 50 -15 225 4,5 B 43 50 -7 49 0,98 C 64 50 14 196 3,92 D 58 50 8 64 1,28 10,68 ∑ ( ) Como 2 es mayor que 7,814, se rechaza H 0 es decir no hay uniformidad en las preferencias en las 4 zonas. En el cálculo de las frecuencias teóricas, puede haber restricciones adicionales. Si la media de la muestra X se utiliza para estimar para obtener las frecuencias esperadas, esta restricción reduce el número de grados de libertad en 1. En general, si hay m estimaciones muestrales utilizadas para m parámetros desconocidos en el cálculo de frecuencias teóricas, el número de grados de libertad está aún más reducido por m, es decir: gl = k - 1 - m Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 5 PROBABILIDAD Y ESTADÍSTICA Test de Independencia En los tests de independencia existen dos variables categóricas y la prueba consiste en suponer que ambas variables son estadísticamente independientes. La independencia implica saber que la categoría en la que se clasifica una observación con respecto a una variable, no tiene ningún efecto sobre la probabilidad de caer también en alguna de las diversas categorías de las otras variables5. Dicho de otra manera, el problema es determinar si existe alguna relación entre dos conjuntos de atributos de una población. La prueba de independencia tiene una metodología parecida a la prueba de bondad de ajuste. La misma se explicará con el siguiente problema: En una empresa se desea conocer si hay alguna relación entre la asistencia de los empleados y el sexo. La asistencia se clasifica en “satisfactoria” (S) y “no satisfactoria” (NS). Para la prueba se toma una muestra de 100 empleados. 1') Planteo de Hipótesis H0: Sexo y Asistencia son variables independientes. H1: Sexo y Asistencia son variables dependientes. 2') Las frecuencias observadas de la muestra se anotan en una tabla de contingencia (o de clasificación doble) de dimensión r . k, donde: r = el número de renglones. k = el número de columnas. Sexo V M Total S 45 25 70 NS 15 15 30 Total 60 40 100 Asistencia La tabla tiene dos categorías de renglón (V y M) y dos de columnas (S y NS), por lo tanto es una tabla de 2 x 2. 3') Las f0 deben compararse con las frecuencias esperadas. La f e de cada celda de la tabla debe ser proporcional al total de f 0 es la frecuencia total del renglón y fk es la frecuencia total de la columna, la frecuencia esperada se determina como: Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 6 PROBABILIDAD Y ESTADÍSTICA ∑ La tabla de frecuencias esperadas para el problema del ejemplo queda confeccionada así: Sexo V M Total S 42 28 70 NS 18 12 30 Total 60 40 100 Asistencia La fe de la primera celda (S y V) se obtiene: ( )( ) 4') Los grados de libertad para la prueba de independencia se determinan por la siguiente fórmula: ( )( ) Para este problema r = 2 y k = 2 ( ) ( ) 5') Si se usa a = 0,05, el valor crítico es: , por lo tanto la regla de decisión es: ( ) Rechazar H0 si 3,841 Aceptar H0 si < 3,841 6') El estadístico de prueba es el mismo que se utilizó para la bondad de ajuste o sea: ( ) ∑ En este caso, se eleva el cuadrado la diferencia entre f0 y fe de cada celda y se divide entre la fe de dicha celda. ( ) ( ) ( ) ( ) = 1,786 es menor que el valor crítico. Se aceptar H 0 y se demuestra que la asistencia y el sexo son independientes, es decir no hay ninguna relación. Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 7 PROBABILIDAD Y ESTADÍSTICA Prueba de Homogeneidad Esta prueba para es una extensión del test de independencia donde también se trabaja con datos clasificados cruzadamente y se utiliza el mismo estadístico de prueba. Las diferencias entre ambas pruebas son las siguientes: 1) Las pruebas de independencia tienen como objetivo decidir si dos variables son independientes, mientras que las pruebas de homogeneidad se aplican cuando se desea saber si diferentes muestras provienen de la misma población. 2) El test de independencia supone una sola muestra obtenida de una sola población; la prueba de homogeneidad suponen dos o más muestras independientes, donde cada una procede de cada una de las poblaciones distintas bajo estudio. 3) El aspecto anterior implica que en la prueba de independencia, todas las frecuencias marginales son cantidades al azar, mientras que en el criterio de homogeneidad, los totales de los renglones (o filas) son tamaños de muestras que son números elegidos. Considérese el siguiente problema. Los técnicos de un establecimiento que fabrica fiambres y embutidos deben decidir la adopción de un nuevo proceso para elaborar jamón cocido tipo A. Eligen 200 piezas obtenidas mediante el proceso nuevo y 200 mediante el proceso tradicional. Los resultados son: Piezas Proceso (1) Defectuoso (2) Buenas Total Nuevo (a) 22 178 200 Tradicional (b) 36 164 200 Total 58 342 400 La hipótesis nula puede plantearse como que las dos muestras proceden de la misma población, es decir que las dos clasificaciones son homogéneas en lo que respecta al estado de las piezas. Esto significa que no hay diferencia entre los dos métodos. S se define: p1a: probabilidad de nuevo y defectuoso p2a: probabilidad de nuevo y buena p1b: probabilidad de tradicional y defectuosa p2b: probabilidad de tradicional y buena. Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 8 PROBABILIDAD Y ESTADÍSTICA { Con la expresión alternativa de H0 se puede determinar porque se denomina homogeneidad. Al decir homogéneas se entiende que las cosas son iguales o tiene algo en común. Ahora, se estiman las proporciones de defectuosas y buenas, es decir: 58/400 y 342/400. Las frecuencias esperadas, por ejemplo, para el método nuevo son: ( ) ( ) Las frecuencias esperadas se muestran en el siguiente cuadro: Piezas (1) Defectuoso Proceso Total (2) Buenas Nuevo (a) 29 171 200 Tradicional (b) 29 171 200 Total 58 342 400 En resumen: { H1: alguna igualdad no se cumple. Los métodos son diferentes. Los grados de libertad son: ( )( ) ( )( ) Si = 0,01, entonces el valor crítico de Rechazar H0 si 6,634 Aceptar H0 si < 6,634 6,634, por lo tanto: Aplicando el estadístico de prueba: ∑ ( ) ( ) ( ( ) ) ( ) Se acepta H0. Prof. Adj. Mónica G. Osuna – Profesorado en Matemática 9