CIENCIAS BIOLÓGICAS 5º CURSO MODELOS LINEALES EN BIOLOGÍA Práctica nº 4 Contrastes sobre una muestra con SPSS PRÁCTICA 4.- Contrastes sobre una muestra con SPSS 4.1.- Contrastes sobre la media de una variable aleatoria Normal. Partiendo de una variable N(;2), se pueden realizar contrastes del tipo: H0 : 0 H1 : 0 se resuelven tomando una muestra y comprobando si el estadístico: x 0 z exp , que sigue una distribución N(0:1) tiene un valor comprendido dentro del intervalo de 2 n aceptación: C0=(-z/2; z/2) , para un nivel de significación Si la varianza poblacional no es conocida, se estima con la cuasivarianza y el estadístico de contraste sigue una distribución t de Student con n-1 grados de libertad. x 0 t exp ,la región de aceptación es : C0=(-t/2; t/2) , para un nivel de significación 2 s n 4.2.- P-Valor Si pudiésemos disponer de todas las posibles distribuciones t con toda precisión, podríamos construir una región de aceptación con un nivel de significación, por ejemplo, de 0.179, si fuese el caso. Los paquetes estadísticos suelen proceder de este segundo modo al realizar un contraste, a partir del estadístico de contraste, texp y su simétrico, determinan el área bajo las dos colas de una t de Student, es el denominado P-Valor. Si la región crítica tuviese por extremos las cantidades experimentales, el nivel de significación es el P-Valor, es decir, el P-Valor es la probabilidad de cometer error de tipo I que estaremos dispuestos a correr si rechazamos la hipótesis nula, por eso, si P-Valor es mayor que 0.05, aceptamos H0 a un nivel de significación del 5%. El P-Valor también puede ser contemplado como la probabilidad de obtener un estadístico experimental igual o más raro (desde el punto de vista de la hipótesis nula) que el hallado, en valor absoluto, si el contraste es bilateral, o con su signo si fuese unilateral. La información proporcionada por el P-Valor es mejor que la que proporciona el nivel de significación, pues nos dice con absoluta precisión cuál es la significación del contraste. 4.3.- Contrastes sobre la media de una variable aleatoria no Normal. Aunque la variable de partida no fuese normal, sabemos que la media muestral sigue una distribución aproximadamente Normal, de media la poblacional y varianza la poblacional entre el tamaño de la muestra. El parecido entre la distribución que siga la media muestral y la distribución normal correspondiente es tanto mayor cuanto mayor sea el tamaño de la muestra. Si las muestras son de tamaño superior a 60, la aproximación es suficientemente buena y aunque no se conozca la varianza poblacional, el estadístico de contraste es : x 0 z exp y la región de aceptación la: C0: C0=(-z/2; z/2) , para un nivel de significación , pues, 2 s n aunque se estime la varianza poblacional, la falta de normalidad hace que la distribución no sea un t, sino que se aproxima más a una normal. No obstante, la mayoría de los programas estadísticos realizan el contraste a partir de la t de Student, como si se tratase de una variable Normal, a lo sumo se podrá realizar un contraste de Normalidad , SPSS realiza el de Shapiro-Wilk y el de Kolmogorov si las muestras son de menos de 50 datos, para muestras mayores solo realiza este último. Somos nosotros quienes debemos interpretar los resultados, teniendo en Práctica 6, página, 1 cuenta que una región de aceptación basada en una t es siempre más amplia que la basada en la Normal, lo que producirá un nivel de significación menor que el que se desea. 4.4.- Otros contrastes sobre una muestra. Además del contraste sobre la media, SPSS puede realizar varios contrastes de Normalidad, el de mayor potencia es el de Shapiro-Wilk, que efectúa el programa por defecto cuando se selecciona el menú Statistics, Sumarize, Explore, al pulsar el botón Plots en este último cuadro de diálogo, se abre un nuevo cuadro en el que se puede seleccionar una casilla de verificación que hará que el programa realice los tests de Normalidad. El test de Shapiro-Wilk solo se realiza si la muestra es de menos de 50 datos, mientras que el de Kolmogorov se realiza para cualquier tamaño de muestra. También se puede realizar el contraste de Kolmogorov-Smirnov ejecutando la orden Nonparametrics tests del menú Statistics, opción 1 Sample K-S. Existen otros contrastes sobre una muestra, tanto paramétricos: Bondad de ajuste, como no paramétricos: Test de signos y de rangos con signo, que no se verán aquí. Actividades correspondientes a esta práctica: Se proporcionan tres ficheros con formato SPSS, son los llamados tallas.sav; contamina.sav y suspensos.sav, son datos correspondientes a los ejemplos de los apuntes de teoría, se trata de realizar los siguientes contrastes: Fichero Tallas: Abra el fichero y realice un análisis exploratorio previo, que incluya un contraste de Normalidad (Statistics-Sumarize-Explore-Plots-Normality tests with plots) sobre cada una de las tres columnas que se incluyen. Conteste a las siguientes cuestiones: Media Extremos del IC 95% Inferior Superior Mediana CuasiVar. CuasiDTa Kolmogorov Estadístico P-valor Muestra 1 Muestra 2 Muestra 3 Comente la forma: simetría y apuntamiento de los histogramas Muestra 1 Muestra 2 Muestra 3 Práctica 6, página, 2 Comente los Boxplots Indique si hay presencia de Outliers en cada una de las tres muestras Realice test t (Statistics-Compare Means- One sample t test) sobre cada una de las tres muestras, imponga como hipótesis nula (Test value) que la media sea 170. Conteste a las siguientes cuestiones: Condición previa: en relación al tipo de Test, el tamaño de la muestra y los supuestos requeridos para su realización, ¿Es aplicable este tipo de contraste? Justifique su respuesta. Plantee el contraste: Hipótesis nula: Hipótesis alternativa: Resultados: Muestra 1 Muestra 2 Muestra 3 Media: Cuasidesviación típica: Estadístico de contraste: P-valor o valor crítico del contraste (significance): Conclusión del test: Conteste a las dos últimas filas de esta tabla si el contraste fuese unilateral. Plantee y resuelva con estas muestras los dos tipos de contrastes unilaterales posibles. Contraste: Muestra 1 Muestra 2 Muestra 3 Muestra 1 Muestra 2 Muestra 3 P-valor o valor crítico del contraste (significance): Conclusión del test: Contraste: P-valor o valor crítico del contraste (significance): Conclusión del test: Práctica 6, página, 3 Fichero Contamina: Repita el proceso realizado en el fichero Tallas, contestando a las mismas preguntas. Realice el test t para la hipótesis nula de que la media sea 15. Fichero Suspensos: Igual que el anterior, realice además un diagrama de sectores (menú Graph Pie) BIBLIOGRAFÍA: MARTÍN ANDRÉS, A. Y LUNA DEL CASTILLO, J. D.: Bioestadística para ciencias de la Salud. 4ª Edición. Ediciones Norma. Madrid, 1994. MILTON, J.S.: Estadística para Biología y Ciencias de la Salud, 2ª Edición. Interamericana-McGraw Hill. Madrid, 1994. STEEL R.G.D., J.H. TORRIE.: Bioestadística: Principios y procedimientos. Mc Graw-Hill, México, 1986. WALPOLE, R.E.Y MYERS, R.H. . Probabilidad y Estadística. McGraw Hill, México, 1992. Práctica 6, página, 4