LAS PRUEBAS PARAMÉTRICAS 1. Se conoce el modelo de distribución de la población objeto de estudio y se desconoce un número finito de parámetros de dicha distribución que hay que estimar con los datos de la muestra. 2. Requieren conocer la distribución de la muestra para poder realizar inferencias sobre la población. LAS PRUEBAS NO PARAMÉTRICAS 1. Son métodos de distribución libre. No requieren conocer la distribución de la muestra. 2. Se utilizan estadísticos cuya distribución se determina con independencia de cuál sea la distribución de la población. web: http://www.uv.es/friasnav/ 1 LAS PRUEBAS NO PARAMÉTRICAS: ¿Para qué se utilizan? 1. Son una alternativa a las pruebas paramétricas cuando los datos no cumplen los requisitos de las pruebas paramétricas. 2. Permiten conocer cómo es la forma de la distribución de la población de la que se ha extraído la muestra. Contrastes de Bondad de Ajuste para conocer la forma de la población que ha originado la muestra. Las pruebas de bondad de ajuste se utilizan para contrastar si los datos de la muestra pueden considerarse que proceden de una determinada distribución. web: http://www.uv.es/friasnav/ 2 SUPUESTOS DE LAS PRUEBAS PARAMÉTRICAS 1. Normalidad. Las observaciones se extraen de poblaciones distribuidas según la Normal para cada grupo. Pruebas de bondad de ajuste. 2. Homocedasticidad. Las varianzas de los diferentes grupos tienen que ser iguales. Homogeneidad de varianzas. El numerador y el denominador de la prueba F son estimaciones de la misma varianza poblacional. Prueba de Levéne. Supuesto de esfericidad respecto a la homogeneidad de varianzascovarianzas según la prueba de Mauchley. 3. Respecto a los errores: 1. Los errores son independientes entre sí. 2. Se distribuyen según na Normal dentro de cada población del grupo N(0, σ2). Es decir, con media cero y varianzas equivalentes. 3. La ecuación estructural del modelo refleja una composición aditiva de las fuentes de variación. web: http://www.uv.es/friasnav/ 3 ACTUACIONES. TOMA DE DECISIONES Cuando se tengan unos datos hay que comprobar en primer lugar los supuestos de las pruebas paramétricas. En concreto se analizará en primer lugar si los datos de la variable tienen una distribución normal. Para ello se utilizarán gráficos y pruebas de contraste de la normalidad. Actuaciones: 1. Si se acepta la normalidad de las observaciones entonces se aplicará el contraste paramétrico adecuado para la hipótesis. 2. Si se rechaza la normalidad de las observaciones entonces se optará por aplicar pruebas no paramétricas donde los test se plantean sobre la mediana de la distribución: 1. Test de los rangos signos de Wilcoxon para una muestra. Contrasta la mediana de la muestra con la mediana poblacional. También permite contrastar la mediana de dos muestras pareadas. 2. Test U de Mann-Whitney para muestras independientes 4 web: http://www.uv.es/friasnav/ Pruebas de bondad de ajuste Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se ajustan a una determinada distribución. Pruebas de Normalidad: -pruebas gráficas basadas en gráficos de normalidad como Q-Q plots. -Test de Kolmogorov –Smirnov de bondad de ajuste. Es válido sólo para variables aleatorias continuas. - Test de Lillefors. Es el Test de Kolmogorov –Smirnov con la corrección de Lillefors. Sus valores son menores que los de Kolmogorov. -Prueba de Shapiro-Wilks. Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del estadístico y el valor p de probabilidad del contraste. Se rechaza H0 si el valor p de probabilidad es menor que el nivel de significación elegido para ejecutar la prueba de contraste estadístico. web: http://www.uv.es/friasnav/ 5 DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES Evaluar mediante inspección visual la normalidad de las puntuaciones Los gráficos ayudan al investigador a juzgar si sus datos proceden de una distribución normal. Por ejemplo, si los datos proceden de una distribución normal cabe esperar que la distribución no tendrá una fuerte asimetría. Sin embargo, con pocos datos no es fácil obtener conclusiones consistentes y de ahí que se hayan ideado gráficos concretos para observar la normalidad de las puntuaciones de una variable. web: http://www.uv.es/friasnav/ 6 Gráficos para observar la normalidad de las puntuaciones de una variable: -Gráficos de probabilidad normal P-P plots -Gráficos de cuantiles normales Q-Q plots Estos gráficos trabajan con los datos estandarizados y ordenados. Cuando los datos se representan frente a los datos esperados de una distribución N (0, 1) se deben obtener puntos alineados en la diagonal de un cuadro. web: http://www.uv.es/friasnav/ 7 DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES Histograma Gráfico de caja Gráfico Q-Q Observar la simetría de la distribución Evaluar mediante inspección visual la normalidad de las puntuaciones web: http://www.uv.es/friasnav/ 8 SPSS: Gráficos con pruebas de normalidad: ANALIZAR--ESTADÍSTICOS DESCRIPTIVOS-EXPLORAR web: http://www.uv.es/friasnav/ 9 Se puede seleccionar solamente ESTADÍSTICOS, solamente GRÁFICOS o que el SPSS ofrezca AMBOS (estadísticos y gráficos) en su salida de resultados. web: http://www.uv.es/friasnav/ 10 web: http://www.uv.es/friasnav/ 11 Asimetría de la distribución ASIMETRÍA POSITIVA Examen difícil, Salarios, Tiempo de Reacción Asimetría positiva: concentración de casos en los valores inferiores de la distribución y cola extendida hacia los valores grandes. ASIMETRÍA NEGATIVA Examen fácil Asimetría negativa: concentración de casos en los valores altos y cola alargada hacia los valores inferiores de la distribución. web: http://www.uv.es/friasnav/ 12 Asimetría de la distribución web: http://www.uv.es/friasnav/ 13 web: http://www.uv.es/friasnav/ 14 web: http://www.uv.es/friasnav/ 15 Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD La aplicación de la prueba de normalidad muestra dos gráficos: (1) Normal Probability Plot: (gráfico Q-Q) donde a cada valor observado se le empareja con su valor esperado, procedente éste último de una distribución normal. Si la muestra es extraída de una población normal ambos valores se encontrarán en la misma línea recta. web: http://www.uv.es/friasnav/ 16 Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD Normal Probability Plot. Gráfico Q-Q --Se representan los cuantiles empíricos obtenidos en la muestra frente al cuantil correspondiente en la distribución Normal. --Si el gráfico muestra una relación cercana a una línea recta entonces se ‘sugiere’ que los datos proceden de una distribución Normal. web: http://www.uv.es/friasnav/ 17 Normal Probability Plot . Gráfico Q-Q Cuando la distribución observada en las puntuaciones se ajusta a la teórica entonces los puntos se representan en línea recta en la diagonal. Si el ajuste no es bueno entonces la distribución de las puntuaciones adopta otras formas: A. Asimétrica a la derecha B. Asimétrica a la izquierda C. Leptocúrtica web: http://www.uv.es/friasnav/ D. Platicúrtica 18 web: http://www.uv.es/friasnav/ 19 Evaluar utilizando la prueba de significación la normalidad de las puntuaciones GRÁFICOS CON PRUEBA DE NORMALIDAD (2) Detrended Normal Plot donde se muestran las desviaciones de los puntos con relación a una línea recta. Si la muestra ha sido extraída de una población normal los puntos deben situarse alrededor de una línea horizontal con el origen en el punto .00. web: http://www.uv.es/friasnav/ 20 web: http://www.uv.es/friasnav/ 21 Inspección visual descriptiva Gráfico de caja y bigotes Límite Superior: por encima de ese límite las puntuaciones se consideran atípicas (outliers) Q3= Tercer cuartil Mediana 50% de las puntuaciones Límite Inferior: por debajo de ese límite las puntuaciones se consideran atípicas (outliers) 95% de las puntuaciones Q1= Tercer cuartil web: http://www.uv.es/friasnav/ 22 Inspección visual descriptiva Gráfico de caja y bigotes --Asimetría positiva: la mediana está más cerca de la parte inferior de la caja. --Asimetría negativa: la mediana está más cerca de la parte superior de la caja. Cuanto más larga sea la caja y los bigotes mayor variabilidad tienen los datos web: http://www.uv.es/friasnav/ 23 Gráficos de distribución Las principales ventajas son la sencillez de interpretación, la extensión a cualquier tipo de distribución y, en el caso de la distribución normal, la facilidad de obtener el diagrama ya que está implementado en muchos paquetes estadísticos. Además, no requieren muestras tan numerosas como algunos tests de normalidad. El principal inconveniente es la subjetividad de la interpretación visual, ya que al contrario de los tests de normalidad numéricos no se concluye con una “p “ de probabilidad objetiva. web: http://www.uv.es/friasnav/ 24 Pruebas de significación para contrastar la hipótesis de la normalidad de las puntuaciones de la población (variables aleatorias continuas): Kolmogorov-Smirnov, Corrección de Lilliefors y Shapiro Wilks Los gráficos orientan sobre la procedencia o no de la muestra de una población normal. Sin embargo, es posible trabajar con una prueba estadística que certifique la normalidad o no de las variables. web: http://www.uv.es/friasnav/ 25 Queremos contrastar, para un determinado nivel de confianza, la hipótesis nula de que los datos proceden de una población con distribución normal. Hipótesis Nula H0: es que el conjunto de datos siguen una distribución normal. Hipótesis Alternativa H1: es que el conjunto de datos no sigue una distribución normal. Si el valor del estadístico supera un determinado valor, que depende del nivel de significación con el que se quiera rechazar la hipótesis nula, entonces esa colección de datos no se distribuye según una distribución normal. web: http://www.uv.es/friasnav/ 26 Lillierfors tabuló el estadístico de Kolmogorov-Smirnov para el caso más habitual en el que desconocemos la media y la varianza poblacional y se estiman a través de los datos muestrales. ----El SPSS utiliza esta prueba modificada. Los valores críticos se obtienen aplicando la corrección de significación propuesta por Lilliefors. No utilizaremos el de Kolmogorov-Smirnov sin la corrección de Lilliefors por resultar muy conservador (en casi todas las ocasiones se mantiene H0) web: http://www.uv.es/friasnav/ 27 Sin corrección de Lilliefors. SPSS: Pruebas No paramétricas—K-S de una muestra web: http://www.uv.es/friasnav/ 28 El estadístico de prueba Kolmogorov-Smirnov (KS68 =0.155, p<0.001) con la corrección de Lilliefors presenta un nivel de significación igual a <0,001. En consecuencia se rechaza la hipótesis de normalidad. ACTUACIÓN: Es necesario realizar alguna transformación a la variable ya que no se cumple el supuesto de normalidad de las observaciones de la variable medida. web: http://www.uv.es/friasnav/ 29 TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica El SPSS permite realizar diversas transformaciones de la variable. 1. En primer lugar, debemos recordar que el test K-S nos indicaba si era o no necesaria la transformación. 2. En segundo lugar, los gráficos de “tallos y hojas” y/o “cajas con bigotes” representan la dirección de la simetría y, por lo tanto, indican el tipo de transformación que es más adecuada. Las transformaciones se realizan en función de tipo de asimetría de la distribución. Tukey ofrece lo que él llama la “Escalera de las transformaciones”, donde muestra el tipo de transformación recomendada según sea la intensidad de la asimetría o la direcciónweb:enhttp://www.uv.es/friasnav/ la que van los casos extremos.30 TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica Escalera de las transformaciones: Si la distribución es ASIMÉTRICA POSITIVA: es conveniente utilizar 1-raíces cuadradas, 2-logaritmos… La corrección de la asimetría positiva será aún mayor con los logaritmos. Si la distribución es ASIMÉTRICA NEGATIVA: 1-elevar al cuadrado (X2) o 2-al cubo (X3). La corrección de los datos será mayor cuanto mayor es la exponenciación. Las transformaciones más comunes son el logaritmo (ln), la raíz cuadrada (SQRT) y potencias (**potencia deseada) web: http://www.uv.es/friasnav/ 31 TRANSFORMACIONES DE LA VARIABLE SPSS web: http://www.uv.es/friasnav/ 32 TRANSFORMACIONES DE LA VARIABLE Objetivo: que la variable adopte una distribución normal o, al menos, simétrica --La escalera de transformación de Tukey es orientativa pero es una “guía”. --Muy raramente se conseguirá la normalidad con la primera transformación. Serán necesarias varias. Después de cada transformación se ejecutan de nuevo los análisis de bondad de ajuste. --Conviene tener en cuenta que con variables que muestran una distribución próxima a la normalidad la aplicación de las transformaciones puede provocar hacerlas más asimétricas. Cuando esto ocurre lo más conveniente es trabajar con los datos de la variable original. web: http://www.uv.es/friasnav/ 33 DATOS BRUTOS AL CUADRADO AL CUBO LOGARITMO NO web: http://www.uv.es/friasnav/ 34 El estadístico W de Shapiro-Wilks mide la fuerza del ajuste con una recta. Cuanto mayor sea el valor de este estadístico mayor desacuerdo habrá con la recta de normalidad, por lo que se rechazrá la hipótesis nula. Para muestras pequeñas (entorno a 50 observaciones) se recomienda Shapiro. Para muestras mayores se recomienda Kolmogorov con la corrección de Lilliefors. web: http://www.uv.es/friasnav/ 35 Ejercicios: Fuente: http://ocw.usal.es/ciencias-sociales-1/control-estadistico-de-la-calidad/materiales-de-clase/ web: http://www.uv.es/friasnav/ 36 Analizar la variable de Valoración con el SPSS. Examinar su ajuste a la distribución normal. Realizar algún tipo de transformación si fuese necesario. Redactar los resultados. Para el informe de investigación: BaseInformeESTAD.sav -Buscar el modelo teórico que puede representar el proceso de aprendizaje de la estadística para plantear las hipótesis teóricas en el apartado 37Introducción. -Comprueba en los análisis la normalidad de la variable y la homogeneidad de las varianzas de los grupos. -Analiza e interpreta los estadísticos descriptivos que consideres de las variables que se utilizan como variables dependientes. -Estudiar la relación entre las calificaciones y la valoración sobre la confianza en la solución de la pregunta. -Analizar la relación entre aprobados y suspensos y la valoración sobre la confianza en la solución de la pregunta. -Estudiar la relación entre el sexo y las notas académicas. -Haz una interpretación conjunta de todos los datos en el apartado de Discusión web: http://www.uv.es/friasnav/ 37