LAS PRUEBAS PARAMÉTRICAS 1. Se conoce el modelo de

Anuncio
LAS PRUEBAS PARAMÉTRICAS
1. Se conoce el modelo de distribución de la población objeto
de estudio y se desconoce un número finito de parámetros de
dicha distribución que hay que estimar con los datos de la
muestra.
2. Requieren conocer la distribución de la muestra para poder
realizar inferencias sobre la población.
LAS PRUEBAS NO PARAMÉTRICAS
1. Son métodos de distribución libre. No requieren conocer la
distribución de la muestra.
2. Se utilizan estadísticos cuya distribución se determina con
independencia de cuál sea la distribución de la población.
web: http://www.uv.es/friasnav/
1
LAS PRUEBAS NO PARAMÉTRICAS: ¿Para qué se utilizan?
1. Son una alternativa a las pruebas paramétricas cuando los
datos no cumplen los requisitos de las pruebas paramétricas.
2. Permiten conocer cómo es la forma de la distribución de la
población de la que se ha extraído la muestra. Contrastes de
Bondad de Ajuste para conocer la forma de la población que ha
originado la muestra.
Las pruebas de bondad de ajuste se utilizan para contrastar si los
datos de la muestra pueden considerarse que proceden de una
determinada distribución.
web: http://www.uv.es/friasnav/
2
SUPUESTOS DE LAS PRUEBAS PARAMÉTRICAS
1. Normalidad. Las observaciones se extraen de poblaciones
distribuidas según la Normal para cada grupo. Pruebas de
bondad de ajuste.
2. Homocedasticidad. Las varianzas de los diferentes grupos
tienen que ser iguales. Homogeneidad de varianzas. El
numerador y el denominador de la prueba F son estimaciones
de la misma varianza poblacional. Prueba de Levéne. Supuesto
de esfericidad respecto a la homogeneidad de varianzascovarianzas según la prueba de Mauchley.
3. Respecto a los errores:
1. Los errores son independientes entre sí.
2. Se distribuyen según na Normal dentro de cada población
del grupo N(0, σ2). Es decir, con media cero y varianzas
equivalentes.
3. La ecuación estructural del modelo refleja una composición
aditiva de las fuentes de variación.
web: http://www.uv.es/friasnav/
3
ACTUACIONES. TOMA DE DECISIONES
Cuando se tengan unos datos hay que comprobar en primer lugar
los supuestos de las pruebas paramétricas. En concreto se
analizará en primer lugar si los datos de la variable tienen una
distribución normal. Para ello se utilizarán gráficos y pruebas de
contraste de la normalidad.
Actuaciones:
1. Si se acepta la normalidad de las observaciones entonces se
aplicará el contraste paramétrico adecuado para la hipótesis.
2. Si se rechaza la normalidad de las observaciones entonces se
optará por aplicar pruebas no paramétricas donde los test se
plantean sobre la mediana de la distribución:
1. Test de los rangos signos de Wilcoxon para una muestra.
Contrasta la mediana de la muestra con la mediana
poblacional. También permite contrastar la mediana de dos
muestras pareadas.
2. Test U de Mann-Whitney
para muestras independientes 4
web: http://www.uv.es/friasnav/
Pruebas de bondad de ajuste
Las pruebas de bondad de ajuste tienen por objetivo determinar si los datos se
ajustan a una determinada distribución.
Pruebas de Normalidad:
-pruebas gráficas basadas en gráficos de normalidad como Q-Q plots.
-Test de Kolmogorov –Smirnov de bondad de ajuste. Es válido sólo
para variables aleatorias continuas.
- Test de Lillefors. Es el Test de Kolmogorov –Smirnov con la corrección
de Lillefors. Sus valores son menores que los de Kolmogorov.
-Prueba de Shapiro-Wilks.
Cuando se ejecutan las pruebas con el SPSS se obtiene el valor del
estadístico y el valor p de probabilidad del contraste. Se rechaza H0
si el valor p de probabilidad es menor que el nivel de significación
elegido para ejecutar la prueba de contraste estadístico.
web: http://www.uv.es/friasnav/
5
DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES
Evaluar mediante inspección visual la normalidad de las
puntuaciones
Los gráficos ayudan al investigador a juzgar si sus datos proceden
de una distribución normal. Por ejemplo, si los datos proceden de
una distribución normal cabe esperar que la distribución no tendrá
una fuerte asimetría.
Sin embargo, con pocos datos no es fácil obtener conclusiones
consistentes y de ahí que se hayan ideado gráficos concretos para
observar la normalidad de las puntuaciones de una variable.
web: http://www.uv.es/friasnav/
6
Gráficos para observar la normalidad de las puntuaciones de una
variable:
-Gráficos de probabilidad normal P-P plots
-Gráficos de cuantiles normales Q-Q plots
Estos gráficos trabajan con los datos estandarizados y ordenados.
Cuando los datos se representan frente a los datos esperados de
una distribución N (0, 1) se deben obtener puntos alineados en la
diagonal de un cuadro.
web: http://www.uv.es/friasnav/
7
DISTRIBUCIÓN NORMAL DE LAS PUNTUACIONES
Histograma Gráfico de caja
Gráfico Q-Q
Observar la simetría
de la distribución
Evaluar mediante inspección visual la normalidad de las
puntuaciones
web: http://www.uv.es/friasnav/
8
SPSS: Gráficos con pruebas de normalidad:
ANALIZAR--ESTADÍSTICOS DESCRIPTIVOS-EXPLORAR
web: http://www.uv.es/friasnav/
9
Se puede seleccionar solamente ESTADÍSTICOS, solamente GRÁFICOS o que el SPSS
ofrezca AMBOS (estadísticos y gráficos) en su salida de resultados.
web: http://www.uv.es/friasnav/
10
web: http://www.uv.es/friasnav/
11
Asimetría de la distribución
ASIMETRÍA POSITIVA
Examen difícil, Salarios, Tiempo de Reacción
Asimetría positiva: concentración de casos en los valores inferiores de
la distribución y cola extendida hacia los valores grandes.
ASIMETRÍA NEGATIVA
Examen fácil
Asimetría negativa: concentración de casos en los valores altos y cola
alargada hacia los valores inferiores de la distribución.
web: http://www.uv.es/friasnav/
12
Asimetría de la distribución
web: http://www.uv.es/friasnav/
13
web: http://www.uv.es/friasnav/
14
web: http://www.uv.es/friasnav/
15
Evaluar utilizando la prueba de significación la normalidad
de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD
La aplicación de la prueba de
normalidad muestra dos gráficos:
(1) Normal Probability Plot:
(gráfico Q-Q) donde a cada valor
observado se le empareja con su
valor esperado, procedente éste
último de una distribución
normal.
Si la muestra es extraída de una
población normal ambos valores
se encontrarán en la misma línea
recta.
web: http://www.uv.es/friasnav/
16
Evaluar utilizando la prueba de significación la normalidad
de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD
Normal Probability Plot. Gráfico Q-Q
--Se representan los cuantiles empíricos
obtenidos en la muestra frente al cuantil
correspondiente en la distribución Normal.
--Si el gráfico muestra una relación cercana a una
línea recta entonces se ‘sugiere’ que los datos
proceden de una distribución Normal.
web: http://www.uv.es/friasnav/
17
Normal Probability Plot . Gráfico Q-Q
Cuando la distribución observada en las puntuaciones se
ajusta a la teórica entonces los puntos se representan en
línea recta en la diagonal.
Si el ajuste no es bueno entonces la distribución de las
puntuaciones adopta otras formas:
A. Asimétrica
a la derecha
B. Asimétrica
a la izquierda
C. Leptocúrtica
web: http://www.uv.es/friasnav/
D. Platicúrtica
18
web: http://www.uv.es/friasnav/
19
Evaluar utilizando la prueba de significación la normalidad
de las puntuaciones
GRÁFICOS CON PRUEBA DE NORMALIDAD
(2) Detrended Normal Plot
donde
se
muestran
las
desviaciones de los puntos con
relación a una línea recta.
Si la muestra ha sido extraída de
una población normal los puntos
deben situarse alrededor de una
línea horizontal con el origen en
el punto .00.
web: http://www.uv.es/friasnav/
20
web: http://www.uv.es/friasnav/
21
Inspección visual descriptiva
Gráfico de caja y bigotes
Límite Superior: por encima de
ese límite las puntuaciones se
consideran atípicas (outliers)
Q3= Tercer cuartil
Mediana
50%
de las puntuaciones
Límite Inferior: por debajo de
ese límite las puntuaciones se
consideran atípicas (outliers)
95%
de las puntuaciones
Q1= Tercer cuartil
web: http://www.uv.es/friasnav/
22
Inspección visual descriptiva
Gráfico de caja y bigotes
--Asimetría
positiva:
la
mediana está más cerca de
la parte inferior de la caja.
--Asimetría negativa: la
mediana está más cerca de
la parte superior de la caja.
Cuanto más larga sea la caja y los bigotes mayor variabilidad tienen los datos
web: http://www.uv.es/friasnav/
23
Gráficos de distribución
Las principales ventajas son la sencillez de
interpretación, la extensión a cualquier tipo de
distribución y, en el caso de la distribución normal, la
facilidad de obtener el diagrama ya
que está implementado en muchos paquetes
estadísticos.
Además, no requieren muestras tan numerosas como
algunos tests de normalidad.
El principal inconveniente es la subjetividad de la
interpretación visual, ya que al contrario de los tests de
normalidad numéricos no se concluye con una “p “ de
probabilidad objetiva.
web: http://www.uv.es/friasnav/
24
Pruebas de significación para contrastar la hipótesis de la
normalidad de las puntuaciones de la población (variables aleatorias
continuas):
Kolmogorov-Smirnov,
Corrección de Lilliefors y
Shapiro Wilks
Los gráficos orientan sobre la procedencia o no de
la muestra de una población normal. Sin embargo,
es posible trabajar con una prueba estadística que
certifique la normalidad o no de las variables.
web: http://www.uv.es/friasnav/
25
Queremos contrastar, para un determinado nivel de confianza, la
hipótesis nula de que los datos proceden de una población con
distribución normal.
Hipótesis Nula H0:
es que el conjunto de datos siguen una distribución normal.
Hipótesis Alternativa H1:
es que el conjunto de datos no sigue una distribución normal.
Si el valor del estadístico supera un determinado valor,
que depende del nivel de significación con el que se
quiera rechazar la hipótesis nula, entonces esa colección
de datos no se distribuye según una distribución normal.
web: http://www.uv.es/friasnav/
26
Lillierfors tabuló el estadístico de Kolmogorov-Smirnov para el
caso más habitual en el que desconocemos la media y la varianza
poblacional y se estiman a través de los datos muestrales.
----El SPSS utiliza esta prueba modificada.
Los valores críticos se obtienen aplicando la corrección de
significación propuesta por Lilliefors.
No utilizaremos el de Kolmogorov-Smirnov sin la corrección de
Lilliefors por resultar muy conservador (en casi todas las ocasiones
se mantiene H0)
web: http://www.uv.es/friasnav/
27
Sin corrección de Lilliefors.
SPSS: Pruebas No paramétricas—K-S de una muestra
web: http://www.uv.es/friasnav/
28
El estadístico de prueba Kolmogorov-Smirnov (KS68
=0.155, p<0.001) con la corrección de Lilliefors presenta
un nivel de significación igual a <0,001. En consecuencia
se rechaza la hipótesis de normalidad.
ACTUACIÓN:
Es necesario realizar alguna transformación a la variable
ya que no se cumple el supuesto de normalidad de las
observaciones de la variable medida.
web: http://www.uv.es/friasnav/
29
TRANSFORMACIONES DE LA VARIABLE
Objetivo: que la variable adopte una distribución normal o, al
menos, simétrica
El SPSS permite realizar diversas transformaciones de la variable.
1. En primer lugar, debemos recordar que el test K-S nos indicaba
si era o no necesaria la transformación.
2. En segundo lugar, los gráficos de “tallos y hojas” y/o “cajas con
bigotes” representan la dirección de la simetría y, por lo tanto,
indican el tipo de transformación que es más adecuada.
Las transformaciones se realizan en función de tipo de
asimetría de la distribución.
Tukey ofrece lo que él llama la “Escalera de las
transformaciones”, donde muestra el tipo de
transformación recomendada según sea la intensidad de la
asimetría o la direcciónweb:enhttp://www.uv.es/friasnav/
la que van los casos extremos.30
TRANSFORMACIONES DE LA VARIABLE
Objetivo: que la variable adopte una distribución normal o, al
menos, simétrica
Escalera de las transformaciones:
Si la distribución es ASIMÉTRICA POSITIVA: es conveniente
utilizar 1-raíces cuadradas, 2-logaritmos… La corrección de la
asimetría positiva será aún mayor con los logaritmos.
Si la distribución es ASIMÉTRICA NEGATIVA: 1-elevar al cuadrado
(X2) o 2-al cubo (X3). La corrección de los datos será mayor cuanto
mayor es la exponenciación.
Las transformaciones más comunes son el logaritmo (ln), la raíz
cuadrada (SQRT) y potencias (**potencia deseada)
web: http://www.uv.es/friasnav/
31
TRANSFORMACIONES DE LA VARIABLE
SPSS
web: http://www.uv.es/friasnav/
32
TRANSFORMACIONES DE LA VARIABLE
Objetivo: que la variable adopte una distribución normal o, al
menos, simétrica
--La escalera de transformación de Tukey es orientativa pero es una
“guía”.
--Muy raramente se conseguirá la normalidad con la primera
transformación. Serán necesarias varias. Después de cada
transformación se ejecutan de nuevo los análisis de bondad de
ajuste.
--Conviene tener en cuenta que con variables que muestran una
distribución próxima a la normalidad la aplicación de las
transformaciones puede provocar hacerlas más asimétricas.
Cuando esto ocurre lo más conveniente es trabajar con los datos
de la variable original.
web: http://www.uv.es/friasnav/
33
DATOS BRUTOS
AL CUADRADO
AL CUBO
LOGARITMO
NO
web: http://www.uv.es/friasnav/
34
El estadístico W de Shapiro-Wilks mide la fuerza del ajuste con una
recta.
Cuanto mayor sea el valor de este estadístico mayor desacuerdo
habrá con la recta de normalidad, por lo que se rechazrá la
hipótesis nula.
Para muestras pequeñas (entorno a 50 observaciones) se
recomienda Shapiro. Para muestras mayores se recomienda
Kolmogorov con la corrección de Lilliefors.
web: http://www.uv.es/friasnav/
35
Ejercicios:
Fuente: http://ocw.usal.es/ciencias-sociales-1/control-estadistico-de-la-calidad/materiales-de-clase/
web: http://www.uv.es/friasnav/
36
Analizar la variable de Valoración con el SPSS.
Examinar su ajuste a la distribución normal. Realizar algún tipo de
transformación si fuese necesario. Redactar los resultados.
Para el informe de investigación: BaseInformeESTAD.sav
-Buscar el modelo teórico que puede representar el proceso de aprendizaje de
la estadística para plantear las hipótesis teóricas en el apartado 37Introducción.
-Comprueba en los análisis la normalidad de la variable y la homogeneidad de
las varianzas de los grupos.
-Analiza e interpreta los estadísticos descriptivos que consideres de las
variables que se utilizan como variables dependientes.
-Estudiar la relación entre las calificaciones y la valoración sobre la confianza en
la solución de la pregunta.
-Analizar la relación entre aprobados y suspensos y la valoración sobre la
confianza en la solución de la pregunta.
-Estudiar la relación entre el sexo y las notas académicas.
-Haz una interpretación conjunta de todos los datos en el apartado de Discusión
web: http://www.uv.es/friasnav/
37
Descargar