Document

Anuncio
1
Práctica 5. Intervalos de confianza
Práctica 5
ANÁLISIS DE UNA MUESTRA
INTERVALOS DE CONFIANZA
CONTRASTE DE HIPÓTESIS
Objetivos:
Ilustrar el grado de fiabilidad de un intervalo de confianza cuando se utiliza para estimar
la media de una población. Análisis de las relaciones entre contrastes de hipótesis e
intervalos de confianza.
Uso del SPSS para el análisis de una muestra: cálculo de intervalos de confianza,
contrastes de hipótesis sobre la media poblacional y pruebas de normalidad.
Índice:
1. Interpretación de los intervalos de confianza y contrastes de hipótesis.
2. Análisis de una muestra con el SPSS
3. Pruebas de normalidad
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
Práctica 5. Intervalos de confianza
2
1. Interpretación de los intervalos de confianza y contrastes de
hipótesis.
Por conveniencia, supondremos que los datos que aparecen en este apartado proceden
de una población normal.
1.1 Un ejemplo con una muestra.
Supongamos que la colección de 100 círculos que se presenta en la hoja adjunta
representa una población natural del mítico organismo C. ellipticus. Los círculos tienen
números de identificación 00, 01, 02,...., 98, 99 por conveniencia en el muestreo.
Algunos individuos de C. ellipticus son mutantes y son más oscuros.
Vamos a utilizar esta "población" para simular la recogida de datos en un experimento,
para estudiar la relación entre muestra y población y para interpretar las propiedades de
los intervalos de confianza y del Contraste de Hipótesis.
Ejercicios:
1. Selección de una muestra aleatoria.
Seleccionar una muestra aleatoria de tamaño 5 de la población de C. ellipticus
(utilizar el método descrito en la Práctica 3) y medir sus diámetros en mm.
2. Calcular la media y la varianza muestral de la muestras obtenida.
3. Comparar los estadísticos obtenidos en el apartado 2 con los que han obtenido
vuestros compañeros.
1. 2. Intervalos de confianza
Evidentemente, en otros estudios no conoceremos el valor de la media poblacional. Sin
embargo, en este ejercicio sabemos que µ = 11, esto nos permitirá saber con seguridad
si los intervalos de confianza que calculemos contienen o no al verdadero valor de µ.
Ejercicios:
4. Construir un intervalo de confianza del 95% para µ a partir de la muestra
obtenida en el ejercicio 1. Análogamente para el 80%.
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
Práctica 5. Intervalos de confianza
3
5. Considerando todos los intervalos de confianza del 95% construidos por
vuestros compañeros, calcular la proporción de ellos que contienen al 11 mm
(valor verdadero de µ). Hacer lo mismo con los intervalos del 80%. ¿Son los
resultados obtenidos los que cabría esperar dado el nivel de confianza utilizado
en cada caso? Comentar la interpretación probabilística de un intervalo de
confianza y relacionar con los resultados obtenidos.
Recordar que en un estudio real no sabemos cuál es el verdadero valor de µ por lo que
nunca estaremos completamente seguros de si el intervalo de confianza que hemos
obtenido contiene o no a este valor. Solamente podemos esperar que lo contenga con
mayor o menor confianza.
1.3. Contraste de Hipótesis: test t.
Ejercicios:
6. Haz el siguiente contraste de hipótesis sobre el valor de la media poblacional
utilizando la muestra anterior: H0 : µ1 = 11,
HA : µ1 ≠ 11:
a) Utilizar α = 0.05.
b) Utilizar α = 0.20.
¿Qué relación hay entre los resultados obtenidos en los contrastes anteriores y el
hecho de que los intervalos de confianza del ejercicio 4 contengan o no al 11?
7. Si en lugar de observar si el 11 pertenece o no a los intervalos de confianza
nos fijamos en si contienen o no al 8 ¿qué contraste de hipótesis plantearías?
Ejercicios:
8. Suponed que un experto en C. Ellipticus asegura que el diámetro medio de
este organismo es 13 mm. Utilizar un test t de dos colas para contrastar esta
afirmación:
H0 : µ = 13 , HA : µ ≠ 13
a) Utilizar α = 0.05.
b) Utilizar α = 0.20.
c) Teniendo en cuenta que sabemos que µ = 11, ¿es equivocada la conclusión a
que llegamos con el test?
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
Práctica 5. Intervalos de confianza
4
9. Teniendo en cuenta los resultados obtenidos por vuestros compañeros en el
ejercicio anterior, para cada valor de α utilizado:
a) Calcular la proporción de veces en que se produce un resultado erróneo.
b) ¿Cuál es la proporción de veces que se ha producido un error de tipo I?
¿Tiene esta proporción alguna relación con el valor de α?
c) ¿Cuál es la proporción de veces que se ha producido un error de tipo II?
¿Cómo valorarías la potencia del test?
2. Análisis de una muestra con el SPSS
En este apartado describimos el uso del SPSS para el análisis de una muestra mediante
la obtención de intervalos de confianza y la resolución de contrastes de hipótesis, todos
ellos referidos a la media de la población de la que proviene la muestra.
Una vez abierto un banco de datos, por ejemplo AMBIENTE, podemos invocar el
procedimiento Prueba T para una muestra, eligiendo el menú Analizar/Comparar
medias/Prueba T para una muestra, con lo que aparece la siguiente pantalla:
Esta pantalla nos permitirá obtener intervalos de confianza y resolver contrastes para las
medias de aquellas variables que seleccionemos y, con el puntero, situemos en la
ventana de Contrastar Variables. Por su parte, el Valor de prueba nos permite
introducir el punto crítico que define la hipótesis nula (µ
µ0). Por último, si seleccionamos
Opciones aparece una ventana en la que podemos introducir el coeficiente (porcentaje)
de confianza deseado para el intervalo. Por defecto es del 95%.
Se activa, entonces, el botón Aceptar, y al pulsarlo, el SPSS muestra en el Visor de
resultados, bajo el título de Estadísticos para una muestra, el tamaño de la muestra, la
media, la desviación típica y el error típico de la media. A continuación, bajo el título de
Prueba para una muestra, encontramos el estadístico del contraste (t), los grados de
libertad (gl), el p-valor bilateral ( Sig (bilateral) ), la diferencia de medias, el error típico
de la diferencia, un intervalo de confianza para la diferencia µ - µ0. (Por ejemplo, los
resultados siguientes se obtinen seleccionando la variable PH con un valor de prueba 7).
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
5
Práctica 5. Intervalos de confianza
Estadísticos para una muestra
N
PH
300
Desviación
típ.
.540562
Media
5.923131
Error típ. de
la media
3.121E-02
Prueba para una muestra
Valor de prueba = 7
PH
t
-34.505
gl
Sig. (bilateral)
.000
299
Diferencia
de medias
-1.076869
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-1.138287 -1.015451
Es importante tener en cuenta que el contraste que realiza el SPSS es el siguiente:
H0: µ = µ 0 

HA: µ ≠ µ 0 
por lo que el p-valor aparece como sig.(bilateral), es decir, corresponde siempre al
contraste bilateral o no direccional. Por tanto, si el problema que queremos resolver
involucra un contraste unilateral o direccional debemos adaptar dicho p-valor.
La Prueba T es válida siempre que el tamaño muestral sea suficientemente grande o, en
caso contrario, cuando la muestra provenga de una población con distribución normal.
En la siguiente Sección veremos como comprobar si se satisface esta última condición.
Ejercicio:
En estudios previos se concluyó que el nivel medio de sulfato era de 5.1. ¿Confirman
los datos del fichero AMBIENTE las conclusiones de dichos estudios?
3. Pruebas de normalidad
Una de las hipótesis que deben comprobarse para la validez de las Pruebas T es la de
normalidad de los datos cuando el tamaño de las muestras es pequeño. Esta condición
puede comprobarse con la prueba de Kolmogorov-Smirnov y mediante el dibujo de
histogramas, diagramas de cajas o gráficos Q-Q.
Para obtener una prueba de normalidad de los datos, seleccionamos el menú
Analizar/Estadísticos descriptivos/Explorar. Aparece la ventana siguiente:
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
Práctica 5. Intervalos de confianza
6
En el caso de una muestra situamos la variable en la ventana Dependientes, y
dejamos Factores en blanco.
A continuación, debemos pulsar el botón Gráficos y en la nueva ventana escoger la
opción de Histograma y activar la opción de Gráficos con pruebas de normalidad.
En el Visor de resultados encontramos, junto con los algunos estadísticos de la(s)
variable(s) a estudiar, la prueba de Kolmogorov-Smirnov con corrección de Lilliefors
para contrastar la normalidad de la distribución (hipótesis nula) y el (los) histograma(s).
Ejercicio:
Aplicar las pruebas de normalidad a los siguientes datos.
Notas obtenidas por los estudiantes presentados en un examen:
3.30, 6.50, 3.60, 5.00, 3.20, 5.50, 5.00, 5.90, 3.80, 3.70, 2.90, 3.60,
3.90, 6.30, 5.00, 3.50, 3.60
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
7
Práctica 5. Intervalos de confianza
Utilizando el SPSS de la forma que se ha explicado, se obtienen los siguientes
resultados:
Pruebas de normalidad
VAR00001
Kolmogorov-Smirnova
Estadístico
gl
Sig.
.247
17
.007
Estadístico
.885
Shapiro-Wilk
gl
17
Sig.
.041
a. Corrección de la significación de Lilliefors
Histograma
Gráfico Q-Q normal de VAR00001
7
2.0
6
1.5
5
1.0
.5
4
0.0
Frecuencia
2
Desv. típ. = 1.15
1
Media = 4.37
N = 17.00
0
3.00 3.50 4.00 4.50
Normal esperado
3
-.5
-1.0
-1.5
-2.0
2
5.00 5.50 6.00 6.50
3
4
5
6
Valor observado
VAR00001
Gráfico Q-Q normal sin tendencias de VAR00001
7
.6
6
.4
.2
5
-.0
Desv. de normal
4
-.2
3
-.4
-.6
2
2
3
4
5
6
7
N=
17
VAR00001
Valor observado
Prácticas de Bioestadística. Departament d’Estadística i Investigació Operativa. Universitat de València
7
Descargar