C B 5

Anuncio
CIENCIAS BIOLÓGICAS
5º CURSO
MODELOS LINEALES EN BIOLOGÍA
Práctica nº 4
Contrastes sobre una muestra con SPSS
PRÁCTICA 4.- Contrastes sobre una muestra con SPSS
4.1.- Contrastes sobre la media de una variable aleatoria Normal.
Partiendo de una variable N(;2), se pueden realizar contrastes del tipo:
H0 :   0 

H1 :   0 
se resuelven tomando una muestra y comprobando si el estadístico:
x  0
z exp 
, que sigue una distribución N(0:1) tiene un valor comprendido dentro del intervalo de
2
n
aceptación: C0=(-z/2; z/2) , para un nivel de significación 
Si la varianza poblacional no es conocida, se estima con la cuasivarianza y el estadístico de contraste
sigue una distribución t de Student con n-1 grados de libertad.
x  0
t exp 
,la región de aceptación es : C0=(-t/2; t/2) , para un nivel de significación 
2
s
n
4.2.- P-Valor
Si pudiésemos disponer de todas las posibles distribuciones t con toda precisión, podríamos construir una
región de aceptación con un nivel de significación, por ejemplo, de 0.179, si fuese el caso.
Los paquetes estadísticos suelen proceder de este segundo modo al realizar un contraste, a partir del
estadístico de contraste, texp y su simétrico, determinan el área bajo las dos colas de una t de Student, es el
denominado P-Valor. Si la región crítica tuviese por extremos las cantidades experimentales, el nivel de
significación es el P-Valor, es decir, el P-Valor es la probabilidad de cometer error de tipo I que
estaremos dispuestos a correr si rechazamos la hipótesis nula, por eso, si P-Valor es mayor que 0.05,
aceptamos H0 a un nivel de significación del 5%.
El P-Valor también puede ser contemplado como la probabilidad de obtener un estadístico experimental
igual o más raro (desde el punto de vista de la hipótesis nula) que el hallado, en valor absoluto, si el
contraste es bilateral, o con su signo si fuese unilateral.
La información proporcionada por el P-Valor es mejor que la que proporciona el nivel de significación,
pues nos dice con absoluta precisión cuál es la significación del contraste.
4.3.- Contrastes sobre la media de una variable aleatoria no Normal.
Aunque la variable de partida no fuese normal, sabemos que la media muestral sigue una distribución
aproximadamente Normal, de media la poblacional y varianza la poblacional entre el tamaño de la
muestra. El parecido entre la distribución que siga la media muestral y la distribución normal
correspondiente es tanto mayor cuanto mayor sea el tamaño de la muestra.
Si las muestras son de tamaño superior a 60, la aproximación es suficientemente buena y aunque no se
conozca la varianza poblacional, el estadístico de contraste es :
x  0
z exp 
y la región de aceptación la: C0: C0=(-z/2; z/2) , para un nivel de significación , pues,
2
s
n
aunque se estime la varianza poblacional, la falta de normalidad hace que la distribución no sea un t, sino
que se aproxima más a una normal.
No obstante, la mayoría de los programas estadísticos realizan el contraste a partir de la t de Student,
como si se tratase de una variable Normal, a lo sumo se podrá realizar un contraste de Normalidad , SPSS
realiza el de Shapiro-Wilk y el de Kolmogorov si las muestras son de menos de 50 datos, para muestras
mayores solo realiza este último. Somos nosotros quienes debemos interpretar los resultados, teniendo en
Práctica 6, página, 1
cuenta que una región de aceptación basada en una t es siempre más amplia que la basada en la Normal,
lo que producirá un nivel de significación menor que el que se desea.
4.4.- Otros contrastes sobre una muestra.
Además del contraste sobre la media, SPSS puede realizar varios contrastes de Normalidad, el de mayor
potencia es el de Shapiro-Wilk, que efectúa el programa por defecto cuando se selecciona el menú
Statistics, Sumarize, Explore, al pulsar el botón Plots en este último cuadro de diálogo, se abre un nuevo
cuadro en el que se puede seleccionar una casilla de verificación que hará que el programa realice los
tests de Normalidad. El test de Shapiro-Wilk solo se realiza si la muestra es de menos de 50 datos,
mientras que el de Kolmogorov se realiza para cualquier tamaño de muestra.
También se puede realizar el contraste de Kolmogorov-Smirnov ejecutando la orden Nonparametrics tests
del menú Statistics, opción 1 Sample K-S.
Existen otros contrastes sobre una muestra, tanto paramétricos: Bondad de ajuste, como no paramétricos:
Test de signos y de rangos con signo, que no se verán aquí.
Actividades correspondientes a esta práctica:
Se proporcionan tres ficheros con formato SPSS, son los llamados tallas.sav; contamina.sav y
suspensos.sav, son datos correspondientes a los ejemplos de los apuntes de teoría, se trata de realizar los
siguientes contrastes:
Fichero Tallas:
Abra el fichero y realice un análisis exploratorio previo, que incluya un contraste de Normalidad
(Statistics-Sumarize-Explore-Plots-Normality tests with plots) sobre cada una de las tres columnas que se
incluyen. Conteste a las siguientes cuestiones:
Media
Extremos del IC 95%
Inferior
Superior Mediana
CuasiVar.
CuasiDTa
Kolmogorov
Estadístico P-valor
Muestra 1
Muestra 2
Muestra 3
Comente la forma: simetría y apuntamiento de los histogramas
Muestra 1
Muestra 2
Muestra 3
Práctica 6, página, 2
Comente los Boxplots
Indique si hay presencia de Outliers en cada una de las tres muestras
Realice test t (Statistics-Compare Means- One sample t test) sobre cada una de las tres muestras, imponga
como hipótesis nula (Test value) que la media sea 170.
Conteste a las siguientes cuestiones:
Condición previa: en relación al tipo de Test, el tamaño de la muestra y los supuestos requeridos para su
realización, ¿Es aplicable este tipo de contraste? Justifique su respuesta.
Plantee el contraste:
Hipótesis nula:
Hipótesis alternativa:
Resultados:
Muestra 1
Muestra 2
Muestra 3
Media:
Cuasidesviación típica:
Estadístico de contraste:
P-valor o valor crítico del contraste (significance):
Conclusión del test:
Conteste a las dos últimas filas de esta tabla si el contraste fuese unilateral. Plantee y resuelva con estas
muestras los dos tipos de contrastes unilaterales posibles.
Contraste:
Muestra 1
Muestra 2
Muestra 3
Muestra 1
Muestra 2
Muestra 3
P-valor o valor crítico del contraste (significance):
Conclusión del test:
Contraste:
P-valor o valor crítico del contraste (significance):
Conclusión del test:
Práctica 6, página, 3
Fichero Contamina:
Repita el proceso realizado en el fichero Tallas, contestando a las mismas preguntas. Realice el test t para
la hipótesis nula de que la media sea 15.
Fichero Suspensos:
Igual que el anterior, realice además un diagrama de sectores (menú Graph Pie)
BIBLIOGRAFÍA:
MARTÍN ANDRÉS, A. Y LUNA DEL CASTILLO, J. D.: Bioestadística para ciencias de la Salud. 4ª Edición.
Ediciones Norma. Madrid, 1994.
MILTON, J.S.: Estadística para Biología y Ciencias de la Salud, 2ª Edición. Interamericana-McGraw Hill.
Madrid, 1994.
STEEL R.G.D., J.H. TORRIE.: Bioestadística: Principios y procedimientos. Mc Graw-Hill, México,
1986.
WALPOLE, R.E.Y MYERS, R.H. . Probabilidad y Estadística. McGraw Hill, México, 1992.
Práctica 6, página, 4
Descargar