PH_FORO_MUESTREO_EVELYN

Anuncio
QUE ES HIPOTESIS Y PRUEBA DE HIPOTESIS
Hipótesis es una aseveración de una población elaborado con el propósito de
poner a prueba, para verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es decir, se plantea una
hipótesis, después se hacen las pruebas para verificar la aseveración o para
determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia
muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis
es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de
cinco paso:
Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no
rechazar la hipótesis, pero debemos de tener cuidado con esta determinación
ya que en la consideración de estadística no proporciona evidencia de que algo
sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda
razonable. Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es cuestionar el valor calculado del
estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del parámetro.
HIPÓTESIS NULA
En estadística, una hipótesis nula es una hipótesis construida para anular o
refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se la utiliza,
la hipótesis nula se presume verdadera hasta que una evidencia estadística en
la forma de una prueba empírica de la hipótesis indique lo contrario. El uso de
la hipótesis nula es polémico.
Ejemplos

Hipótesis nula para la distribución ji-cuadrado:
«Si este material genético segrega en proporciones mendelianas, no habrá
diferencias entre las frecuencias observadas (Oi) y las frecuencias esperadas
(Ei).»

Hipótesis nula para la distribución t de Student:
«Si la humedad no influye sobre el número de huevos por desove, no habrá
diferencias entre las medias de esta variable para cada región.»
NIVEL DE SIGNIFICANCIA
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos
dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de
significancia. Esta probabilidad se denota por
se suele especificar antes de
la muestra, de manera que los resultados no influyan en nuestra elección.
En la práctica es frecuente un nivel de significancia de 0.05 ó 0.01, si bien se
usan otros valores. Si, por ejemplo, se escoge un nivel de significancia del 5%
ó 0.05 al diseñar una regla de decisión entonces hay unas cinco oportunidades
entre cien de rechazar la hipótesis cuando debiera haberse aceptado; es decir,
tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En
tal caso decimos que la hipótesis a sido rechazada al nivel de significancia 0.05
lo cual quiere decir que la hipótesis tiene una probabilidad del 5% de ser falsa.
QUÉ ES P VALOR Y COMO SE UTILIZA
P-valor está definido como la probabilidad de obtener un resultado al menos
tan extremo como el que realmente se ha obtenido, suponiendo que la
hipótesis nula es cierta. Es fundamental tener en cuenta que el p-valor está
basado en la asunción de la hipótesis de partida (o hipótesis nula).
En contrastes de hipótesis, en Estadística, el p-valor está definido como la
probabilidad de obtener un resultado al menos tan extremo como el que
realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. Es
fundamental tener en cuenta que el p-valor está basado en la asunción de la
hipótesis de partida (o hipótesis nula).
Se rechaza la hipótesis nula si el valor P asociado al resultado observado es
igual o menor que el nivel de significación establecido, convencionalmente 0,05
ó 0,01, punto que se llama potencia del contraste. Es decir, el p-valor nos
muestra la probabilidad de haber obtenido el resultado que hemos obtenido si
suponemos que la hipótesis nula es cierta. Si el p-valor es inferior a la potencia
del contraste nos indica que lo más probable es que la hipótesis de partida sea
falsa. Sin embargo, también es posible que estemos ante una observación
atípica, por lo que estaríamos cometiendo el error estadístico de rechazar la
hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala
suerte de encontrar una observación atípica. Este tipo de errores se puede
subsanar rebajando el p-valor, un p-valor de 0,05 es usado en investigaciones
habituales sociológicas mientras que p-valores de 0,01 se utilizan en
investigaciones médicas, en las que cometer un error puede acarrear
consecuencias más graves. También se puede tratar de subsanar dicho error
aumentando el tamaño de la muestra obtenida, esto reduce la posibilidad de
que el dato obtenido sea casualmente raro.
CUÁLES SON LOS TIPOS DE ERROR
El error de tipo I también mal llamado error de tipo alfa (α) (α es la
probabilidad de que ocurra este error), es el error que se comete cuando el
investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la
población. Es equivalente a encontrar un resultado falso positivo, porque el
investigador llega a la conclusión de que existe una diferencia entre las
hipótesis cuando en realidad no existe. Es también conocido como nivel de
significancia, si el nivel de confianza es 95% el nivel de significancia vendría a
ser 5%
El error de tipo II, también llamado error de tipo beta (β) (aunque β es la
probabilidad de que exista éste error), se comete cuando el investigador no
rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la
probabilidad de un resultado falso negativo, ya que el investigador llega a la
conclusión de que ha sido incapaz de encontrar una diferencia que existe en la
realidad.
Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el
20%.
El poder o potencia del estudio representa la probabilidad de observar en la
muestra una determinada diferencia o efecto, si existe en la población. Es el
complementario del error de tipo II (1-β).
ERRORES EN EL CONTRASTE
Una vez realizado el contraste de hipótesis, se habrá optado por una de las dos
hipótesis, la hipótesis nula o base
o la hipótesis alternativa
, y la
decisión escogida coincidirá o no con la que en realidad es cierta. Se pueden
dar los cuatro casos que se exponen en el siguiente cuadro:
es cierta
es cierta
Se escogió
No hay error Error de tipo II
Se escogió
Error de tipo I No hay error
Si la probabilidad de cometer un error de tipo I está unívocamente determinada,
su valor se suele denotar por la letra griega α, y en las mismas condiciones, se
denota por β la probabilidad de cometer el error de tipo II, esto es:
En este caso, se denomina Potencia del contraste al valor 1-β, esto es, a la
probabilidad de escoger
cuando esta es cierta
.
Cuando es necesario diseñar un contraste de hipótesis, sería deseable hacerlo
de tal manera que las probabilidades de ambos tipos de error fueran tan
pequeñas como fuera posible. Sin embargo, con una muestra de tamaño
prefijado, disminuir la probabilidad del error de tipo I, α, conduce a incrementar
la probabilidad del error de tipo II, β.
Usualmente, se diseñan los contrastes de tal manera que la probabilidad α sea
el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar
condiciones más relajadas o más estrictas. El recurso para aumentar la
potencia del contraste, esto es, disminuir β, probabilidad de error de tipo II, es
aumentar el tamaño muestral, lo que en la práctica conlleva un incremento de
los costes del estudio que se quiere realizar.
QUÉ ES LA POTENCIA DE UNA PRUEBA ESTADÍSTICA
La potencia es la probabilidad de rechazar la hipótesis nula cuando esta es
falsa, es decir, es la probabilidad que cuando en realidad no se cumple la
hipótesis nula que planteamos, el procedimiento estadístico nos dé como
resultado que se rechaza la hipótesis nula.
Por ejemplo si tenemos el contraste de hipótesis
Ho: media = 20
H1: media ≠20
Y nos dicen que la potencia es del 90%, debemos interpretarla así: si en
realidad la media poblacional no es 20, al realizar el contraste de hipótesis
tenemos una probabilidad del 90% de rechazar Ho (media=20) y aceptar H1
(la media no es 20) concluyendo acertadamente que la media no es 20.
Descargar