QUE ES HIPOTESIS Y PRUEBA DE HIPOTESIS Hipótesis es una aseveración de una población elaborado con el propósito de poner a prueba, para verificar si la afirmación es razonable se usan datos. En el análisis estadístico se hace una aseveración, es decir, se plantea una hipótesis, después se hacen las pruebas para verificar la aseveración o para determinar que no es verdadera. Por tanto, la prueba de hipótesis es un procedimiento basado en la evidencia muestral y la teoría de probabilidad; se emplea para determinar si la hipótesis es una afirmación razonable. Prueba de una hipótesis: se realiza mediante un procedimiento sistemático de cinco paso: Siguiendo este procedimiento sistemático, al llegar al paso cinco se puede o no rechazar la hipótesis, pero debemos de tener cuidado con esta determinación ya que en la consideración de estadística no proporciona evidencia de que algo sea verdadero. Esta prueba aporta una clase de prueba más allá de una duda razonable. Analizaremos cada paso en detalle Objetivo de la prueba de hipótesis. El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico (muestral), sino hacer un juicio con respecto a la diferencia entre estadístico de muestra y un valor planteado del parámetro. HIPÓTESIS NULA En estadística, una hipótesis nula es una hipótesis construida para anular o refutar, con el objetivo de apoyar una hipótesis alternativa. Cuando se la utiliza, la hipótesis nula se presume verdadera hasta que una evidencia estadística en la forma de una prueba empírica de la hipótesis indique lo contrario. El uso de la hipótesis nula es polémico. Ejemplos Hipótesis nula para la distribución ji-cuadrado: «Si este material genético segrega en proporciones mendelianas, no habrá diferencias entre las frecuencias observadas (Oi) y las frecuencias esperadas (Ei).» Hipótesis nula para la distribución t de Student: «Si la humedad no influye sobre el número de huevos por desove, no habrá diferencias entre las medias de esta variable para cada región.» NIVEL DE SIGNIFICANCIA Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos dispuestos a correr el riesgo de cometer un error de tipo I se llama nivel de significancia. Esta probabilidad se denota por se suele especificar antes de la muestra, de manera que los resultados no influyan en nuestra elección. En la práctica es frecuente un nivel de significancia de 0.05 ó 0.01, si bien se usan otros valores. Si, por ejemplo, se escoge un nivel de significancia del 5% ó 0.05 al diseñar una regla de decisión entonces hay unas cinco oportunidades entre cien de rechazar la hipótesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de que hemos adoptado la decisión correcta. En tal caso decimos que la hipótesis a sido rechazada al nivel de significancia 0.05 lo cual quiere decir que la hipótesis tiene una probabilidad del 5% de ser falsa. QUÉ ES P VALOR Y COMO SE UTILIZA P-valor está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. Es fundamental tener en cuenta que el p-valor está basado en la asunción de la hipótesis de partida (o hipótesis nula). En contrastes de hipótesis, en Estadística, el p-valor está definido como la probabilidad de obtener un resultado al menos tan extremo como el que realmente se ha obtenido, suponiendo que la hipótesis nula es cierta. Es fundamental tener en cuenta que el p-valor está basado en la asunción de la hipótesis de partida (o hipótesis nula). Se rechaza la hipótesis nula si el valor P asociado al resultado observado es igual o menor que el nivel de significación establecido, convencionalmente 0,05 ó 0,01, punto que se llama potencia del contraste. Es decir, el p-valor nos muestra la probabilidad de haber obtenido el resultado que hemos obtenido si suponemos que la hipótesis nula es cierta. Si el p-valor es inferior a la potencia del contraste nos indica que lo más probable es que la hipótesis de partida sea falsa. Sin embargo, también es posible que estemos ante una observación atípica, por lo que estaríamos cometiendo el error estadístico de rechazar la hipótesis nula cuando ésta es cierta basándonos en que hemos tenido la mala suerte de encontrar una observación atípica. Este tipo de errores se puede subsanar rebajando el p-valor, un p-valor de 0,05 es usado en investigaciones habituales sociológicas mientras que p-valores de 0,01 se utilizan en investigaciones médicas, en las que cometer un error puede acarrear consecuencias más graves. También se puede tratar de subsanar dicho error aumentando el tamaño de la muestra obtenida, esto reduce la posibilidad de que el dato obtenido sea casualmente raro. CUÁLES SON LOS TIPOS DE ERROR El error de tipo I también mal llamado error de tipo alfa (α) (α es la probabilidad de que ocurra este error), es el error que se comete cuando el investigador rechaza la hipótesis nula (Ho) siendo ésta verdadera en la población. Es equivalente a encontrar un resultado falso positivo, porque el investigador llega a la conclusión de que existe una diferencia entre las hipótesis cuando en realidad no existe. Es también conocido como nivel de significancia, si el nivel de confianza es 95% el nivel de significancia vendría a ser 5% El error de tipo II, también llamado error de tipo beta (β) (aunque β es la probabilidad de que exista éste error), se comete cuando el investigador no rechaza la hipótesis nula siendo ésta falsa en la población. Es equivalente a la probabilidad de un resultado falso negativo, ya que el investigador llega a la conclusión de que ha sido incapaz de encontrar una diferencia que existe en la realidad. Se acepta en un estudio que el valor del error beta debe estar entre el 5 y el 20%. El poder o potencia del estudio representa la probabilidad de observar en la muestra una determinada diferencia o efecto, si existe en la población. Es el complementario del error de tipo II (1-β). ERRORES EN EL CONTRASTE Una vez realizado el contraste de hipótesis, se habrá optado por una de las dos hipótesis, la hipótesis nula o base o la hipótesis alternativa , y la decisión escogida coincidirá o no con la que en realidad es cierta. Se pueden dar los cuatro casos que se exponen en el siguiente cuadro: es cierta es cierta Se escogió No hay error Error de tipo II Se escogió Error de tipo I No hay error Si la probabilidad de cometer un error de tipo I está unívocamente determinada, su valor se suele denotar por la letra griega α, y en las mismas condiciones, se denota por β la probabilidad de cometer el error de tipo II, esto es: En este caso, se denomina Potencia del contraste al valor 1-β, esto es, a la probabilidad de escoger cuando esta es cierta . Cuando es necesario diseñar un contraste de hipótesis, sería deseable hacerlo de tal manera que las probabilidades de ambos tipos de error fueran tan pequeñas como fuera posible. Sin embargo, con una muestra de tamaño prefijado, disminuir la probabilidad del error de tipo I, α, conduce a incrementar la probabilidad del error de tipo II, β. Usualmente, se diseñan los contrastes de tal manera que la probabilidad α sea el 5% (0,05), aunque a veces se usan el 10% (0,1) o 1% (0,01) para adoptar condiciones más relajadas o más estrictas. El recurso para aumentar la potencia del contraste, esto es, disminuir β, probabilidad de error de tipo II, es aumentar el tamaño muestral, lo que en la práctica conlleva un incremento de los costes del estudio que se quiere realizar. QUÉ ES LA POTENCIA DE UNA PRUEBA ESTADÍSTICA La potencia es la probabilidad de rechazar la hipótesis nula cuando esta es falsa, es decir, es la probabilidad que cuando en realidad no se cumple la hipótesis nula que planteamos, el procedimiento estadístico nos dé como resultado que se rechaza la hipótesis nula. Por ejemplo si tenemos el contraste de hipótesis Ho: media = 20 H1: media ≠20 Y nos dicen que la potencia es del 90%, debemos interpretarla así: si en realidad la media poblacional no es 20, al realizar el contraste de hipótesis tenemos una probabilidad del 90% de rechazar Ho (media=20) y aceptar H1 (la media no es 20) concluyendo acertadamente que la media no es 20.