Análisis de Datos I Esquema del Tema 14 Tema 14: Introducción a la lógica del contraste de hipótesis LA ESTADÍSTICA INFERENCIAL EL CONTRASTE DE HIPÓTESIS (prueba de significación estadística) EL PROCESO DE DECISIÓN EN 5 PASOS 1) 2) 3) 4) Hipótesis. Contrastes unilaterales y bilaterales. Supuestos Estadístico de contraste Regla de decisión. Nivel de confianza, nivel de significación y nivel crítico 5) Decisión y conclusión __________________ Bibliografía: Tema 14 (págs. 361-378) Ejercicios recomendados del libro: 1, 2, 3, 4, 6, 7, 8, 9 y 10. Carmen Ximénez 1 Análisis de Datos I Esquema del Tema 14 LA ESTADÍSTICA INFERENCIAL La lógica del contraste de hipótesis se concreta en un número de técnicas particulares. Cada técnica ha sido desarrollada para ser empleada en un escenario específico, es decir, a las hipótesis referidas a un determinado parámetro, con unos determinados supuestos distribucionales y en unas circunstancias concretas. En la asignatura Análisis de Datos II se expondrá una variedad de estas técnicas, elegidas por ser algunas de las más empleadas en Psicología. En este tema veremos un esquema general de los pasos que se deben dar en un Contraste de Hipótesis y en el tema siguiente se exponen tres técnicas concretas, como ilustración de su aplicación. EL CONTRASTE DE HIPÓTESIS (prueba de significación estadística) Proceso mediante el cual se trata de comprobar si una afirmación sobre una propiedad poblacional puede ser mantenida según la información muestral disponible o debe ser rechazada. EJEMPLO: En las últimas elecciones un partido obtuvo el 40% de votos. Para comprobar que ese porcentaje ha aumentado de cara a las próximas elecciones se selecciona una m.a.s. de 300 sujetos y se encuentra que 189 (el 63%) votarán al partido. El contraste de hipótesis = proceso de decisión 1. Formular estadísticamente la hipótesis científica que se desee contrastar 2. Buscar evidencia empírica para informar sobre si la hipótesis establecida es sostenible o no 3. Establecer una regla de decisión en términos de probabilidad Suponiendo que la hipótesis es correcta, si el resultado muestral es poco probable: la hipótesis es incompatible con los datos y habría que rechazarla. Se concluye, por tanto, sobre el grado de compatibilidad de los datos con la hipótesis. Carmen Ximénez 2 Análisis de Datos I Esquema del Tema 14 CONTRASTE DE HIPÓTESIS: ESQUEMA DE 5 PASOS 1) Formulación de Hipótesis Una hipótesis estadística es una afirmación sobre algún aspecto de una distribución de probabilidad (por ejemplo, el valor de algún parámetro) Hipótesis nula, H0: hipótesis que se somete a contraste (debe ser concreta y llevar el signo =) Hipótesis alternativa, H1: negación de H0 (incluye todo lo que excluye H0 y es inexacta) Tipos de contraste: Bilateral H0: = 25 H1: 25 Unilateral derecho H0: 25 H1: > 25 Unilateral izquierdo H0: 25 H1: < 25 2) Supuestos Para que la hipótesis nula pueda someterse a contraste es necesario que la distribución poblacional con la que se trabaje esté especificada lo más posible. Los supuestos son las condiciones que han de cumplirse para poder decidir sobre la H0 (por ejemplo, que la población de partida sea normal). * Es importante comprobar los supuestos antes de llevar a cabo el contraste 3) Estadístico de Contraste Resultado muestral que cumple dos condiciones: 1) proporciona información empírica relevante sobre la información contenida en H0; y 2) posee una distribución muestral conocida. El objetivo es evaluar el grado en que el estadístico de contraste (esto es, el dato muestral) se parece a lo establecido en H0 (dato poblacional) mediante criterios probabilísticos. 4) Regla de Decisión. Criterio para decidir sobre si H0 debe ser rechazada o no, asumiendo que H0 es verdadera. Se basa en la división de la distribución muestral del estadístico en dos áreas: Contraste sobre una Zona de rechazo (zona crítica): Valores del estadístico de contraste media (bilateral) que están tan alejados de lo establecido en H0, que es muy poco probable que ocurran si H0 es verdadera. /2 /2 Su probabilidad es (nivel de significación) Zona de aceptación: Valores del estadístico de contraste que es más probable que ocurran si H0 es verdadera. Su probabilidad es 1 - (nivel de confianza) Definidas las dos zonas … - Se rechaza H0 si el estadístico de contraste cae en la zona de rechazo - Se mantiene H0 si el estadístico de contraste cae en la zona de aceptación Importancia de la determinación de , nivel de significación: es la probabilidad de que el estadístico de contraste caiga en la zona crítica si, como se supone, H0 es verdadera. Lo especifica previamente (el investigador). suele fijarse en 0,01 ó 0,05 5) Decisión y conclusión Conlleva aplicar al estadístico de contraste la decisión estadística: rechazar H0 o no rechazar H0. - Si se rechaza H0 se considera probado que la hipótesis nula es falsa - Si se mantiene H0 se considera que la hipótesis nula es compatible con los datos pero su afirmación (por ejemplo, el valor de un parámetro) queda en incertidumbre Carmen Ximénez 3 Análisis de Datos I Esquema del Tema 14 Contraste de hipótesis sobre la media, conocida σ: esquema Para ilustrar el proceso de decisión vamos a basarnos en el caso del contraste de hipótesis sobre el valor de una media para el caso en que se conoce la varianza poblacional, 2. El procedimiento consiste en aplicar el esquema anterior con los siguientes pasos: 1) Hipótesis. Si se trata de un contraste bilateral, éstas serán de la forma, H0: µ = µ0 H1: µ ≠ µ0 2) Supuestos. - La población se distribuye N(µ; σ) o la muestra es suficientemente grande como para asumir la normalidad basándonos en el Teorema Central del Límite. - La media muestral se ha obtenido sobre una m.a.s. de tamaño N - Conocemos σ. 3) Estadístico de Contraste y su distribución bajo H0 verdadera. Z X 0 N ~ N(0; 1) 4) Regla de Decisión, basada en el nivel de significación (α) adoptado. Rechazar si Z ≥ 1-α/2z ó Z ≤ α/2z No rechazar si α/2z < Z < 1-α/2z 5) Decisión y Conclusión. Se rechaza H0 si el estadístico de contraste cae en la zona de rechazo. No se rechaza H0 si el estadístico de contraste cae en la zona de aceptación. Ejemplo. El CI se distribuye N(100; 15) en la población general. Un investigador toma una m.a.s. de 9 niños autistas y desea comprobar si la media es distinta en esta población. Encuentra que la media es 115 ¿Cuál será su conclusión con = 0,05? 1) Hipótesis. H0: µ = 100 H1: µ ≠ 100 2) Supuestos. (Adviértase que en el problema no se especifica nada sobre la dirección de la diferencia entre 100 y la media poblacional real, en caso de ser falsa H0, por lo que se realiza un contraste bilateral) - La población se distribuye N(100; 15) - Se trata de una m.a.s. - Conocemos σ 3) Estadístico de Contraste. Z 4) Regla de decisión. X 0 N 115 100 3 ; donde Z ~ N(0; 1) 15 9 Rechazar si Z ≥ 1,96 ó Z ≤ -1,96 No rechazar si -1,96 < Z < 1,96 5) Decisión y Conclusión. Como 3 > 1,96 rechazamos H0. Concluimos que la evidencia aconseja rechazar, según la regla de decisión adoptada, la hipótesis de que la media poblacional sea igual a 100. Por tanto, La media de los niños autistas es distinta a la de la población general. Carmen Ximénez 4