12. Contraste de hipótesis "Es una verdad muy cierta que, cuando no esté a nuestro alcance determinar lo que es verdad, deberemos seguir lo que es más probable". Descartes, en su Discurso del Método 1 Contraste de hipótesis: ¿Qué es una hipótesis estadística? • Es una conjetura o creencia acerca de una o varias poblaciones. Normalmente en referencia a sus parámetros: la media, la varianza o una proporción, por ejemplo. • Si queremos contrastarla, debe establecerse antes del análisis. Después se utilizan los datos de las muestras para obtener evidencias que confirmen o no la hipótesis propuesta. 2 Veamos un ejemplo: El efecto "Mozart vs. El Fari": Se sospecha que los individuos rinden más en un test de inteligencia tras escuchar música de Mozart que cuando han escuchado música de El Fari. Hipótesis científica: Escuchar la música de Mozart tiene un efecto sobre el CI diferente al de la música de El Fari. Experimento: De la población española seleccionamos 20 niños al azar en dos grupos de 10. Un grupo escuchará Mozart antes de hacer el test de CI. El otro escuchará a El Fari. Después de realizar los test, se calculan las medias y cuasivarianzas en cada uno de los dos grupos. 3 Supongamos que la media del CI del grupo de Mozart fue 110 con cuasivarianza = 100, mientras que la media del grupo de El Fari fue de 102 y cuasivarianza = 64. Entonces: ¿Podemos decir que hay diferencias a nivel poblacional entre ambos grupos? Para tomar tal decisión necesitaremos plantear DOS hipótesis estadísticas: 4 Hipótesis estadísticas: -Hipótesis nula. Es la que proporciona la solución "más sencilla". En nuestro ejemplo sería que la media poblacional de ambos grupos es la misma. Es decir, que no hay un efecto de la música sobre el CI. H 0: µ 1 = µ 2 -Hipótesis alternativa. Es la hipótesis complementaria (y "más compleja"). En nuestro caso sería que la media poblacional de ambos grupos es diferente. Es decir, que hay un efecto de la música sobre el CI. H 1: µ 1 ≠ µ 2 ¿Cómo decidimos entre ambas hipótesis? Veamos otros ejemplos.5 Otro ejemplo: Sometamos a la reina de Inglaterra al siguiente experimento: Se le presentan 8 tazas de té con leche, idénticas en su aspecto. En 4 de ellas la leche se añadió a la taza con anterioridad al té. Y en las 4 restantes, se añadió la leche después. La reina las prueba y dictamina, acertadamente, las tazas en las que se sirvió primero la leche. ¿Chiripa? 6 ¿Cuántas posibilidades había? La reina debía escoger 4 tazas de las 8. Sin tener en cuenta el orden tenía 70 posibilidades distintas (Combinaciones de 8 elementos tomados de 4 en 4). Si supusiéramos que respondió al azar, su probabilidad de acertar hubiera sido de 1/70. ¿Cuáles son aquí las hipótesis estadísticas? -Hipótesis nula: La reina acertó por chiripa. H0: p = 1/70 -Hipótesis alternativa: La reina tiene un paladar sobrenatural. H1: p ≠ 1/70 7 Parece razonable en este caso rechazar la hipótesis nula. ¿Por qué nos parece razonable rechazarla? Hemos supuesto que la reina juzgaba al azar (hipótesis nula). Por tanto hemos supuesto una distribución de probabilidad : cualquier combinación de las cuatro tazas tenía la misma probabilidad de ser elegida: p = 1/70 (una distribución uniforme). Con esa distribución la reina tenía 69/70 de probabilidad de no acertar. Y sin embargo la reina acertó… 8 “The title comes from the "lady tasting tea", an example from the famous book, The Design of Experiments, by Ronald A. Fisher”. Wikipedia Otro ejemplo más (lo tenéis en detalle en el libro de Marta y Jose): Pasados 2 años cierta vacuna solo es eficaz en un 25% de los casos. Se experimenta con una nueva vacuna que tal vez prolongue la eficacia. Se inyecta a 20 sujetos experimentales. Si más de 8 sujetos superan el periodo de dos años sin contraer el virus, la nueva vacuna se considera mejor que la anterior. El número 8 es un tanto arbitrario, pero parece razonable teniendo en cuenta que esperaríamos 5 casos para la vacuna anterior. 10 ¿Quién es H0? • Hipótesis nula H0 : ambas vacunas son iguales. • Hipótesis alternativa H1: la nueva vacuna es mejor. Con la vacuna antigua cada paciente tiene una probabilidad p = 1/4 de no contraer la enfermedad pasados 2 años. H0: p = 1/4 y H1: p > 1/4 ¿Podemos rechazar la hipótesis nula, que las dos vacunas son igualmente eficaces? El estadístico de prueba es X = número de individuos de la prueba que reciben protección contra el virus más allá de dos años. Y se distribuye como 11 X = B(20, p). Dividiremos los posibles valores de X (de 0 a 20) en dos grupos: (1) Menores o iguales a 8 (Región de aceptación). (2) Mayores a 8 (Región crítica o de rechazo). 8 es el valor crítico en este caso. Si x es el número de pacientes experimentales que no se han infectado después de 2 años, entonces: Si x > 8 rechazamos H0 a favor de la hipótesis alternativa H1. Si x ≤ 8, se acepta H0. 12 El procedimiento descrito nos puede conducir a las siguientes conclusiones erróneas: (1) La nueva vacuna realmente no es mejor que la antigua (hemos rechazado la hipótesis nula y cometido un error de tipo I ). (2) Concluimos que la nueva vacuna no es mejor que la anterior, cuando realmente sí lo es (hemos aceptado la hipótesis nula y cometido un error de tipo I I ). 13 La probabilidad de cometer un error de tipo I se llama nivel de significación o tamaño de la región crítica y se representa por α. En nuestro ejemplo: α = P(error de tipo I) = P(Rechazar H 0 | H 0 es cierta ) = 20 1 3 P( X > 8 | p = 1 / 4) = ∑ x =9 x 4 4 20 x 20 − x = 0.0409 Se dice que la hipótesis nula, p = 1/4, se está probando con un nivel de significación de α = 0.0409. Nivel de significación bastante pequeño, por tanto poco probable que hayamos cometido un error de tipo I. 14 La probabilidad de cometer un error de tipo II se representa por β. Sólo podemos calcularla si tenemos una hipótesis alternativa “concreta”. Por ejemplo en nuestro caso podíamos haber tomado como hipótesis alternativa: p = 0.5. En nuestro ejemplo: β = P(error de tipo II) = P( Aceptar H 0 | H 0 es falsa ) = 20 1 1 P( X ≤ 8 | p = 1 / 2) = ∑ x = 0 x 2 2 8 x 20− x = 0.2517 15 16 17 Contraste de hipótesis: Los tres pasos básicos para contrastar una hipótesis serán: 1- Formular dos hipótesis H0 y H1. 2- Derivar un estadístico de contraste a partir de la muestra de observaciones e identificar su distribución muestral bajo la hipótesis nula. 3- Derivar una regla de decisión y elegir una de las dos hipótesis en base a la evidencia de una muestra. Una regla de decisión que selecciona una de las dos sentencias siguientes: “rechace H0” o “no rechace H0”. 18 Contrastes para la media de una población Población normal (o n > 30) y σ conocida. Hipótesis bilateral Ho: µ = µ0 Estadístico: H1: µ ≠ µ0 x−µ z= σ n Si la media muestral está fuera de este intervalo rechazamos H0. No rechazamos H0 en caso contrario. 1-α Región de aceptación + zα/2 - zα/2 x − µ0 P − zα / 2 < < zα / 2 = 1 − α σ/ n Región de aceptación. σ σ zα / 2 , µ 0 + zα / 2 µ0 − n n 19 Ejemplo: Sea una población normal con σ2 = 20 µ0 = 30, n = 10 , x = 27 y α = 0.05. • Hipótesis: H o : μ = 30 y H1 : μ ≠ 30 • Estadístico y distribución: z = x − µ ≡ N (0,1) σ n x−µ P − zα / 2 < < zα / 2 = 0.95 σ/ n Para calcular intervalo de confianza: σ σ P x − zα / 2 < µ < x + zα / 2 = 0.95 n n α/2 = 0.025 - zα/2 1 - α = 0.95 α/2 = 0.025 + zα/2 Conociendo el tamaño de la muestra, la desviación poblacional y la media muestral, podemos determinar un intervalo de confianza al 20 95%. Valor crítico del estadístico de prueba: Se busca en la tabla z, y nos preguntamos qué valor de z tiene una probabilidad igual a α/2 = 0.025 y resulta ser z = -1.96. α/2 = 0.025 - 1.96 1 - α = 0.95 α/2 = 0.025 + 1.96 21 Pero ahora estamos haciendo una hipótesis: que la media poblacional es µ0 = 30, e intentando contrastarla a partir de la media muestral que es 27. Regla de decisión: Ho se rechaza si z cae en la zona de rechazo (fuera de la zona de aceptación), utilizando α = 0.05 (error de tipo I) que está dividida en dos partes iguales (α/2 = 0.025). 27 − 30 −3 z= = = −2.12 20 / 10 1.4142 Región de aceptación 1 - α = 0.95 - 1.96 + 1.96 - 2.12 Decisión estadística: Se puede rechazar Ho porque -2.12 está en la región de rechazo con un nivel de significación de α = 0.05. Conclusión: Se concluye que µ no igual a 30. 22 HIPOTESIS A CONTRASTAR Se definen: medida de discrepancia con una distribución de probabilidad conocida Regla de decisión(nivel de significación α) datos de la muestra Valor crítico o tabulado Se comparan los valores calculado con tabulado Se calcula una medida de discrepancia Valor calculado ¿se rechaza Ho? H1 SI NO Se extraen conclusiones Contrastes para la media de una población Población normal (o n > 30) y σ conocida. Hipótesis unilateral por la izquierda. Ho: µ = µ0 H1: µ < µ0 Estadístico x−µ zc = σ n 1-α - zα x − µ0 P > − zα = 1 − α σ / n Región de aceptación: Si la media muestral está fuera de este intervalo, rechazamos H0. Aceptamos H0 en caso contrario. σ zα , + ∞ µ0 − n 24 • Los datos y suposiciones se mantienen. • Hipótesis: H o : μ ≥ 30 y H a : μ < 30 (hipótesis nula e hipótesis alternativa) • Cálculo del estadístico de prueba: x − µ 0 27 − 30 z= = = −2.12 σ/ n 20 / 10 • Regla de decisión: Si el zcalc cae en la zona de rechazo se rechaza Ho. Como es una prueba de una cola o unilateral, se busca en la tabla qué valor de z tiene una probabilidad de 0.05 y es igual a -1.645. • Decisión estadística y conclusión: Como -2.12 es menor que -1.645 se rechaza Ho y se concluye que la media de la 25 población es menor de 30. Región crítica y nivel de significación Región crítica • Valores ‘improbables’ si... • Es conocida antes de realizar el experimento: resultados experimentales que refutarían H0 Nivel de significación: α • Número pequeño: 1% , 5%, ... • Fijado de antemano por el investigador • Es la probabilidad de rechazar H0 cuando es cierta α=5% Reg. Crit. Reg. Crit. No rechazo H0 Η0: µ = 40 26 Contrastes: unilateral y bilateral La posición de la región crítica depende de la hipótesis alternativa Bilateral H1: µ ≠ 40 Unilateral Unilateral H1: µ < 40 H1: µ > 40 27 La variable aleatoria poblacional X de nuestro interés es la duración de un componente. Esta variable se distribuye en la población como una exponencial: X = Exp(λ). (a) Nos piden como contraste de hipótesis: H0: µ=300 H1: µ<300 Disponemos de una muestra de n = 100 elementos. Para cada componente se ha medido su duración: {x1, x2, ... , x100}. Y sabemos que la media muestral, que la vida media de los 100 componentes es: 100 x= 1 xi = 260 ∑ 100 i =1 Usaremos como estimador a la media muestral: 1 n x = ∑ xi n i =1 Recuerda que es una variable aleatoria, de la que nosotros disponemos de un valor particular: el que nos da nuestra muestra. ¿Qué distribución tiene nuestro estimador? El de la suma de 100 variables aleatorias distribuidas exponencialmente. En principio sería una Erlang, pero puesto que el número de variables es mayor que 30, podemos utilizar una aproximación normal: ( x ≡ N µ ,σ / n ) Observa que para el caso particular de la exponencial, la media coincide con la desviación típica y podemos escribir: ( x ≡ N µ, µ / n ) Tipifiquemos el estimador para que se distribuya como una N(0,1): x−µ z= ≡ N (0,1) µ n 29 Región crítica α Región de aceptación 1-α z= x−µ ≡ N (0,1) µ n a = 250.65 α = 0.05 = P (Rechazar H 0 | H 0 cierta) = a − 300 = P ( x ≤ a | µ = 300) = P z ≤ = 0.05 300 / 100 a − 300 zcrit = = −1.645 ⇒ a = 250.65 300 / 100 x = 260 > 250.65 ⇒ x ∈ Región de aceptación ⇒ No rechazamos H 0 30 Si en realidad µ = 250 y la hipótesis nula es que µ = 300, "detectarlo" supondría rechazar la hipótesis: P(Rechazar H 0 | µ = 250) = P( x ≤ a | µ = 250) = 250.65 − 250 = P z ≤ = P(z ≤ 0.03) = 0.512 250 / 100 Si queremos elevar esta última probabilidad hasta el 70%: b − 250 µ µ 0 . 70 ( Rechazar H | 250 ) ( | 250 ) P P = = = x ≤ b = P z = ≤ 0 250 / n 0.05 = P(Rechazar H | µ = 300) = P( x ≤ b | µ = 300) = P z ≤ b − 300 0 300 / n b − 250 250 / n = 0.525 ⇒ n = 156.125 ≈ 157 b − 300 = −1.645 31 300 / n La variable aleatoria poblacional X de nuestro interés es el número de accidentes de tráfico en una semana. Esta variable se distribuye en la población como una poisson: X = P(λ=2.5). (a) Nos piden como contraste de hipótesis: H0: λ=10 (reducir el límite de velocidad no influye) H1: λ<10 (reducir el límite de velocidad disminuye el número de accidentes) Pero observa que contrastaremos las hipótesis con la variable aleatoria Y = número de accidentes en cuatro semanas 32 0.1 ≥ P(Rechazar H 0 | H 0 cierta ) = Error tipo I a = P(Y ≤ a | λ = 10) = ∑ e −λ x =0 λx x! λ =10 Mirando en las tablas encontramos que a = 5. Si el número de accidentes observado en las cuatro semanas es menor o igual que 5, entonces rechazamos H0. Si el número de accidentes disminuyó a 2 por semana, entonces disminuyó a 8 accidentes por cada cuatro semanas P(Rechazar H1 | λ = 8) = Error tipo II = P(Y > 5 | λ = 8) = 1 − P(Y ≤ 5 | λ = 8) = 5 = 1 − ∑ e −λ x =0 λx x! λ =8 = 1 − 0.19 = 0.81 33 Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. Esta rapidez es una variable aleatoria con alguna distribución de probabilidad. Especialmente interesa decidir si la rapidez de combustión promedio, que es un parámetro µ de dicha distribución es o no 50 cm/seg. Hipótesis Nula: Hipótesis Alternativa: Región Crítica Se acepta H1 µ ≠ 50 H0: µ = 50 cm/seg H1: µ ≠ 50 cm/seg Región de aceptación Se acepta H0 µ = 50 48.5 50 Valores Críticos Región Crítica Se acepta H1 µ ≠ 50 51.5 Condición real H0 verdadera H0 falsa Rechazar H0 Error Tipo I ok Aceptar H0 ok Error Tipo II Decisión α = P(error Tipo I)= P(rechazar H0 | H0 es verdadera) Si calculamos α para el ejemplo de la rapidez de combustión para una muestra de n = 10 datos, suponiendo que σ = 2.5 cm/seg, obtenemos: α = P( x caiga en la región crítica | µ = 50 )= = P( x < 48.5) + P( x > 51.5) = 0,0576 Esto significa que el 5,76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: µ = 50 cm/seg, cuando ésta es verdadera. β = P(error Tipo II) = P(aceptar H0 | H0 es falsa) Recordemos que no es posible calcular β si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores. Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión µ es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: µ = 50 cuando el valor verdadero es µ = 52. 0.7 0.6 H1 : µ = 52 H0 : µ = 50 0.5 0.4 De acuerdo a la figura: β = P(48.5 ≤ x ≤ 51.5 | µ = 52) = 0.2643 La probabilidad de obtener un error de tipo II aumenta muy rápido a medida que el valor verdadero µ tiende al valor Hipotético. Por ejemplo, si suponemos que µ=50.5, y recalculamos β, obtenemos 0,8923. 0.3 0.2 0.1 045 46 47 48 49 50 51 52 53 54 55 β también depende del tamaño de la muestra, por ejemplo, si n = 16 obtenemos, cuando µ = 52: σ = 0.625, por lo tanto β = 0,2119. Es decir, β disminuye cuando n aumenta, excepto si el valor real de µ está muy cerca del hipotético. Como uno puede elegir los valores críticos del intervalo de aceptación, controlamos el valor de α, controlamos la probabilidad de rechazar de manera errónea H0. Es por eso que el rechazo de H0 siempre se considera como una Conclusión Fuerte (los datos aportan fuerte evidencia de que H0 es falsa). La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño. Por esto en lugar de decir: “se acepta H0”, se prefiere decir “no rechazamos H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. No quiere decir que exista gran evidencia de que H0 sea cierta, sino que no hay gran evidencia de que sea falsa. Hipótesis Unilaterales En el ejemplo, supongamos que si la rapidez media de combustión es menor que 50 cm/seg se desea demostrar esto con una conslusión fuerte. ¿Cómo deben plantearse las hipótesis? H0: µ = 50 cm/seg H1: µ < 50 cm/seg Nótese que, aunque H0 está planteada como una igualdad, se sobrentiende que incluye cualquier valor de µ no especificado por H1. Es decir, la incapacidad de rechazar H0, no significa que µ = 50, sino que no se tiene evidencia fuerte que apoye a H1. Es decir, pudiera ser que µ = 50 o que µ > 50. Ejemplo: Un embotellador de refresco desea estar seguro de que las botellas que usa tienen en promedio un valor que supera el mínimo de presión de estallamiento de 200 psi. El embotellador puede formular una prueba de hipótesis de dos maneras: (1) H0: µ = 200 psi H1: µ > 200 psi (2) H0: µ = 200 psi H1: µ < 200 psi Con el planteamiento (1) Como el rechazo de H0 es una conclusión fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de que las botellas soportan mayor presión que 200 psi. Con el planteamiento (2) si se rechaza H0 se concluye que las botellas no soportan los 200 psi, es decir, se concluye que las botellas son satisfactorias a menos que haya evidencia fuerte en sentido contrario. ¿Cuál planteamiento es el correcto? En la Hipótesis alternativa se debe poner la proposición sobre la cuál es importante llegar a una conclusión fuerte. Conclusiones Fuerte y Débil Como uno puede elegir los valores críticos del intervalo de aceptación, i.e. controlamos el valor de α. Uno puede entonces controlar la probabilidad de rechazar de manera errónea H0. Es por eso que el rechazo de H0 siempre se considera como una Conclusión Fuerte: los datos aportan fuerte evidencia de que H0 es falsa. La decisión de aceptar H0 se considera una Conclusión Débil, a menos que se sepa que β es considerablemente pequeño. Por esto en lugar de decir “se acepta H0” se prefiere decir “incapaz de rechazar H0”, es decir, no se ha encontrado evidencia suficiente para rechazar H0. O sea, no quiere decir que exista gran evidencia de que H0 sea cierta sino que no hay gran evidencia de que sea falsa. Riesgos al tomar decisiones Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito Los datos pueden refutarla. • H0: Hipótesis nula – Es inocente La que se acepta si las pruebas no indican lo contrario. Rechazarla por error tiene graves consecuencias. • H1: Hipótesis alternativa – Es culpable No debería ser aceptada sin una gran evidencia a favor. Rechazarla por error tiene consecuencias consideradas menos graves que la anterior. 41 Tipos de error al tomar una decisión (Ejemplo 1) Realidad Inocente Inocente OK Culpable Error Menos grave Veredicto Culpable Error OK Muy grave 42 Riesgos al contrastar hipótesis Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal • H0: Hipótesis nula No especulativa – (Ej.1) Es inocente – (Ej.2) El nuevo tratamiento no tiene efecto – (Ej.3) No hay nada que destacar • H1: Hipótesis alternativa – (Ej.1) Es culpable – (Ej.2) El nuevo tratamiento es útil – (Ej. 3) Hay una situación anormal Especulativa 43 Tipos de error al contrastar hipótesis Realidad H0 cierta No rechazo H0 H0 falsa Error de tipo II Correcto El tratamiento sí tiene efecto pero no lo percibimos. El tratamiento no tiene efecto y así se determina. Probabilidad β Error de tipo I Rechazo H0 Acepto H1 El tratamiento no tiene efecto pero se decide que sí. Probabilidad α Correcto El tratamiento tiene efecto y el experimento lo confirma. 44 Para cualquier tipo de test de contraste hay 3 resultados posibles: (1) - Se toma una decisión correcta. Es decir se rechaza una hipótesis falsa o no se rechaza una hipótesis verdadera. (2) - Se rechaza una hipótesis verdadera. El error de rechazar H0 cuando es verdadera se denomina ERROR DE TIPO I (con probabilidad α). (3) - No se rechaza una hipótesis falsa. El error de no rechazar H0 cuando es falsa se denomina ERROR DE TIPO II (con probabilidad β). 45 46 47 48 Contrastes para la media de una población Población normal y σ desconocida. Hipótesis bilateral Ho: µ = µ0 H1: µ ≠ µ0 Estadístico x−µ tc = ≡ t n −1 s n x − µ0 P − tα / 2 < < tα / 2 = 1 − α s/ n Si la media muestral está fuera de Región de aceptación. este intervalo rechazamos H0. Aceptamos en caso contrario. s s zα / 2 , µ 0 + zα / 2 µ0 − n n x − µ0 Valor − p = P t n −1 > s n • Hipótesis: H o : μ = 35 y H a : μ ≠ 35 • Estadístico de prueba: dado que se desconoce la varianza de la población, utilizaremos s2. • Distribución del estadístico de prueba es una t de Student con n-1 grados de libertad. • Regla de decisión: A un nivel de significancia de α = 0.05, si el valor de tcalc es mayor que tcrítico (2.1604) entonces se rechaza H0. • Cálculo del estadístico de prueba: 30.5 − 35 = −1.58 t= 10.64 / 14 • Decisión estadística: -1.58 cae en la zona de no rechazo, por lo tanto no se rechaza H0. 50 65 66 67 Ejemplo para contraste en poblaciones normales y de varianza conocida Se quiere saber si hay diferencias en la concentración de ácido úrico en sujetos normales y con síndrome de Down. Se realizó la medición en 12 pacientes con Down y su media fue de 4.5 mg/ml y en 15 individuos sanos cuya media fue de 3.4 mg/ml. • Datos: x1 = 4.5, σ 1 = 1; x2 = 3.4, σ 2 = 1.5; n1 = 12 y n 2 = 15 2 2 •Supuestos: los datos provienen de poblaciones con distribuciones normales y se conocen sus varianzas. • Hipótesis: H 0 : µ1 − µ 2 = 0 y H A : µ1 − µ 2 ≠ 0 • Estadístico de prueba: z= ( x1 − x2 ) − ( µ1 − µ 2 ) 0 σ 12 n1 + σ 22 n2 = (4.5 − 3.4) − 0 = 2.57 1 1.5 + 12 15 • Distribución del estadístico: normal estándar. • Regla de decisión: H0 se rechaza a menos que el valor de zcalc entre los valores críticos, si zcrítico está entre ±1.96, es decir, que -1,96 < zcalc< 1,96. • Decisión estadística: Se rechaza H0 porque 2,57 > 1,96. • Conclusión: Con los datos disponibles es posible detectar diferencias estadísticamente significativas entre las dos concentraciones de ácido úrico de ambas poblaciones (Down y normal). Ejemplo con poblaciones normales y varianzas desconocida. Se quiere saber si los fumadores sufren mas daños pulmonares que los no fumadores. • Datos: x f = 17.5, s f = 4.4711, n f = 9; xnf = 12.4, s nf = 4.8492, nnf = 16 •Supuestos : la destrucción pulmonar sigue una distribución normal y no se conocen las varianzas poblacionales, pero se suponen que son iguales. • Hipótesis: H 0 : µ f ≤ µ nf , H A : µ f > µ nf • Estadística de prueba: t= ( x1 − x2 ) − ( µ1 − µ 2 ) 0 s 2p n1 + s 2p n2 = (17.5 − 12.4) − 0 = 2.6573 21.2165 21.2165 + 16 9 Y la varianza combinada se calcula como. (n1 − 1) s + (n2 − 1) s s = n1 + n2 − 2 2 p 2 1 2 2 • Distribución de la estadística de prueba: Sigue una distribución t de Student con n1+ n2 - 2 grados de libertad. • Regla de decisión: Se rechaza H0 a menos que el tcalc esté entre los valores críticos. En este caso, si tcrítico es ±1.7139, luego -1.7139 < tcalc< 1.7139. • Decisión estadística: Se rechaza H0 porque 2.6573 > 1.7139 y cae en la zona de rechazo. • Conclusión: Con los datos experimentales se puede concluir que sí hay más daño pulmonar en los fumadores que en los no fumadores. 73 (Recordatorio) 74 Ejemplo: 75 76 77 78 79 80 81 82 83 84 85 96 Valor-p de un contraste Observa que el resultado de un test depende fuertemente de α... El valor-p es la probabilidad de obtener un resultado de la muestra que sea al menos tan improbable como lo que se observa. Dos posibles valores de un estadístico (puntos en la gráfica) que conducen a rechazar la hipótesis nula, aunque la evidencia del rechazo es muy distinta según el caso. Este valor corresponde al valor de la probabilidad asignada al z calculado a partir del valor numérico sometido a la prueba de hipótesis. Si p es menor al nivel de significación predefinido se debe rechazar H0 En una prueba bilateral se determina el valor-p duplicando el área en la cola, para poder comparar el valor de p directamente con α y mantener así la misma regla de rechazo. Significación: p α H0: µ=40 Significación: p No se rechaza H0: µ = 40 α H0: µ = 40 X = 43 Significación: p Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida. p es conocido después de realizar el experimento aleatorio El contraste es no significativo cuando p>α P α P α No se rechaza H0: µ=40 X = 43 Significación : p Se rechaza H0: µ = 40 Se acepta H1: µ > 40 α X = 50 Significación : p El contraste es estadísticamente significativo cuando p < Es decir, si el resultado experimental discrepa más de “lo tolerado” a priori. Se rechaza H0: µ=40 Se acepta H1: µ>40 α P X = 50 α. Resumen: α, p y criterio de rechazo • Sobre α • Sobre p – Es número pequeño, preelegido al diseñar el experimento. – Es conocido tras realizar el experimento. – Conocido α sabemos todo sobre la región crítica. – Conocido p sabemos todo sobre el resultado del experimento. • Sobre el criterio de rechazo – Contraste significativo = p menor que α