Prueba de Hipótesis: Conceptos y Pasos Estadísticos

7.1 INTRODUCCION 205 DEFINICION Una hipotesis se define simplemente como una proposici6n acerca de una 0 mas poblaciones. En general, la hipotesis se refiere a los parametros de las poblaciones para las cuales se hace la proposicion. El administrador de un hospital puede suponer que el periodo promedio de permanencia de los pacientes internados en el hospital es de cinco dias; una enfermera del area de salud publica puede suponer que un deter minado programa educativo hara que mejore la comunicacion entre enfermera y paciente; un medico puede suponer que cierto medicamento sera eficaz en 90 por ciento de los casos en que se utilice. Por medio de la prueba de hipotesis se determi na si tales proposiciones son compatibles 0 no con los datos disponibles. Tipos de hipotesis Los investigadores se interesan en dos tipos de hipotesis: de investigaci6n y estadisticas. DEFINICION La hip6tesis de investigaci6n es la conjetura que motiva la investigaci6n. 0 suposici6n Puede ser el resultado de afios de observacion por parte del investigador. Una enfermera en salud publica, por ejemplo, puede haber nota do que ciertos pacien tes respondieron mas rapidamente a un tipo particular de programa de educacion sanitaria. Un medico recordara. numerosos casos en los cuales ciertas combinacio nes de medidas terapeuticas fueron mas efectivas que cualquiera de ellas por sepa rado. Los proyectos de investigacion a menudo se llevan a cabo gracias al deseo de tales profesionales de la salud para determinar si sus teorfas 0 sospechas se pueden sostener 0 no al ser sometidas a los rigores de la investigacion cientifica. Las hipotesis de investigacion conducen directamente a las hipotesis esta dfsticas. DEFINICION Las hip6tesis estadisticas se establecen de tal forma que pueden ser evaluadas por medio de tecnicas estadisticas adecuadas. En este texto, las hipotesis que se estudian son de este tipo. Para los ejemplos y ejercicios se supone que las hipotesis de investigacion ya se han considerado. 206 CAPITULO 7 PRUEBA DE HIPOTESIS Pasos para la prueba de hip6tesis Por conveniencia, la prueba de hip6te sis se presenta como un procedimiento de diez pasos. Nada hay de magico 0 sagra do acerca de este formato particular; simplemente divide el proceso en una secuencia l6gica de acciones y decisiones. 1. Datos. Es necesario comprender la naturaleza de los datos que forman la base de los procedimientos de prueba, ya que esto detemina la prueba parti cular que se ha de utilizar. Se debe determinar, por ejemplo, si los datos cons tan de conteos 0 medidas. 2. Supuestos (restricciones). Como se estudi6 en el capitulo relacionado con la estimaci6n, diferentes suposiciones conducen a modificar los intervalos de confianza. Lo mismo ocurre en la prueba de hip6tesis: un procedimiento ge neral se modifica seglin las suposiciones. De hecho, las mismas suposiciones que son importantes en la estimaci6n, tambien 10 son para la prueba de hip6 tesis. Se ha visto que estas incluyen, entre otras, suposiciones respecto a la normalidad de la distribuci6n de la poblaci6n, igualdad de variancias e inde pendencia de las muestras. 3. Hip6tesis. En la prueba de hip6tesis se trabaja con dos hip6tesis estadfsti cas que deben anunciarse explfcitamente. La primera es la hipotesis que debe probarse, mejor conocida como hip6tesis nula, y que se designa por el simbolo Ho' La hip6tesis nula a veces se conoce como hipotesis de no diferencia, ya que es una proposici6n de conformidad con (0 sin diferencia respecto a) condi ciones que se suponen ciertas en la poblaci6n de interes. En general, la hip6 tesis nula se establece con el prop6sito expreso de ser rechazada. En consecuencia, el complemento de la conclusi6n que el investigador desea al canzar se convierte en el enunciado de la hip6tesis nula. En el proceso de prueba, la hip6tesis nula se rechaza 0 no se rechaza. Si la hip6tesis nula no se rechaza, se dira que los datos sobre los cuales se basa la prueba no proporcio nan evidencia suficiente que cause el rechazo. Si el procedimiento de prueba conduce al rechazo, se concluye que los datos disponibles no son compatibles con la hip6tesis nula, pero sirven como apoyo a alguna otra hip6tesis. La hipotesis alternativa, identificada mediante el simbolo HA , es una proposici6n que se creera cierta si los datos de la muestra.llevan al rechazo de la hip6tesis nula. Por 10 general, la hip6tesis alternativa y la hip6tesis de investigaci6n son la misma, y de hecho, se utilizan los dos terminos indistintamente. Reglas para establecer la hip6tesis estadistica Cuando las hip6tesis son del tipo considerado en este capitulo, el indicador de igualdad :5 02:: ) debe aparecer en la hip6tesis nula. Por ejemplo, suponga que se requiere responder a la pregunta: ~Se puede concluir que la media de una poblaci6n es diferente de 50? . La hip6tesis nula es: 7.1 INTRODUCCION 207 y la hipotesis alternativa es Suponga que se desea saber si puede concluirse que la media de la poblacion es mayor que 50. Se tienen las hipotesis: Si se quiere saber si es posible concluir que la media de la poblacion es menor que 50, las hipotesis son HA : Il <50 En resumen, es posible establecer las siguientes reglas empiricas para decidir que proposicion se utiliza como hipotesis nula y cual como hipotesis alternativa. a) La conclusion a la que se desea 0 espera llegar como resultado de la prueba generalmente se usa como hipotesis alternativa. b) La hipotesis nula debe contener una proposicion de igualdad, ya sea =, $; 0 ~ . c) La hipotesis nula es la que debe ser comprobada. d) Las hipotesis nula y alternativa son complementarias. Es decir, las dos con templan de manera exhaustiva todos los valores posibles que los parametros de suposicion pueden asumir. Precauci6n Debe sefialarse que, en general, ni la prueba de hipotesis ni la infe rencia estadfstica conducen a la prueba de una hipotesis, sino que simplemente indican si esta es apoyada 0 no por los datos disponibles. Por 10 tanto, cuando no es posible rechazar una hipotesis nula, no se dice que es verdadera, sino que probable mente es verdadera. Cuando se habla de aceptar una hipotesis nula, se tiene pre sente esta limitacion y no se desea comunicar la idea de que la aceptacion implica la demostracion. 4. Estadistica de prueba. La estadistica de prueba es alguna estadistica que se puede ca1cular a partir de los datos de la muestra. Como regIa, existen muchos valores posibles que puede asumir la estadfstica de prueba, y el va lor particular observado depende de la muestra particular extrafda. Como se vera mas adelante, la estadistica de prueba sirve como un productor de decisiones, ya que la decision de rechazar 0 no la hipotesis nula depende de la magnitud de la estadistica de prueba. Un ejemplo de estadfstica de prueba es la cantidad X Ilo z=-- (7.1.1) (J/-J;; 208 CAPITULO 7 PRUEBA DE HIPOTESIS donde flo es un valor supuesto de la media de una poblaci6n. Esta estadistica de prueba esta relacionada con la estadistica (7.l.2) que ya nos es familiar. Formula general para la estadistica de prueba La siguiente es la for mula general para una estadistica de prueba que se aplica en muchas de las prue bas de hip6tesis que se estudian en este libro: . d b estad stica relevante - par metro supuesto estad sHea e prue a = --------~------"-error est ndar de la estad stiea relevante En la ecuacion 7.1.1., x es la estadistica relevante, flo es el parametro supuesto, y (j I,.J;; el error estandar de x. 5. Distribucion de la estadistica de prueba. Se ha seftalado que la clave para la inferencia estadfstica es la distribuci6n muestral. Es necesario recordar esto en los casos en que sea necesario especificar la distribuci6n de probabilidad de la estadistica de prueba, Por ejemplo, la distribuci6n de la estadistica de prueba z sigue una distribuci6n normal estandar si la hip6tesis nula es verdadera y si satisface las suposiciones. 6. RegIa de decision. Todos los val ores posibles que la estadistica de prueba puede asumir son puntos sobre el eje horizontal de la grafica de la distribu ci6n para esta estadistica y se dividen en dos grupos: uno de eUos constituye 10 que se conoce como region de rechazo y el otro forma la region de no rechazo. Los valores de la estadistica de prueba que forman la regi6n de rechazo son aqueUos que tienen la menor probabilidad de ocurrir, mientras que los que forman la region de no rechazo tienen la mayor probabilidad de ocurrir, si la hip6tesis nula es verdadera para ambas regiones. La regia de decision senaLa que se debe rechazar La hipotesis nula si el valor de la estadistica de prueba que se calcula a partir de La muestra es uno de los valores de la regi6n de rechazo, y que no se debe rechazar la hipotesis nula si el valor calculado de la estadistica de prueba es uno de los valores de la region de no rechazo. Nivel de significacion La decisi6n en cuanto a que val ores van hacia la region de rechazo y cuales van hacia la region de no rechazo se toma con base en el nivel de significacion deseado, designado por cx. EI termino nivel de significacion refleja el 7.1 INTRODUCCION 209 . hecho de que algunas veces la prueba de hipotesis recibe el nombre de "prueba de significacion" , y un valor calculado para la estadfstica de prueba que cae en la re gion de rechazo se dice que es significativo. El nivel de significaci on, ex, designa el area bajo la curva de la distribucion de la estadf~tica de prueba que esta por encima de los valores, sobre el eje horizontal, que constituyen la region de rechazo. DEFINICION EI nivel de significaci6n 0" es una probabilidad y, de hecho, es la probabilidad de rechazar una hip6tesis nula verdadera. Dado que rechazar una hipotesis nula verdadera serfa un error, parece razo nable que se deba hacer pequena la probabilidad de cometerlo y, de hecho, esto es 10 que se hace. Se elige un valor pequeno de ex para hacer que la probabilidad de rechazo para una hipotesis nula sea pequena. Los valores que se encuentran con mas frecuencia son .01, .05 Y .lO. Tipos de errores EI error que se comete cuando se rechaza una hipotesis nula verdadera se conoce como error del tipo I. EI error del tipo II se comete cuando no se rechaza una hipotesis nuIa falsa. La probabilidad de cometer un error del tipo II se designa por ~. Siempre que se rechaza una hipotesis nula se tiene el riesgo de cometer un error del tipo I, al rechazar una hipotesis nuia verdadera. Siempre que no se recha za una hipotesis nula, existe el riesgo de no rechazar una hipotesis nuIa falsa. En general, aunque se de un valor pequeno aa no se ejerce control sobre ~, aunque se sabe que en la mayoria de las situaciones practicas es mayor que a. Nunca se sabe si se ha cometido 0 no uno de estos errores cuando se rechaza o no se rechaza una hip6tesis nula, ya que se desconoce elverdadero estado de las cosas. Si el procedimiento de prueba conduce al rechazo de la hipotesis nula, pue de ser un consuelo el hecho de que aldar un valor pequeno a a la probabilidad de cometer un error del tipo I tambienes pequefia. Si no se rechaza la hip6tesis nula, no se conoce el riesgo concurrente de cometer un error del tipo II, ya que por 10 comun se desconoce a~, pero como se ha senalado, en la mayoria de situaciones practicas, se sabe que es mayor que a. La figura 7.1.1 muestra las posibles acciones que el investigador puede em prender para varias condiciones de una prueba dehipotesis, as! como las condicio nes en las que se produce cada uno de los dos tipos de error. . 7. Calculo de la estadistica de prueba. A partir de los datos contenidos en la muestra, se calcula un valor de la estadfstica de prueba y se compara contra las regiones de no rechazo y rechazo que ya fueron especificadas. 8. Decision estadistica. La decision estadistica consiste en el rechazo 0 no re chazo de la hipotesis nuIa. Se rechaza si el valor calculado de la estadistica de 210 CAPITULO 7 PRUEBADE HIPOTESIS Cond'" ' nuI a lClon d e I a h'IpO' t eSls '-" Acci6n posible No rechazar Ho Rechazar Ho Verdadera Accion correcta Falsa Error tipo II Error tipo I Acci6n correcta FIGURA 7.1.1 Condiciones en las que es posible cometer un error de tipo I 0 un error de tipo II .. prueba cae en la region de rechazo, y no se rechaza si el valor calculado de la estadfstica de prueba cae en la region de no rechazo. 9. Condusi6n. Si Ho se rechaza, se concluye que HA es verdadera. Si Ho no se recha'za, se concluye que Ho puede ser verdadera. 10. Valor de p. El valor de pes una cantidad que indica que tan ins6litos son los resultados de la muestra, considerando que la hip6tesis nula sea verdadera. Un valor de p indica que no es muy probable quelos resultados de la muestra hayan ocurrido; ofrece lajustificaci6n para dudar de la certeza de la hip6te sis nula, si esta es verdadera. Es importante aclarar que cuando la hip6tesis nula no es rechazada, tampoco se puede decir que se acepta. Se debe decir que la hip6tesis nula "no se rechaza". Se evita el uso de la palabra "aceptar" en este caso porque pudiera haberse cometido el error de tipo II. Dado que, frecuentemente, la probabilidad de cometer un error de tipo II puede ser realmente alta, no se pretende cometerlo al aceptar la hip6tesis nula. La figura 7.1.2 muestra un diagrama de flujo de los pasos a seguir cuando se aplica una prueba de hip6tesis. Proposilo deprobar la hlpolesi'l Uno de los prop6sitosde la prueba de hipotesis es ayudar a los administradores y medicos en la toma de decisiones. En general, la decisi6n clfnica 0 administrativa depende de la decisi6n estadfstica. Si se rechaza la hip6tesis nula, la decisi6nclfnica 0 administrativa refleja, por 10 gene ral, el hecho de que la decisi6n escompatible con la hip6tesis alternativa. En general, se cumple 10 opuesto si no se rechaza la hip6tesis nula. Sin embargo, la decisi6n administrativa 0 clfnica puede tener otras formas, como la decisi6n de reunir mas datos. . Sin embargo, en este punto es necesario destacar que el resultado de la esta dlstica de prueba s6lo es una parte de la evidencia que influye sobre la decisi6n administrativa oclinica. La decisi6n estarnstica no debe interpretarse como defini tiva, sino considerarse junto con toda la demas informaci6n importante de que disponga el experimentador. Con base en estos comentarios generales se estudian a continuaci6n pruebas de hip6tesis espedficas. 7.2 PRUEBA DE HIPOTESrS PARA LA MEDIA DE UNA SOLA POBLACrON FIGLRA 7.1.2 211 Pasos del procedimiento para prueba de hip6tesis. 7.2 PRUEBA DE HlPOTESIS PARA lA NIEDIA DE UNA SOlA POBlACION En esta secci6n se estudia la prueba de una hip6tesis en lOrno a la media de una poblaci6n seglin tres condiciones distintas: I) cuando el muestreo se realiza a partir de una poblaci6n de valores que siguen una distribud6n normal con variancia co nocida; 2) cuando el muestreo se realiza a partir de una poblaci6n con distribuci6n 212 CAPITULO 7 PRUEBA DE HIPOTESIS nOImal y con variancia desconocida, y 3) cuando el muestreo se realiza a partir de una poblacion que no presenta una distribucion normal. Aunque la teorIa para las condiciones 1 y 2 depende de poblaciones con distribucion normal, es una practica comun aplicar la teorIa cuando las poblaciones importantes solo estan distribuidas en forma aproximadamente normal. Esto es satisfactorio siempre que la desviacion de la normalidad es moderada. Cuando el muestreo se realiza a partir de una po blacion que sigue una distribucion normal y se conoce la variancia de la poblacion, la estadistica de prueba para Ho: Il Ilo es z x Ilo (7.2.1) cr/{;; La cual, cuando Ho es verdadera, tiene una distribucion normal estandar. Los ejem plos 7.2.1 y 7.2.2 ilustran la prueba de hipotesis en estas condiciones. Muestreo a partir de poblaeiones con distribuewn nornral y varian eias eonoeidas Como se hizo notar en el capitulo 6, nuevamente se destaca que las situaciones en las que la variable de interes sigue una distribucion normal con variancia conocida son casos poco comunes. EI siguiente ejemplo, sin embargo, sirve para ilustrar el procedimiento. FJEMPLO 7.2.1 Un grupo de investigadores esta interesado en conocer la edad media de cierta poblacion. Por decirlo asi, se preguntan 10 siguiente: ~Se puede concluir que la edad media de la poblacion es diferente de 30 alios? Solucion: Con base en el conocimiento de pruebas de hipotesis, se puede contes tar que es posible concluir que la edad media de la poblacion es diferen te de 30, s610 si se puede rechazar la hipotesis nula que indica que la media es igual a 30. Mediante el uso del procedimiento de diez pasos para la prueba de hipotesis, explicado en la secci6n anterior, se puede ayudar a los investigadores a tomar una decision. 1. Datos. Los datos disponibles para los investigadores son las eda des de una muestra aleatoria simple de 10 individuos, extraida de la poblaci6n de interes. A partir de esta muestra se calcula que la me dia de x 27. 2. Supuestos. Se supone que la muestra de valores proviene de una poblacion cuyas edades siguen una distribucion aproximadamente normal. Suponga tambien que la poblacion dene una variancia co nocida de cr2 = 20. 3. Hipatesis. La hip6tesis por probar, 0 hipotesis nuIa, es la siguien te: la edad media de la poblacion es igual a 30. La hipotesis alterria tiva indica que la edad media es diferente de 30. Es importantenotar que se esta identificando la hipotesis altemativa con la conclusion a la que quieren llegar los investigadores, de manera que si los datos permiten rechazar la hipotesis nuIa, Ia conclusion de los investiga dores tendra mayor peso, dado que la probabilidad complementa 7.2 PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA SOLA POBLACION 213 ria de rechazar una hipotesis nula verdadera sera pequena. Es nece sario asegurarse de esto al asignar un valor pequeno a ex, que es la probabilidad de cometer un error de tipo 1. Se puede presentar la hipotesis relevante en forma abreviada de la siguiente manera: Ho: 11= 30 '* H A : 11 30 4. Estadistiea de prueba. Dado que se esta probando una hipotesis acerca de la media de una poblacion, y que se supone que esta sigue una distribucion normal, y puesto que se conoce la variancia, la es tadistica de prueba se obtiene mediante la ecuacion 7.2.1. 5. Distribucion de la estadistiea de prueba. Con base en el conoci miento acerca de las distribuciones muestrales y de la distribucion normal, se sabe que la estadistica de prueba tiene una distribu cion normal, con una media de 0 y una variancia de 1, si Ho es verdadera. Existen muchos valores posibles para la estadistica de prueba que se pueden generar en esta situadon: uno por cada mues tra posible de tamano 10 que pueda ser extraida de la poblacion. Dado que se extrajo una sola muestra, se tiene solo uno de esos val ores posibles en el que se apoya la decision. 6. Regia de decision. La regIa de decision indica que Ho se ha de re chazar si elvalor calculado de la estadistica de prueba cae en Ia region de rechazo, y no se ha de recbazar si cae en la region de no rechazo. A continuad6n es necesario especificar las regiones de rechazo y no re chazo. Se puede empezar por preguntar cual debe ser Ia magnitud de los val ores de Ia estadfstica de prueba para rechazar a H o' Si la hipote sis nula es falsa, esto puede ser por que Ia media real es menor que 0 mayor que 30. Por 10 tanto, los valores de la estadfstica de prueba suficientemente pequefios 0 suficientemente grandes causaran el rechazo de la hipotesis nula. Estos valores extremos constituyen la re gion de rechazo. ~Que tan extremo debe ser un valor posible de la estadfstica de prueba para ser clasificado dentro de la region de re chazo? La respuesta depende del nivel de significadon elegido, es decir, dettamano de la probabilidad de cometer un error del tipo I . .Suponga que se quiere que la probabilidad de rechazar una hipotesis nula verdadera sea ex = .05. Dado que la region de rechazo esm for mada por dos partes, los valores suficientemente pequenos y los sufi cientemente grandes de la estadfstica de prueba, una parte de 0: est.a asociada con los valores grandes y la otra parte con los val ores peque nos. Parece logico que se pueda dividir a 0: en partes iguales, que a/2 = .025 este asociada con valores pequenos y que la otra (mitad de) a/2 = .025 se asocie con valores grandes. Valor endeo de la estadfstiea de prueba ~Que valor de la estadfstica es tan grande que, cuando la hipotesis nula es verdadera, la probabilidad de obtener un valor igual 0 mayor es de .025? 214 CAPITULO 7 PRUEBA DE HIPOTESIS a/2 a/2= .025 o -1.96· FIGURA 7.2.1 .025 x 1.96 Regi6n de no rechazo Regi6n de rechazo = Regi6n de rechazo Regiones de rechazo y no rechazo para eI ejemplo 7.2.1. En otras palabras, (cu;H es el valor de z ala derecha del cual esta .025 del area bajo la distribucion normal estandar? EI valor de z a la derecha del cual esta .025 del area es el mismo valor que tiene .975 del area entre este valor y 00. Se busca en el cuerpo de la tabla D hasta encontrar .975 0 su valor mas cercano y se leen las anotaciones correspondientes al margen para obtener el valor de z. Para el presente ejemplo, z = 1.96. Un razonamiento similar permite encontrar que -1.96 es el valor de la estadistica de prueba tan pequeno que, cuando la hipotesis nula es ver dadera, la probabilidad de obtener un valor as! de pequeno 0 menor es de .025. Nuestra region de rechazo, entonces, consiste en todos los valo res de la estadfstica de prueba mayores 0 iguales que 1.96 0 menores 0 iguales que -1.96. La region de no rechazo se compone de todos los valores intermedios. Se puede establecer la regia de decision para esta prueba como sigue: rechazar Ho si el valor calculado de La estadistica de prue ba es;;::: 1.96 0 ~ - 1.96. De otra forma, no se rechaza Ho' Las regiones de rechazo y no rechazo se muestran en la figura 7.2.1. A los valores de la estadfstica de prueba que separan las regiones de rechazo y no rechazo se les llama valores criticos de la estadfstica de prueba, y a la region de rechazo se Ie conoce tambien como region critica. La regia de decision indica que se calcule un valor para la estadfs tica de prueba a partir de los datos de la muestra y que se rechace Ho si se obtiene un valor mayor 0 igual que 1.960 menor 0 igual que -1.96, y que no se rechace Ho si se obtiene cualquier otro valor. EI valor de 0; y, en consecuencia, la regiade decision deben ser establecidos antes de reunir los datos. Esto evita que los resultados de la muestra influyan en la deci sion qlle se va a tomar acerca de a. Esta condicion de objetividad es muy importante y debe conservarse en todas las pruebas. 7. CaIculo de la estadfstica de prueba. A partir de la muestra se calcula z -3 1.4142 -2.12 7.2 PRUEBA DE HIPOTESIS PARA LA MEDIA DEUNA SOLA POBLACION 215 8. Decision estadistica. Con base en la regIa de decision, se puede rechazar la hipotesis nula porque-2.12 esta en la region de rechazo. Se puede decir que el valorcalculado de la prueba estadistica tiene un nivel de significacion de .05. 9. Conclusion. Se concluye que /lno es igual que 30 y que las accio nes del administrador 0 medico deberan estar de acuerdo con esta conclusion. 10. Valor de p. En lugar de decir que un valor observado de la estadis tica de prueba es.·o no significativo, muchos autores de obras de investigacion prefieren informar la probabilidad exacta de obtener un valor tanto 0 mas extrema que el observado, si la hip6tesis nula es verdadera. En el presente caso, estos investigadores darian el va lor calculado.de la estadfstica de pruebajunto con la proposici6n p =.0340. Dicha proposici6n significa que la probabilidad de obte ner un valor tan extremo como 2.12 en cualquier direcd6n, cuando la hip6tesis nula es verdadera, es de .0340. Este valor se obtiene de la tabla Dyes la probabilidad de observar z 2.120 a z 2.12 cuando la hipotesis nula es verdadera. Es decir, cuando Ho es verda dera, la prohabilidad de obtener un valor de z mayor 0 igual que 2.12 es .0170, y la probabilidad de observar un valor de z menor 0 igual que - 2.12 es de .0170. La probabilidad de que ocurra cual quiera de estos casos, cuando Ho es verdadera, es igual a la suma de las dos probabilidades individuales, y en consecuencia, en este ejem plo, se dice que p =.0170 + .0170 = .0340. La cantidadp seconoce como el valor p para la prueba. . DEFINICION EI valor p para laprueba de unabipotesis es la probabilidad de obtener, cuando Hoes verdadera, un valor de la estadistica de prueba tan extremo 0 mas (en la direccion adecuada para H A) que el valor calculado en realidad. EI valor p para una prueba pl,lede definirse tambien como el valor mas pequeno de a por el cualla hip6tesis nulase puede rechazar. Puesto que, en el ejemplo 7.2.1, el valor de p es .0340, se sabe que se podria haber seleccionado un valor a tan pequeno como .0340 y aun rechazar la hip6tesis nula. Si se hubiera elegido un valor de a menor que .0340, no hubiera sido posible rechazar la hip6tesis nula. Una regIa general que vale la pena recordar es: si el valor p es menor 0 igual que a, es posible rechazar la hip6tesis nula; si el valor p es mayor que a no es posible rechazar la hip6tesis nula. 216 CAPITULO 7 PRUEBA DE HIPOTESIS EI informe de valores p como parte de los resultados de una inves tigacion proporciona mas informacion allector que afirmaciones como "la hipotesis nula se rechaza con un nivel de significaci6n de .05" 0 "los resultados no fueron significativos en el nivel.05". AI informar el valorp asociado con una prueba se permite al lector saber con exactitud que tan extrano 0 que tan comlin es el valor calculado de la estadfstica de prueba dado que Ho esverdadera. • Prueba de Hopor medio de un intervalo de conjianza Anteriormente se estableci6 que es posible utilizar intervalos de confianza para probar hipotesis. En el ejemplo 7 :2.1 se utilizo un procedimiento de prueba de hipotesis para probar Ho: Il = 30 contra la hip6tesis alternativa H A : Il :t:. 30. Fue posible rechazar la hipo tesis nula Ho porque el valor calculado de la estadfstica de prueba cayo en la region de rechazo. A continuacion semuestracomo se hubiera podido Uegar a esta misma con chisionmediante el uso de un intervalo de confianza de 100(1 - a.) por ciento. El 'ntervalo de confianza de 95 por ciento para Il es . 27 ± 1.96 ~20 /10 27 ± 1.96(1.4142) 27 ± 2.7718 24.2282,29.7718 Dado que este intervalo nO incluye a 30, se dice que 30 no es un candidato para la media que se esta. estitnando y, porlo tanto, Il no es igual a 30 y se rechaza a Ho' Esta es la misma conclusion a la que se lleg6 mediante el procedimiento de prueba de hipotesis. . Si el parametro supuesto, 30, sehubiera incluido en el intervalo de confianza de 95 por ciento, se habria dicho que Ho no se rechaza en el nivel.05 de significa cion. En general, cuando se prueba una hip6tesis nula por media de un intervalo de con Jianza Oilateral, se rechaza a H 0 en el nivel a. de significaci6n si el parametro supuesto no estri contenido dentro del intervalo de confianza de 1 00(1 a.) por ciento. Si el parametro supuesto estd contenido dentro de dicho intervalo, no es posible rechazar Ho en ~el nivel a. de significaci6n. Prueba de hipotesis unilateral El intervalo de hipotesis ill!.strado por el ejemplo 7.2.1 es un ejemplo de prueba bilateral, Hamada asf porque la region de rechazo sedivide entre los dos lados 0 colas de la distribucion de la estadistica de prueba; Una prueba de hipotesis puede ser unilateral, en cuyo caso toda la re gion de rechazo esta en una u otra cola de la distribucion. El quese utilice una prueba unilateral 0 bilateral depende de la naturaleza de la cuestion planteada por el investigador. Si tanto los valorespequenos como los grandes causan el rechazo de una hi potesis Hula, 10 indicado es utili'zar una prueba bilateral. Cuando linicamente los valores suficientemente "pequenos" 0 suficientemente "grandes" causan el rechazo de la hip6tesis nula, 10 indicado es utilizar una prueba unilateral. 7.2 PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA SOLA POBLACION 217 FJEMPLO 7.2.2 Con base en el ejercicio 7.2.1, en lugar de preguntarse la posibilidad de concluir que ~ *- 30, suponga que los investigadores se hubieran preguntado: ms posible concluir que ~ < 30? La respuesta a esta pregunta es que puede llegarse a esta con clusion si es posible rechazar la hipotesis nula ~ ~ 30. Solucion: Mediante el uso del procedimiento de los diez pasos y con base en una prueba unilateral se llega a una decisi6n. 1. Datos. Ver el ejemplo anterior. 2. Suposiciones. Ver el ejemplo anterior. 3. Hipotesis. Ho: ~~30 H A : ~< 30 La desigualdad en la hipotesis nula implica que esta comprende un niimero infinito de hip6tesis. La prueba se hace solo para el punto de igualdad,porquepuede mostrase que si Ho se rechaza cuando la prue ba se hiKe en el punto de igualdad, esta serfa rechazada si la prueba se hiciera para cualquier otro valor de ~ inrucado en la hipotesis nula. 4. Estadistica de prueba. 5. Distribucion de Ia estadistica de prueba. Ver el ejemplo anterior. 6. RegIa de decision. Sea nuevamente a = .05. Para determinar don de ubicar la regi6n de rechazo, es necesario preguntar respecto a la magnitud de los valores que causarfan el rechazo de la hipotesis nula. 5i se observa la hipotesis, se ve que los val ores suficientemente pequenos causarfan el rechazo y que los valores grandes tenderian a reforzar la hipotesis nula. Es dedesear que la region de rechazo este .donde estan los valores pequeiios, es decir,. en la cola inferior de la distribucion. Esta vez, dado que se tiene una prueba unilateral, toda a iraenla unica cola de la distribuci6n. AI consultar la tabla D, se encuentra que el valor de z ala izquierda del cual esta .05 del area bajo la curva normal estandar es -:1.645, despues de la interpolaci6n. Finalmente, se especifican las regiories de rechazo y se muestran en la figura 7.2.2. La regIa de decision seiiala que se rechaza Ho si el valor calcu lado de la estadistica de prueba es menor 0 igual que -1.645. 218 CAPITULO 7 PRUEBA DE HIPOTESIS .05 -1.645 Region de rechazo FIGURA 7.2.2 o z Region de no rechazo Regiones de rechazo y no rechazo para el ejemplo 7.2.2. 7. Calculo de la estadistica de prueba. A partir de los datos, se calcula que z= 27-30 ==-2.12 8. Decision estadistica. No sepuede rechazar la hipotesis nula debi do a que -2.12 < -1.645. 9. Conclusion. Se concluye que la media de la poblacion es menor a 30 y se debera actuar en consecuencia. 10. EI valor dep. El valor de p para esta prueba es .0170; porque P(z -2.12), cuando Ho es verdadera, es de .0170, valor que se presenta en la tabla D cuando se determina la magnitud del area a la iz quierda de -2.12 bajo la curva normal estandar. Puede probarse una hipotesis nula unilateral por medio de un intervalo de confian za unilateral. Sin embargo, en este libro no se estudia la elaboracion e interpretacion de este tipo de intervalos de confianza. Si la pregunta de los investigadores hubiera sido: "(Es posible concluir que la media es mayor que 3D?", al seguir el procedimiento de los diez pasos, se habrfa llegadoa una prueba unilateral con toda la region de rechazo en la cola superior de la distribucion de la estadfstica de prueba y a un valor crftico de + 1.645. • , . . illuestreo a partir de una poblaci6n con distribuci6n normal y va riancia desconocida Como ya se ha sefialado, en general, se desconoce la variancia de la poblacion en situaciones reales'que tienen que ver con la inferen cia estadistica en tomo a la media de una poblaci6n. Cuando el muestreo se realiza a partir de una poblaci6n que sigue una·distribucion normal con una variancia des conocida la estadistica de prueba Ho: 11 = 110 es t= X-Il 0 (7.2.2) 7.2 PRUEBA DE HIPOTESIS PARA LA MEDIA DE UNA SOLA POBLACION 219 la cual, cuando Ho es verdadera, sigue una distribuci6n t de Student con n -1 grados de libertad. EI siguiente ejemplo ilustra el procedimiento de prueba de hip6tesis cuando se supone que la poblaci6n sigue una distribuci6n normal y se desconoce la variancia. Esta situaci6n es muy comun en la vida real. Los investigadores Castillo y Lillioja (A-I) describieron una tecnica, desarrollada por ellos, para la canulaci6n Jinfatica periferica en seres humanos. Los autores afir man que su tecnica simplifica el procedimiento y permite la recolecci6n de volume nes convenientes de linfa para estudios metab6licos y cineticos. Los individuos estudiados fueron 14 adultos varones sanos representativos de un rango amplio de pesos corporales. Una de las variables de medici6n fue el indice de masa corporal (IMC) == peso (kg)/estatura2 (m2 ). Los resultados se muestran enla tabla 7.2.1. Se pretende saber si es posible conduit que la media del IMC para la poblaci6n de la que se extrcyo la muestra no es 35. Solucion: Se lograra concluir que la media de la poblaci6n no es 35 si los investiga dores pueden rechazar la hip6tesis nula que dice que la media de la poblaci6n es igual a 35. 1. Datos. Los datos consisten en las mediciones del IMC de los 14 individuos, tal como se describi6 previamente. 2. Supuestos. Los 14 individuos constituyen una muestra aleatoria de una poblaci6n de individuos con las mismas caracterfsticas. 3. Hipotesis. Ho: Il= 35 H A :Il:t: 35· TABlA 7.2.1 Indice de masa corporal (IMC), mediciones para los indhiduos varones descritos en el ejemplo 7.2.3 Individuo 1 2 3 4 5 IMC 23 25 21 37 39 Individuo 6 7 8 9 .10 lMC 21 23 24 32 57 ... Individuo IMC 11 12 13 14 23 26 31 45 FUENTE: Charles E. Castillo y Stephen LtlhoJa, "Penphenal Lymphatic Cannulation for Physiological Analysis of Interstitial Fluid Compartment .. in Humans", American Journal of Physiology, 261 (Heart and Circulation Physiology, 30), H1324-H1328. 220 CAPITULO 7 PRUEBA DE HIP6TESIS .05 -1.645 Region de rechazo FIGURA 7.2.3 o Region de no rechazo Regiones de rechazo y no rechazo para el ejemplo 7.2.3. 4. Estadistica de prueba. Dado que se desconoce la variancia de la po blad6n, la estadfstica de prueba se obtiene mediante la ecuaci6n 7.2.2. 5. Distribucion de la estadfstica de prueba. La estadistica de prue ba sigue una distribuci6n t de Student, con n - 1 = 14 - 1 13 gra dos de libertad, si Ro es verdadera. 6. RegIa de decision. Sea a = .05. Dado que se tiene una prueba bila teral, se pone a/2 = .025 en cada cola de la distribuci6n de la esta dfstica de prueba. Los valores de tala derecha e izquierda de los cualesesta .025 del area son 2.1604, y -2.1604. Estos valores apare cen en la tabla E. Las regiones de rechazo y de no rechazo se mues tran en la figura 7.2.3. La regIa de decisi6n indica que es necesario calcular un valor para la estadfstica de prueba y que se debe rechazar Ro si el valor de t calculado es mayor 0 igual que 2.1604 0 menor 0 igual que -2.1604. 7. CaIculo de Ia estadistica de prueba. A partir de los datos de la muestra se calcula una media igual a 30.5 y una desviaci6n estandar de 10.6392. AI sustituir estos datos en la ecuaci6n 7.2.2 se dene: -4.5 --=-1.58 2.8434 8. Decision estadistica. No se rechaza Ro' ya que -1.58 cae en la regi6n de no rechazo. 9. Conclusion. La conclusi6n, con base en estos datos, es que la me dia de la poblacion de la cual se extrajo la muestra puede ser 35. 10. EI valor de p. EI valor exacto de p para esta prueba no se puede obtener de la tabla E debido a que solo presenta valores de t para percentiles seleccionados. Sin embargo, el valor p puede enundarse como un intervalo. En este ejemplo, -1.58 es menor que -1.350, el valor de tala izquierda del cual estft .10 del area bajo t con 13 gra dos de libertad, pero mayor que -1. 7709, ala izquierda del cual estft 7.2 221 PRUEBA DE HIP6TESIS PARA LA MEDIA DE UNA SOLA POBLACI6N Area=.10 Area .10> p/2 > .05 .10 .10> p/2 > .05 , Area = .05 Area = .05 ----"----- -1.7709 -1.58 -1.350 o 1.3501.58 1.7709 .20> p> .10 FIGURA 7.2.4 Caculo del valor de p para el ejemplo 7.2.3. .05 del area. En consecuencia, wando Ho es verdadera, la probabi lidad de obtener un valor de t menor 0 igual que -1.58 es menor que .10, pero mayor que .05. Es decir, .05 < pet ....,1.58) < .10. Dado que la prueba es bilateral, debe permitirse la posibilidad de un valor calculado de la estadfstica de prueba tan grande en la di recci6n opuesta como el observado. La t~bla E revela que .05 < pet 1.58) < .10. EI valor de p, entonces, es de .10 < P < .20. La figura 7.2.4 muestra el valor p para este ejemplo. Si en el ejemplo anterior la hip6tesis hubiera sido Ho: fl2 35 H A : fl < 35 el procedimiento de prueba habria conducido a una prueba unilateral con toda la regi6n de rechazo en la cola inferior de la distribuci6n, y si la hip6tesis hubiera sido Ho: fl:::; 35 H A : fl> 35 se habria tenido una prueba unilateral con toda la regi6n de rechazo en la cola superior de la distribuci6n. • Muestreo a partir de una poblacion que no presenta una distribu cion normal Si, como ocurre con frecuencia, la muestra en la cual se basa la prueba de la hip6tesis acerca de la media de una poblaci6n proviene de una po blaci6n que no presenta una distribuci6n normal, y si la muestra es grande (ma yor 0 igual que 30), es posible utilizar el teorema del limite central y usar z = (x - flo); (cr ;..[;;) como la estadistica de prueba. Si no se conoce la desviaci6n estandar de la poblaci6n, la practica comtin es utilizar la desviaci6n estandar de la muestra como una estimaci6n. La estadistica de prueba para la prueba de la hip6tesis nula Ho: fl flo, entonces, es X flo z::::- s ;..[;; (7.2.3)

Prueba de Hipótesis: Conceptos y Pasos Estadísticos

Documentos relacionados

Productos

Apoyo

Prueba de Hipótesis: Conceptos y Pasos Estadísticos

Documentos relacionados

Añadir este documento a la recogida (s)

Añadir a este documento guardado

Sugiéranos cómo mejorar StudyLib