(revisado_oct 2015_LWB/RS) CLAVE-Laboratorio 9: Pruebas t para una y dos muestras independientes 1. Calcule las siguientes probabilidades usando la tabla t e InfoStat. Incluya un diagrama en cada caso. a. P(T>1.356) si gl=12 b. P(T<2.101) si gl=18 c. P(T<-1.319) si gl=23 d. P(T<-1.711) si gl=24 e. P(T<.697) si gl=11 a. P(T>1.356) si gl=12 Valor en la tabla: 0.1 Función de densidad T Student(12): p(evento)=0.1000 0.40 v = Grados de libertad Densidad 0.30 0.20 0.10 0.00 -5.53 -2.76 0.00 2.76 5.53 Variable b. P(T<2.101) si gl=18 1 – P(T>2.101) = 1 - 0.025 = 0.975 Función de densidad 0.40 T Student(18): p(evento)=0.9750 Densidad 0.30 0.20 0.10 0.00 -5.53 -2.76 0.00 2.76 5.53 Variable AGRO 5005 – CLAVE Lab 9 Page 1 (revisado_oct 2015_LWB/RS) c. P(T<-1.319) si gl=23 Valor en la tabla: 0.1 Función de densidad 0.40 T Student(23): p(evento)=0.1001 Densidad 0.30 0.20 0.10 0.00 -5.53 -2.76 0.00 2.76 5.53 Variable d. P(T<-1.711) si gl=24 Valor en la tabla: 0.05 Función de densidad 0.40 T Student(24): p(evento)=0.0500 Densidad 0.30 0.20 0.10 0.00 -5.53 -2.76 0.00 2.76 5.53 Variable e. P(T<0.697) si gl=11 p 1 – P(T>0.697) = 1 - 0.25 = 0.75 AGRO 5005 – CLAVE Lab 9 Page 2 (revisado_oct 2015_LWB/RS) Función de densidad T Student(11): p(evento)=0.7499 0.40 Densidad 0.30 0.20 0.10 0.00 -5.53 -2.76 0.00 2.76 5.53 Variable 2. Determine los valores críticos de t (valores en la tabla), haga un diagrama de la distribución y lleve a cabo las pruebas indicadas. Calcule los valores p usando el calculador de probabilidad de Infostat (o el graficador). a. H 0 : 30, H a : 30, n 16, Y 32, s 2 25, 0.05 b. H 0 : 58, H a : 58, n 18, Y 57, s 2 100, 0.05 c. H 0 : 25, H a : 25, n 25, Y 9, s 2 20, 0.05 d. H 0 : 430, H a : 430, n 10, Y 400, s 2 14, 0.01 a. H 0 : 30, H a : 30, n 16, Y 32, s 2 25, 0.05 t Y 0 32 30 1.6 s n 5 16 Valor p (InfoStat): 0.1304 Valor tabla: 2.131 Decisión: No se rechaza H 0 α/2=0.025 gl =15 Valor absoluto de t < tα/2 AGRO 5005 – CLAVE Lab 9 Page 3 (revisado_oct 2015_LWB/RS) Función de densidad 0.40 Valor p T Student(15): p(evento)=0.0500 0.39 0.29 Densidad Densidad 0.30 T Student(15): p(evento)=0.1304 0.20 0.10 0.20 0.10 0.00 -5.37 -4.30 -3.22 -2.15 -1.07 0.00 1.07 2.15 3.22 4.30 5.37 Variable 0.00 -5.37 -2.69 0.00 2.69 5.37 Variable b. H 0 : 58, H a : 58, n 18, Y 57, s 2 100, 0.05 t Y 0 57 58 0.4243 s n 10 18 Valor tabla: -1.740 gl= 17 Valor p (InfoStat): 0.3383 Decisión: No se rechaza H 0 Valor absoluto de t < tα Función de densidad 0.40 T Student(17): p(evento)=0.0500 Densidad 0.30 0.20 0.10 0.00 -5.37 -4.30 -3.22 -2.15 -1.07 0.00 1.07 2.15 3.22 4.30 5.37 Variable AGRO 5005 – CLAVE Lab 9 Page 4 (revisado_oct 2015_LWB/RS) V alor p 0.39 T Student(17): p(evento)=0.3383 Densidad 0.29 0.20 Valor de p 0.10 0.00 -5.37 -2.69 0.00 2.69 5.37 Variable c. H 0 : 25, H a : 25, n 25, Y 9, s 2 20, 0.05 t Y 0 9 25 17.8885 Valor p (InfoStat): 0 s n 20 25 Valor tabla: -1.711 gl = 24 AGRO 5005 – CLAVE Lab 9 Decisión: Se rechaza H 0 Valor de t > tα Page 5 (revisado_oct 2015_LWB/RS) Funcion de densidad 0.39 T Student(24): p(evento)=0.0500 Densidad 0.29 0.20 0.10 0.00 -5.37 -2.69 0.00 2.69 5.37 Variable Valor p 0.39 T Student(24): p(evento)=0.0000 Densidad 0.29 0.20 Valor de p 0.10 0.00 -5.37 -2.69 0.00 2.69 5.37 Variable AGRO 5005 – CLAVE Lab 9 Page 6 (revisado_oct 2015_LWB/RS) d. H 0 : 430, H a : 430, n 10, Y 400, s 2 14, 0.01 t Y 0 400 430 25.3546 s n 14 10 Valor p (InfoStat): 0 Valor tabla: 3.250 Decisión: Se rechaza H 0 α/2=0.005 gl =9 Valor absoluto de t > tα/2 Funcion de densidad 0.39 T Student(9): p(evento)=0.0100 Valor de p T Student(9): p(evento)=0.0000 0.40 0.30 0.20 Densidad Densidad 0.29 0.10 0.20 0.10 0.00 -5.37 -2.69 0.00 Variable 2.69 5.37 0.00 -5.67 -2.83 0.00 2.83 5.67 Variable Valor de p AGRO 5005 – CLAVE Lab 9 Page 7 (revisado_oct 2015_LWB/RS) 3. Los rendimientos de 7 plantas de piña aleatoriamente escogidas, variedad “Cabezona”, fueron 4.2, 5.6, 4.3, 4.8, 5.7, 5.5 y 4.9 kg/planta. (a) Construya un intervalo de confianza del 95% para la media poblacional. (b) Pruebe H0: =4.5, Ha: 4.5 usando =.05. (c) Repita los pasos 1 y 2 usando InfoStat. a. Construya un intervalo de confianza del 95% para la media poblacional. α/2= 0.025 gl = 6 ̅ ⁄ ⁄ √ ( )[ ⁄ ] = 5 ± 0.57 √ (4.43, 5.57) b. Pruebe H0: =4.5, Ha: 4.5 usando =.05. tobs. Y 0 5 4.5 2.1461 y s n 0.6164 7 t 0.05 2.4469 2 ,6 Luego, no se rechaza H0. Función de densidad T Student(6): p(evento)=0.0500 0.38 Densidad 0.29 0.19 0.10 0.00 -6.12 -3.06 0.00 3.06 6.12 Variable c. Repita los pasos 1 y 2 usando InfoStat (menú Estadísticas > Inferencia Basada en una muestra > Prueba t para un parámetro). AGRO 5005 – CLAVE Lab 9 Page 8 (revisado_oct 2015_LWB/RS) Prueba T para un parámetro Valor del parámetro probado: 4.5 Variable Rendimientos n 7 Media 5.00 DE 0.62 LI(95) 4.43 LS(95) 5.57 T 2.15 p(Bilateral) 0.0755__ 4. Se condujo un experimento para examinar la susceptibilidad de raíces de cierta variedad de limonero a una larva específica. Cuarenta y un plantas se expusieron a la larva, y se examinaron luego de cierto tiempo. La respuesta de interés es el logaritmo del número de larvas por gramo encontradas en cada raíz. Para las 41 plantas estudiadas, la media muestral fue 9.02 y la desviación estándar 1.12. Pruebe la hipótesis que =10 versus <10 usando =.01. Calcule el valor p usando InfoStat. Construya un intervalo de confianza del 95% para la susceptibilidad media de las raíces. H 0 : 10 tobs. vs. H a : 10 , 0.01 Y 0 9.02 10 5.6027 s n 1.12 41 y t0.01, 40 2.4233 Decisión: Se rechaza H 0 Por lo tanto, a un nivel de significancia de 0.01 , hay susceptibilidad de las raíces de cierta variedad de limonero a una larva específica. AGRO 5005 – CLAVE Lab 9 Page 9 (revisado_oct 2015_LWB/RS) Valor de p = 0.00000085 El intervalo de confianza del 95%, es: IC0.95 : Y t0.025 s 2 9.02 (0.35) 9.02 (2.021) 1.12 n 41 IC0.95 : (8.67 ; 9.37) 5. En una compañía farmacéutica se desea comparar la presión arterial sistólica de empleadas que usan anticonceptivos orales vs. la presión arterial sistólica de empleadas que no usan anticonceptivos orales (todas entre 30 y 35 años de edad). Se obtuvieron dos muestras aleatorias: una de 8 empleadas que usan anticonceptivos orales y otra de 21 empleadas que no usan anticonceptivos orales, y se les midió la presión arterial (mm Hg). Los resultados fueron los siguientes: Usan anticonceptivos orales: n=8, Y = 132.8 mm Hg, s=15.3 mm Hg No usan anticonceptivos orales: n=21, Y = 127.4 mm Hg, s=18.2 mm Hg a. Conduzca una prueba para determinar si se cumple con el supuesto de varianzas poblacionales iguales. b. Conduzca una prueba** para determinar si hay diferencias significativas entre las medias. Use =.05 c. Pruebe** si las empleadas que usan anticonceptivos orales tienen una presión arterial sistólica mayor (en promedio) que las no los usan. Use =.05. **En este ejercicio, hacemos dos diferentes pruebas de hipótesis para practicar. En realidad, cosas como la naturaleza del experimento y la experiencia del investigador con los tratamientos evaluados determinan la hipótesis apropiada. Por ejemplo, si se sospecha a priori que el uso de anticonceptivos puede aumentar la presión, entonces la hipótesis alterna debe ser Ha: anticonceptivos > no anticonceptivos. a. Podemos usar el cociente entra las varianzas muestrales como criterio aproximado: (331.24/234.09) = 1.415 La varianza mayor dividida por la menor nos da un cociente menor de 3. Concluimos que el supuesto de varianzas poblacionales iguales es aceptable. AGRO 5005 – CLAVE Lab 9 Page 10 (revisado_oct 2015_LWB/RS) b. ( ) ( ̅ ) ̅ √ √ √ = 2.052 Por lo tanto Ho no se rechaza, es decir a 0.05 nivel de significancia, no hay diferencias significativas entre las medias de la presión sistólica de las empleadas que usan y que no usan anticonceptivos. c. tobs = 0.7431 (como arriba) = 1.703 Por lo tanto Ho no se rechaza. No hay evidencia para decir que la presión sistólica de las enfermeras que usan anticonceptivos es mayor que la de las que no usan anticonceptivos. 6. Un inspector de control de contaminación sospechaba que una comunidad ribereña estaba descargando aguas servidas no-tratadas en el río y eso cambiaba el nivel de oxígeno disuelto en el río. Para probar esto, obtuvo 5 muestras aleatorias de agua del río en una zona río arriba del pueblo, y otras 5 muestras en una zona río abajo del pueblo. Se midieron los niveles de oxígeno disuelto, en ppm. ¿Proveen los datos evidencia de un contenido menor de oxígeno río abajo? Use =.05. (No se olvide de considerar los resultados de la prueba de t’ (de igualdad de varianzas) antes de utilizar los resultados de la prueba regular de t!) **Aquí la hipótesis alterna de una cola se justifica porque hay razones para sospechar que hay mayor contaminación río abajo. En general, la hipótesis alterna apropiada depende de la naturaleza del experimento, experiencia del investigador con los tratamientos probados, etc. La hipótesis alterna se define antes de realizar el experimento (colectar datos), o sea, no depende de las medias de los tratamientos (obtenidos en el experimento) AGRO 5005 – CLAVE Lab 9 Page 11 (revisado_oct 2015_LWB/RS) Río arriba: 4.8, 5.2, 5.0, 4.9, 5.1 Río abajo: 5.0, 4.7, 4.9, 4.8, 4.9 En InfoStat, se entra la información para el análisis en dos columnas. Es importante notar que se clasifica cada dato de acuerdo con dónde vino la muestra (río arriba o río abajo) InfoStat trata la media de “rio abajo” (en vez de “río arriba”) como “1” (porque en orden alfabético, “abajo” viene antes de “arriba”). Para hacer el análisis correctamente en InfoStat, hay que seleccionar la opción de unilateral IZQUIERDA. La hipótesis alterna es: Ha: abajo < arriba (en vez de arriba > abajo) Y InfoStat calcula tobservado con ̅ abajo - 𝒀 ̅ arriba en vez de 𝒀 ̅ arriba - 𝒀 ̅ abajo 𝒀 AGRO 5005 – CLAVE Lab 9 Page 12 (revisado_oct 2015_LWB/RS) Rio abajo ha sido definido por InfoStat como “1” (porque en orden alfabético, “Rabajo” viene antes de “Rarriba”). La prueba es de la cola IZQUIERDA Prueba de la homogenidad de varianzas: Como p(Var.Hom.) > , podemos concluir que las varianzas son iguales. Se justifica el uso del estadístico t Prueba de t opción#1: Como p > α, (o sea, 0.0735 > 0.05), se acepta la hipótesis nula. No hay evidencia de menor de oxígeno disuelto río abajo del pueblo. Prueba de t opción#2: Otra manera de probar la hipótesis es comparando tobs (-1.61) con ttab (1.860). tobs está en la área de aceptación. Se acepta la Ho. No hay evidencia de menor oxígeno disuelto río abajo del pueblo. Haciendo los cálculos a mano: Ho: arriba = abajo Ha: arriba > abajo (hipótesis unilateral derecho) Si definimos la hipótesis alterna en esta manera, el t observado se calcula con ̅ arriba - ̅ abajo OJO: las hipótesis arriba también pueden ser expresadas en la siguiente manera: Ho: abajo = arriba Ha: abajo < arriba (hipótesis unilateral izquierdo) Si definimos la hipótesis alterna en esta manera, el t observado se calcula con ̅ abajo - ̅ arriba s 2 p 2 2 s Arriba s Abajo tobs. 2 YArriba YAbajo sp 2 n 0.013 0.025 0.019 2 5 4.86 0.019 2 1.606 5 t0.05, 8 1.860 AGRO 5005 – CLAVE Lab 9 Page 13 (revisado_oct 2015_LWB/RS) Luego, no se rechaza H 0 . Es decir, no hay evidencia de un contenido menor de oxígeno disuelto río abajo del pueblo. 7. A una investigadora le interesa comparar un régimen de líquidos de agua solamente (grupo 1) con un régimen de suero líquido solamente (grupo 2) en vacas lecheras. Se realizó un estudio en 16 vacas lecheras para hacer esta comparación. Ocho vacas fueron asignadas aleatoriamente al grupo 1, y las otras ocho al grupo 2. Además de los tratamientos, a cada animal se le dio 7.5 kg de grano por día, y se le permitió comer heno a su voluntad. Se registró, entre otras cosas, la cantidad de heno (en kg/vaca) consumido diariamente. Grupo 1: 15.1, 14.9, 14.8, 14.2, 13.1, 12.8, 15.5, 15.9 Grupo 2: 6.8, 7.5, 8.6, 8.4, 8.9, 8.1, 9.2, 9.5 (a) Como la investigadora no tiene información a priori sobre los posibles efectos de los dos regímenes, la hipótesis apropiada es probar sí hay diferencias entre los consumos diarios promedios de heno en los dos grupos (use =.01). Use InfoStat y los cálculos hechos a mano para hacer la prueba. (No se olvide considerar los resultados de la prueba de t’ (de igualdad de varianzas; use =.05) antes de utilizar los resultados de la prueba regular de t!) (b) Construya un intervalo de confianza del 99% para la verdadera diferencia entre la medias de ambos grupos. El intervalo obtenido, ¿contiene el valor 0? ¿Qué relación tiene esto con sus conclusiones en la parte a? (c) ¿Cuáles son los supuestos necesarios para las pruebas realizadas en la parte a? Comente sobre su validez en este caso (grafique los datos si fuese necesario). Se cumple con el supuesto de igualdad de varianzas (0.5948 > 0.05 – se acepta la Ho de igualdad de varianzas) a) Se rechaza la Ho (0.0001 < 0.01). Hay diferencias entre los grupos en cuanto consumode heno. Grupo 1 consumió significativamente más heno (14.538) que el grupo 2 (8.375). (OJO: En una prueba de dos colas donde se rechaza la Ho (como este ejemplo), el procedimiento normal es mirar las dos medias para determinar cuál fue el mejor tratamiento. H 0 : 1 2 AGRO 5005 – CLAVE Lab 9 vs. H a : 1 2 , 0.01 Page 14 (revisado_oct 2015_LWB/RS) ̅ √ ̅ √ √ = 2.977 Por lo tanto, se rechaza H 0 . Es decir, existen diferencias significativas entre los consumos diarios promedios de heno en los dos grupos. El valor p es congruente con esta decisión. Las vacas de grupo 1 consumieron mayor cantidad de heno. b. Y1 Y2 t 2 sp 1 1 . n1 n2 Intervalo de Confianza de 99% de la diferencia entre medias: (14.538 – 8.375) + 2.977 x √ x√ = 6.163 + 1.4933 = 4.6697; 7.6563 = 4.67; 7.66 El intervalo de confianza no contiene el valor 0. El intervalo de confianza de la diferencia contiene el valor 0 solamente en el caso donde las medias no significamente diferentes (que no es el caso aquí). c. Para que la prueba sea válida, se necesitan realizar tres supuestos: 1. Poblaciones normales: con 8 datos no se puede apreciar (haría falta un n mas grande…) 2. Varianzas iguales: Como p(Var.Hom.) > α, podemos usar el estadístico t y asumir que las varianzas son iguales . 3. Muestras independientes. Se cumple AGRO 5005 – CLAVE Lab 9 Page 15 (revisado_oct 2015_LWB/RS) Grupo= G2 0.40 0.40 0.30 0.30 frecuencia relativa frecuencia relativa Grupo= G1 0.20 0.10 0.00 12.4 13.2 14.0 14.7 Heno_Kg/Vaca AGRO 5005 – CLAVE Lab 9 15.5 16.3 0.20 0.10 0.00 6.5 7.1 7.8 8.5 9.2 9.8 Heno_Kg/Vaca Page 16