EJERCICIOS PROPUESTOS – RELACIÓN ENTRE VARIABLES CUALITATIVAS Se ensayaron cuatro vacunas para prevenir el resfrío común. Se catalogó de fracaso (F) si el individuo vacunado se resfriaba en los tres meses siguientes a la vacuna y de éxito (E) si no se resfriaba en igual plazo. Vacuna A B C D Total Fracaso 6 12 18 17 53 Exito 37 23 27 20 107 Total 43 35 45 37 160 Completando los datos faltantes en la siguiente tabla de trabajo, calcule el test de Ji cuadrado y concluya sobre el test usando la tabla: Celda O E (O-E)2 /E AF 6 14,2 4,7 BF 12 11,6 0,0 CF DF 17 12,2 1,9 QE 37 28,8 2,3 BE CE 27 30,1 0,3 DE 20 24,8 0,9 160 160 χ2 = En 1750 personas clasificadas según su hábito de fumar y según si sufren o no de bronquitis, se estudió la asociación entre ambas variables con los siguientes resultados: Hábito de fumar Fuma No fuma Total - Bronquitis crónica Sí Nº % 140 56,0 500 33,3 640 36,6 No Nº 110 1000 1110 % 44,0 66,7 63,4 Total Nº 250 1500 1750 % 100,0 100,0 100,0 Determine mediante una prueba de Ji Cuadrado si la aparente falta de independencia entre el hábito de fumar y la probabilidad de sufrir de bronquitis crónica es estadísticamente significativa. Los resultados de dos tratamientos para ratas leucémicas, medidos en términos de remisión completa, se presentan en la siguiente tabla: Remisión completa Tratamientos Sí No Total Methyl/GAG 7 3 10 6 - MP 2 7 9 Total 9 10 19 Use la salida de SPSS para determinar si hay una diferencia estadísticamente significativa entre los porcentajes de remisión logrados con ambos tratamientos. Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl Pruebas de chi-cuadrado Chi-cuadrado de Pearson Corrección por a continuidad Razón de verosimilitud Estadístico exacto de Fisher Asociación lineal por lineal N de casos válidos 1 Sig. asintótica (bilateral) .037 2.632 1 .105 4.535 1 .033 Valor 4.337b gl 4.109 1 Sig. exacta (bilateral) Sig. exacta (unilateral) .070 .051 .043 19 a. Calculado sólo para una tabla de 2x2. b. 3 casillas (75.0%) tienen una frecuencia esperada inferior a 5. La frecuencia mínima esperada es 4.26. Un grupo de investigadores, al estudiar la relación entre el tipo sanguíneo y la severidad de una afección en la población, reunió los datos de 1500 personas, los cuales se presentan en la tabla de contingencia adjunta. Los investigadores desean saber si estos datos son compatibles con la hipótesis de que el grado de la afección y el tipo sanguíneo son independientes. Severidad de la condición Ausente Moderada Severa Total A 543 44 28 615 Tipo de sangre B AB O 211 90 476 22 8 31 9 7 31 242 105 538 Total 1320 105 75 1500 a) Calcule las distribuciones marginales. Interprete. b) Calcule la distribución condicional de interés. Interprete. c) Use los resultados adjuntos para entregar una conclusión a los investigadores con un nivel de significación del 5%. Salida del programa SAS del test de hipótesis de Ji cuadrado de independencia o de asociación: Statistic Chi-Square DF Value Prob 6 5.116 0.529 Quinientos empleados de una empresa que fabrica cierto producto, sospechoso de estar asociado con alteraciones respiratorias, se clasificaron en forma cruzada con base en su grado de exposición al producto y si tenían o no los síntomas de tales alteraciones respiratorias. Los resultados se muestran en la siguiente tabla. ¿Proporcionan estos datos la evidencia suficiente para indicar que, en un nivel de significación de 0,1, existe una relación entre el grado de exposición y la presencia de los síntomas de las alteraciones respiratorias? Síntomas presentes Sí No Total Alto 185 120 305 Limitado 33 73 106 Nivel de exposición Sin exposición conocida 17 72 89 a) Calcule las distribuciones marginales. Interprete. b) Calcule la distribución condicional de interés. Interprete. c) Use los resultados adjuntos para entregar una conclusión a los investigadores. Salida del programa SAS del test de hipótesis de Ji cuadrado: Statistic Chi-Square DF 2 Value Prob 61.356 0.001 Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl Total 235 265 500 Quinientos niños de escuela primaria fueron clasificados en forma cruzada de acuerdo con el grupo socioeconómico al que pertenecen y la presencia o ausencia de cierto defecto en el lenguaje. Los resultados fueron los siguientes: Defecto del lenguaje Presente Ausente Total Alto 8 42 50 Grupo socioeconómico Medio alto Medio bajo 24 32 121 138 145 170 Bajo 27 108 135 Total 91 409 500 ¿Son compatibles estos datos con la hipótesis de que el defecto en el lenguaje está relacionado con el grupo socioeconómico? a) Calcule las distribuciones marginales. Interprete. b) Calcule la distribución condicional de interés. Interprete. c) Use la salida adjunta para sacar sus resultados y entregar una conclusión a los investigadores: TABLE OF DEFECTO BY NSE DEFECTO NSE Frequency‚ Percent ‚ Row Pct ‚ Col Pct ‚alto si no ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ Total 8 1.60 8.79 16.00 42 8.40 10.27 84.00 50 10.00 ‚medioa ‚mediob ‚bajo ‚ Total ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ ‚ 91 18.20 24 4.80 26.37 16.55 121 24.20 29.58 83.45 145 29.00 32 6.40 35.16 18.82 138 27.60 33.74 81.18 170 34.00 27 5.40 29.67 20.00 108 21.60 26.41 80.00 135 27.00 409 81.80 500 100.00 STATISTICS FOR TABLE OF DEFECTO BY NSE Statistic Chi-Square DF 3 Value 0.765 Prob 0.858 A un grupo de 350 adultos que participaron en una escuela de salud, se les preguntó si llevaban o no una dieta. Las respuestas (por sexos) son las siguientes: Dieta Sexo A dieta Sin dieta Total Masculino 14 159 173 Femenino 25 152 177 Total 39 311 350 ¿Sugieren estos datos que el estar a dieta depende del sexo? Sea α=0,05 a) Calcule las distribuciones marginales. Interprete. b) Calcule la distribución condicional de interés. Interprete. c) Use los resultados adjuntos para entregar una conclusión a los investigadores. Statistic Chi-Square DF 1 Value 3.215 Instituto de Matemática y Física – Universidad de Talca estadistica@utalca.cl Prob 0.073