PRÁCTICA 3: Ejercicios del capítulo 5 1. Una empresa bancaria ha contratado a un equipo de expertos en investigación de mercados para que les asesoren sobre el tipo de campaña publicitaria más recomendable para la venta de un producto. El equipo ha propuesto tres campañas (C1, C2 y C3) y ha aplicado cada una de ellas en 4 sucursales bancarias seleccionadas aleatoriamente. Transcurrido un tiempo se ha registrado el número de ventas del producto. a) Indica las variables que intervienen y su función 1. Tipo de campañas: (C1, C2 y C3) ............... Variable independiente o factor 2. Nº ventas de un producto ........................... Variable dependiente b) Selecciona el modelo más adecuado de ANOVA para resolver este problema Tenemos una VI a efectos fijos (niveles pre-fijados por el investigador) Todos los sujetos (n = 4; en este caso sucursales) pasan por todos los niveles del factor: Medidas Repetidas ANOVA de 1 factor a efectos fijos con Medidas Repetidas c) Si F = 4,78 y P(F ≤ 4,78) = 0,86. ¿Cuál sería tu decisión sobre la hipótesis planteada con α = 0,01? F 2, 6 Si P(F ≤ 4,78) = 0,86 entonces p = P(F ≥ 4,78) = 0,14 Como p > α: Se mantiene H0 con un nc de 0,99 p = 0,1 4 4 ,7 8 d) ¿Podría afirmarse que la relación entre las variables es de tipo lineal? ¿Por qué? No. Primero, porque hemos mantenido la hipótesis nula, luego no puede afirmarse que haya relación entre las variables. En caso de haber rechazado H0, pese a que J = 3 y pudiera admitir relación lineal y cuadrática (J-1), no puede hablarse en estos términos ya que el factor considerado no es de tipo cuantitativo sino cualitativo (campaña 1, 2 y 3). 1. 2. Un psicólogo clínico desea evaluar la eficacia de un fármaco para reducir la ansiedad. Para ello selecciona al azar 15 pacientes de su consulta que sufren este problema y forma aleatoriamente tres grupos del mismo tamaño. A cada grupo le administra aleatoriamente una dosis del fármaco (10 miligramos, 20 mg. y 30 mg). Al cabo de un tiempo les mide su nivel de ansiedad. Los resultados obtenidos se muestran en la siguiente tabla: 10 mg. 20 mg. 30 mg. 7 4 2 8 4 3 8 5 2 9 6 2 8 6 1 a) Indica las variables que intervienen en el problema y la función que desempeñan Tenemos una VI que es la dosis del fármaco con tres niveles asignados a efectos fijos (pre-fijados por el investigador) El nivel de ansiedad es la variable dependiente cuantitativa b) Selecciona el modelo de ANOVA más apropiado, plantea la hipótesis pertinente y toma una decisión con α = 0,05 ANOVA de 1 factor a efectos fijos completamente aleatorizado 1. PLANTEAMIENTO DE HIPÓTESIS H0: µ1 = µ2 = µ3. O bien: Σ αj2 = 0 Es decir: - Las J medias poblacionales son iguales - La VI o factor no se relaciona con la VD. H1: µj ≠ µj’. Es decir: - No todas las µj son iguales; al menos 1 difiere de otra (no sabemos cuál) - La VI o factor influye sobre la VD. 2. SUPUESTOS Independencia: Las J muestras son aleatorias y las N observaciones independientes Normalidad: Las J poblaciones de donde se extraen las J muestras son normales Homocedasticidad: Las J poblaciones tienen, todas, la misma varianza 3. ESTADÍSTICO DE CONTRASTE F= MCI → F J – 1, N – J MCE Cálculo del estadístico de contraste: 10 mg. 20 mg. 30 mg. 7 4 2 8 4 3 8 5 2 9 6 2 8 6 1 Total: Tj Yj 40 25 10 75 8 5 2 5 2. Cálculo de sumas de cuadrados: ∑∑Y i 2 ij j = 473 T = 75 N = 15 75 2 T2 = 473 − = 473 − 375 = 98 SCT = ∑ ∑ Y − 15 N i j 2 ij SCI = ∑ j T j2 T 2 40 2 + 25 2 + 10 2 − = − 375 = 465 − 375 = 90 nj N 5 SCE = SCT - SCI = 98 – 90 = 8 Cálculo de Medias cuadráticas: MCI = SCI 90 = = 45 J -1 2 MCE = ) 8 SCE = = 0,6 6 ... N - J 15 − 3 Estadístico de contraste: F = MCI 45 = ) = 67 ,50 MCE 0,6 6 ... Tabla-resumen del ANOVA A-EF-CA FV SC g.l. MC Estadístico F INTERGRUPOS (I) SCI =90 J–1=2 MCI = 45 F = 67,50 ERROR (E) O INTRAGRUPOS SCE = 8 N – J = 12 MCE = 0,66 TOTAL (T) SCT = 98 N – 1 = 14 4. REGLA DE DECISIÓN Rechazar H0 si: F ≥ 1 - α F J – 1, N – J: ............. 0,95 F 2, 12 = 3,89 Donde: F = 67,50 > 3,89 5. DECISIÓN Puesto que el estadístico F cae en la zona crítica, se rechaza H0 con un nc del 95% Podemos concluir que las medias poblacionales en ansiedad no son iguales. No sabemos cuáles difieren entre sí, pero al menos hay 1 que difiere de otra (puede comprobarse mediante las comparaciones múltiples). Por tanto, la dosis de fármaco afecta al nivel de ansiedad. 3. c) ¿Existe relación entre la dosis del fármaco y el nivel de ansiedad? Sí existe relación, pues cada dosis produce un nivel de ansiedad diferente. Además, hemos rechazado la hipótesis nula del ANOVA. d) En caso afirmativo: Interpreta gráfica y estadísticamente el tipo de relación Interpretación gráfica: Yj Medias marginales estimadas 9 8 10 mg 20 mg 30 mg 7 6 5 4 8 5 2 La relación aparentemente parece lineal inversa 3 2 1 10 mg 20 mg 30 mg DOSIS Interpretación estadística: Comparaciones de tendencia 1. PLANTEAMIENTO DE HIPÓTESIS H0(lineal): H1(lineal): Lh = Σ cj µj = (-1)µ1 + (0)µ2 + (1)µ3 = 0 Lh = Σ cj µj = (-1)µ1 + (0)µ2 + (1)µ3 ≠ 0 H0(cuadrática): Lh = Σ cj µj = (1)µ1 + (-2)µ2 + (1)µ3 = 0 H1(cuadrática): Lh = Σ cj µj = (1)µ1 + (-2)µ2 + (1)µ3 ≠ 0 Para obtener cj ver tabla G (pág. 575). 2. SUPUESTOS: Como en el ANOVA: independencia, normalidad y homocedasticidad 3. ESTADÍSTICO DE CONTRASTE Lˆ h = ∑ c j X j L̂ h(lineal) = (-1)X 1 + (0)X 2 + (1)X 3 = (-1)(8) + (0)(5) + (1)(2) = −6 L̂ h(cuadrática) = (1)X 1 + (−2)X 2 + (1)X 3 = (1)(8) + (−2)(5) + (1)(2) = 0 Continuamos sólo para la hipótesis sobre linealidad: Fh ( lineal ) = SC( L̂ hlineal ) Donde: SC(L̂ h ) = Fh ( lineal) = → MCE (L̂ h ) 2 ∑c 2 j /n j = 1 - αF1, g.l.error ( − 6) 2 = 90 ; (1 + 0 + 1) / 5 90 = 134,33 → 0,67 0,95F1, 12 Fh ( lineal ) ≥ = 4,75 4. ZONA CRÍTICA: Rechazar H0 si 1 - αF1, g.l.error = 0,95F1, 12 = 4,75 5. DECISIÓN: Rechazar H0 pues el estadístico de contraste Fh(lineal) cae en la zona crítica. Por tanto, la relación entre tipo de dosis y nivel de ansiedad es lineal inversa: a más dosis, menor ansiedad. 4. e) Cuantifica el tamaño de dicha relación El tamaño del efecto puede medirse mediante: SCI 90 η2 = = = 0,92 SCT 98 ε2 = SCI-( J-1) MCE 90 − (2)(0,67) = = 0,90 SCT 98 ω2 = SCI-( J-1) MCE 90 − (2)(0,67) = = 0,90 SCT + MCE 98 + 0,67 η2, ε2 y ω2 son todos estimadores de ρ2, (coeficiente de determinación: proporción de varianza explicada entre VI y VD). En este caso, la dosis del fármaco explica entre el 90 y el 92% del nivel de ansiedad experimentado por los sujetos. f) Comprueba si el nivel de ansiedad con la dosis de 10 mg. difiere del nivel de las restantes consideradas juntas 1. PLANTEAMIENTO DE HIPÓTESIS H0: Lh = Σ cj µj = (2)µ1 + (-1)µ2 + (-1)µ3 = 0 ; Los promedios comparados son iguales H1: Lh = Σ cj µj = (2)µ1 + (-1)µ2 + (-1)µ3 ≠ 0 ; algún (-os) promedio(-s) difiere(-n) significativamente de otro(-s) 2. SUPUESTOS: Como en el ANOVA: independencia, normalidad y homocedasticidad 3. ESTADÍSTICO DE CONTRASTE DMSScheffé = ( J − 1)1-α FJ −1, g.l.eror MCE∑ j c 2j nj = = (3 − 1) 0,95 F2,12 0,67(4+ 1 + 1)/5 = (2)(3,89) (0,67)(1,2) = 2,04 4. REGLA DE DECISIÓN: Rechazar H0 si | L̂h | ≥ DMS L̂ h = (2)X 1 + (−1)X 2 + (−1)X 3 = (2)(8) + (−1)(5) + (−1)(2) = 9 Puesto que | L̂h | = 2 ≥ DMS = 2,04, se rechaza H0: Puede concluirse que existen diferencias significativas en ansiedad cuando se administra una dosis de 10 mg que cuando se administra una de entre 20 y 30 mg. En el último caso la ansiedad es menor. 5. 3. Un investigador en psicología evolutiva ha estudiado los efectos de cuatro técnicas de estudio sobre el aprendizaje del idioma inglés en una muestra aleatoria de 20 niños. Los 4 grupos del mismo tamaño se han formado aleatoriamente y han sido asignados a cada tratamiento al azar. Algunos de los resultados se muestran en la siguiente tabla: F.V. I E T SC ( ( g.l. ) ) 80 ( ( ( MC ) ) ) ( F ) ( ) Punto crítico 4,83 1,75 a) Define las variables y el tipo de diseño de ANOVA que se ha aplicado Tipo de técnica de estudio ...................... Variable independiente a efectos fijos Aprendizaje del inglés ............................ Variable dependiente ANOVA de 1 factor a efectos fijos en un diseño completamente aleatorizado b) Completa la tabla Primero los grados de libertad: N = 20, J = 4 F.V. I E T g.l. (J-1=3) (N - J = 20 - 4 = 16 ) ( N - 1 = 19 ) Luego las Sumas de Cuadrados: Se conoce SCT = 80 Se puede despejar SCE = (MCE)(N - J) = (1,75)(16) = 28 SCI = SCT - SCE = 80 – 28 = 52 Luego las Medias Cuadráticas: Se conoce ya MCE = 1,75 MCI = SCI / J - 1 = 52 / 3 = 17,33 Estadístico de contraste F: Se conoce F = MCI / MCE = 17,33 / 1,75 = 9,90 c) ¿Qué decisión estadística es razonable tomar según los datos? Puesto que F = 9,9 > punto crítico = 4,83: Se rechaza H0 6. 4. Un profesor de matemáticas de una facultad evalúa su asignatura a partir de tres controles que se realizan a lo largo del curso y hacen media con la nota del examen final. El profesor desea saber si el rendimiento de los alumnos ha ido aumentando en cada uno de los controles. Para ello selecciona aleatoriamente una muestra de 5 alumnos. Sus calificaciones obtenidas en los tres controles se muestran en la siguiente tabla: Control 1 Control 2 Control 3 5 6 7 4 5 6 5 6 8 3 4 5 1 2 4 a) Indica las variables que intervienen en el problema y la función que desempeñan Tipo de control: 1, 2 y 3 ............... Variable independiente Calificaciones de los alumnos ...... Variable dependiente b) Selecciona el modelo de ANOVA más apropiado, plantea la hipótesis pertinente y toma una decisión con α = 0,05 ANOVA de 1 factor a efectos fijos con medidas repetidas 1. PLANTEAMIENTO DE HIPÓTESIS H0: µ +1 = µ +2 = µ +3 Es decir: - Las J medias poblacionales son iguales - La VI o factor no se relaciona con la VD. H1: µ +j ≠ µ +j’. Es decir: - No todas las µ +j son iguales; al menos 1 difiere de otra - La VI (o factor) influye sobre la VD. 2. SUPUESTOS Independencia: n observaciones extraídas aleatoriamente e independientes entre sí Normalidad: Las J poblaciones de donde se extraen las J muestras son normales Homocedasticidad: Las J poblaciones tienen, todas, la misma varianza Aditividad: Los sujetos no interactuan con los tratamientos ni con los errores. Las covarianzas entre las puntuaciones de cada par de tratamientos son iguales 3. ESTADÍSTICO DE CONTRASTE F= MCI MCE → F J – 1, (J - 1)( n – 1) S1 S2 S3 S4 S5 T+j Y+ j Control 1 Control 2 Control 3 Ti+ 5 6 7 18 4 5 6 15 5 6 8 19 3 4 5 12 1 2 4 7 18 23 30 T = 71 3,6 4,6 6 Yi + 6 5 6,33 4 2,33 ∑∑Y i j 2 ij Y= 4,73 = 383 T = 71 N = 15 T 2 712 = = 336,07 15 N 7. Cálculo de sumas de cuadrados: SCT = ∑ ∑ Yij2 − i SCI = ∑ j 2 T+ j n j SCB = ∑ i − T2 = 383 − 336,07 = 46,93 N T 2 18 2 + 23 2 + 30 2 = − 336,07 = 14,53 5 N Ti +2 T 2 18 2 + 15 2 + 19 2 + 12 2 + 7 2 − = − 336,07 = 31,6 3 J N SCE = SCT - SCI - SCB = 46,93 – 14,53 – 31,6 = 0,80 Cálculo de Medias cuadráticas: MCI = SCI 14 , 53 = = 7 , 265 J -1 2 MCE = SCE 0,80 = = 0,10 ( J − 1)( n − 1) ( 2 )( 4 ) Estadístico de contraste: F = MCI 7 , 265 = = 72 , 65 MCE 0 ,1 Tabla-resumen del ANOVA A-EF-CA FV SC g.l. MC Estadístico INTERGRUPOS (I) SCI = 14,53 J–1=2 MCI = 7,265 F = 72,65 INTERSUJETOS (S) SCB = 31,6 n–1=4 ERROR (E) O INTRAGRUPOS SCE = 0,80 (J - 1)(n - 1) = 8 TOTAL (T) SCT = 46,93 N – 1 = 14 MCE = 0,10 4. REGLA DE DECISIÓN Rechazar H0 si: F ≥ F J – 1, (J - 1)( n – 1): ............. 0,95 F 2, 8 = 4,46 Donde: F = 72,65 > 4,46 5. DECISIÓN Puesto que el estadístico F cae en la zona crítica, se rechaza H0 con un nc del 95% Podemos concluir que las medias poblacionales en los controles no son iguales. No sabemos cuáles difieren entre sí, pero al menos hay 1 que difiere de otra. Por tanto, el tipo de control afecta al rendimiento de los alumnos. 8. c) ¿Puede afirmarse que los alumnos obtienen mejores calificaciones en el último control? Y1 Y2 Yj Y1 − Y2 = 3,6 − 4,6 = 1 Y1 − Y3 = 3,6 − 6 = 2,4 Y2 − Y3 = 4,6 − 6 = 1,4 Y2 1. PLANTEAMIENTO DE HIPÓTESIS H0: Lh = µi − µj =0 ; Los promedios comparados son iguales H1: Lh = µi − µj ≠ 0 ; Los promedios comparados difieren entre sí 2. SUPUESTOS: Como en el ANOVA: independencia, normalidad y homocedasticidad 3. ESTADÍSTICO DE CONTRASTE DMSTukey =1-α q J , g.l.eror = 0,95 q3,8 4. MCE 1 1 + = 2 n j n j' 0,10 1 1 + = 4,04 0,02 = 0,57 2 5 5 REGLA DE DECISIÓN: Rechazar H0 si | L̂h | = |Yj – Yj’| ≥ DMS ♦ Control l y Control 2: Y1 − Y2 = 1 > DMS = 0,57: Rechazar H0: existen diferencias significativas entre la calificación en el control 1 y 2 ♦ Control l y Control 3: Y1 − Y3 = 2,4 > DMS = 0,57: Rechazar H0: existen diferencias significativas entre la calificación en el control 1 y 3 ♦ Control 2 y Control 3: Y2 − Y3 = 1,4 > DMS = 0,57: Rechazar H0: existen diferencias significativas entre la calificación en el control 2 y 3 Los sujetos obtienen mejores calificaciones en el último control si se compara con el primero y con el segundo 9.