Actas del XI Congreso de Metodología de las Ciencias Sociales y de la Salud ISBN 978-84-613-7589-9 POTENCIA DEL ESTADÍSTICO f VS. F CUANDO NO SE ASUME LA NORMALIDAD José Fernando García Pérez1, Enrique Gracia1, Sergio Murgui2 y M. del Castillo Fuentes1 1 Universidad de Valencia 2 Universidad Católica de Valencia El estadístico ‘f’ se computa como el ‘F’ de Snedecor si bien suponiendo que la distribución de la población padre es rectangular y discreta. Este estadístico ha sido recomendado para las situaciones en que la distribución de la variable dependiente es asimétrica. Las colas largas pueden incrementar considerablemente la varianza del error y, consecuentemente, la probabilidad del error del Tipo II. En este trabajo se presentan varias simulaciones para determinar la potencia y el error del Tipo I de los dos estadísticos, ‘f’ y ‘F’, variando: a) la asimetría de la variable dependiente, b) el tamaño de la muestra, y c) el tamaño del efecto. El estadístico f (García, Pascual y Frías, 2002; Pérez, Navarro y Llobell, 2000; Pérez, Llobell, Navarro, 2004) se define formalmente a partir de una población padre, la de medida, que sea una variedad de la distribución rectangular (uniforme) discreta R, con un recorrido entre los valores 1, el mínimo, y R, el máximo, de tal manera que 1 r R¸ siendo r cualquier número entero 1, 2, …, R. La función de probabilidad en cualquier punto r será 1/R, y el de distribución, r/R. Los momentos centrales de esta familia de distribuciones también se conocen, siendo la m = (R + 1)/2 y la s2 = (R + 1)(R – 1)/12. Son siempre distribuciones simétricas con una curtosis de (3 – (4/(R + 1)(R + 3)))(3/5) (Evans, Hastings y Peacock, 1993). Una función de probabilidad rectangular discreta implica una forma acumulada de la población padre de R incrementos constantes con igual amplitud, un concepto de escala lineal que es monotónicamente creciente respecto de una unidad de 1/R proporciones de la distribución (Pérez, 2008). A diferencia del estadístico F que asume una distribución padre normal, la distribución f implica una transformación de las puntuaciones directas para que se ajusten a la distribución rectangular uniforme discreta (Pérez et al., 2004). La unidad de la medida directa del estudio, como sean los microsegundos para el tiempo de reacción, el acierto para el número de aciertos en una tarea experimental, cada punto de las escalas Likert para la suma de las respuestas de una factor de personalidad, ya no pueden seguir una relación lineal con las puntuaciones Rtiles, conservando únicamente la relación de orden con las unidades de medida directa de la conducta (García et al., 1999; Pérez, 2008). Se impone sobre el proceso de transformación de los datos una restricción de muchos a uno de manera que una parte variable de valores directos pasan a tener una misma puntuación Rtil conservando los valores así transformados únicamente una relación de orden con los directos. Perdiendo la relación lineal los valores de la escala directa de medida de la conducta y los de la Rtil (Pérez, 2008). Considerando el paralelismo entre la forma de los valores distribuidos con la escala de medida directa cuando la forma original sea normal el estadístico F será más potente y limitará el error del Tipo I a los valores nominales (Bono y Arnau, 1995; García, Pascual, Frías, Van Krunckelsven y Murgui, 2008). Sin embargo, cuando la forma de los valores distribuidos en la escala de medida directa presente una forma que no se ajuste a la distribución normal (e.g., el alargamiento de las colas) el estadístico F será menos potente que el f (García et al., 2002; Pérez et al., 2000; Pérez et al., 2004). Los valores extremos de la distribución implican un incremento considerable en el componente de varianza de error que ocasiona la consecuente pérdida de potencia (García, Musitu y Veiga, 2006). Fijando el tamaño del efecto, el tamaño muestral y el margen nominal del error del Tipo I, F será más potente para distribuciones padre normales y f para las que no lo sean (García et al., 2008). 204 Actas del XI Congreso de Metodología de las Ciencias Sociales y de la Salud ISBN 978-84-613-7589-9 Cuando el tamaño del efecto es grande (Tabla 3) se aprecian ocho excepciones que se han marcado en negrita. No hay diferencias significativas (a = 0,05) entre los errores del Tipo I en la distribución normal, F(1, 22) = 2,28, entre la prueba F y la f (M = 5,25, DT = 0,83 vs. M = 4,95; DT = 2,40), tampoco en c2 hay diferencias, F(1, 22) < 0,96 (M = 2,50, DT = 1,12 vs. M = 3,65; DT = 2,33). Discusión Los resultados del trabajo confirman de manera bastante satisfactoria las previsiones de que la prueba F es más potente para distribuciones con la forma normal y la f para cuando no lo son (una distribución asimétrica) (García et al., 2002; Pérez et al., 2000; Pérez et al., 2004). También es importante destacar que los resultados confirman que el error del Tipo I se mantiene en márgenes semejantes para las dos pruebas independientemente de la forma de la distribución. Las limitaciones de este trabajo proceden del reducido número de réplicas que se han realizado, aspecto que se deberá tener en cuenta en distintos trabajos. Si bien los resultados son extraordinariamente buenos con las muestras grandes que requieren un tamaño del efecto pequeño, también es cierto que al disminuir el tamaño del efecto y reducir el tamaño de las muestras, algunos resultados (muestras pequeñas, menos de 20 observaciones, y con R muy pequeño, 2 y 3) no fueron tan claros (García et al., 2002). Sucesivos trabajos tienen que determinar si se trata de que las réplicas fueron pocas o más bien se trata de que el estadístico f requiere muestras mayores cuando R es muy pequeño (menor de 4) aunque el tamaño del efecto sea grande. Referencias Bono, R. & Arnau, J. (1995). General considerations about statistical power studies. Anales de Psicología, 11, 193-202. Evans, M., Hastings, N. A. J. & Peacock, J. B. (1993). Statistical distributions (2nd ed.). New York: J. Wiley. García, J. F., Frías, M. D. & Pascual, J. (1999). Los diseños de la investigación experimental: Comprobación de las hipótesis. Valencia, Spain: Cristóbal Serrano Villalba. García, J. F., Musitu, G. & Veiga, F. H. (2006). Autoconcepto en adultos de España y Portugal [Selfconcept in adults from Spain and Portugal]. Psicothema, 18, 551-556. García, J. F., Pascual, J. & Frías, M. D. (2002). F-sample distribution -f- when the measurement scale is discrete and rectangular. Metodología de las Ciencias del Comportamiento, 4, 219-223. García, J. F., Pascual, J., Frías, M. D., Van Krunckelsven, D. & Murgui, S. (2008). Design and power analysis: n and confidence intervals of means. Psicothema, 20, 933-938. Pérez, F. G., Llobell, J. P. & Navarro, M. D. F. (2004). Tables of f statistic with one degree of freedom in the numerator. Metodología de las Ciencias del Comportamiento, 6, 237-243. Pérez, J. F. G. (2008). Métodos de investigación, diseño y técnicas en las ciencias del comportamiento. Valencia, Spain: Palmero Ediciones. Pérez, J. F. G., Navarro, M. D. F. & Llobell, J. P. (2000). Randomness tests versus F-distribution when the measurement scale is discrete. Psicothema, 12, 253-256. 207 aemcco ACTAS DEL XI CONGRESO DE METODOLOGÍA DE LAS CIENCIAS SOCIALES Y DE LA SALUD Málaga, 15-18 septiembre de 2009 ACTAS XI Congreso de Metodología de las Ciencias Sociales y de la Salud Coordinadores: M. J. Blanca, R. Alarcón y D. López-Montiel Maquetación: Andrade García, Carmen María Correcciones: Martín Tirado, Almudena ISBN: 978-84-613-7589-9 Depósito Legal: Edita UMA-Tecnolex (B93004000) Año: 2010 Lugar: Málaga XI CONGRESO DE METODOLOGÍA DE LAS CIENCIAS SOCIALES Y DE LA SALUD Comité de Honor Excma. y Magfca. Rectora de la Universidad de Málaga Adelaida de la Calle Martín Ilmo. Sr. Decano del Colegio Oficial de Psicólogos de Andalucía Oriental Manuel Mariano Vera Martínez Ilmo. Sr. Decano de la Facultad de Psicología Julián Almaraz Carretero Ilmo. Sr. Director del Dpto. de Psicobiología y Metodología de las Ciencias del Comportamiento Jesús Miranda Páez Sr. Presidente de European Association of Methodology José Muñiz Fernández Sra. Presidenta de la Asociación Española de Metodología de las Ciencias del Comportamiento M. Teresa Anguera Argilaga Comité Científico Coordinadora: Juana Gómez Benito Manuel Ato García Inmaculada de la Fuente Solana Rafael San Martín Castellanos Comité Organizador Presidenta: María J. Blanca Mena Vicepresidenta: Dolores López Montiel Secretario: Manuel Pelegrina del Río Vicesecretario: Rafael Alarcón Postigo Tesorero: Jesús Miranda Páez Vocales: Marcos Ruiz Soler Roser Bono Cabré Catalina Pérez López Gema López Montiel Agustín Wallace Ruiz Rebecca Bendayan