AnáGs is de convergencia del estadístico de Edwards y eficacia de su empleo para contraste de existencia de compo nentes estacionales en series cronológicas por JAVIER CALATRAVA REQUENA INIA CRIDA - 10 Laboratorio de Estadística y Economía. C t^RDO BA I. INTRODUCCION El análisis de la existencia de componentes c^clicas y estacionales en series temporales de datos tiene enorme interés en multitud de campos científicos, fundamentalmente para economistas, biólogos y climatólogos. Aparte de las técnicas basadas en ajustes de modelos estocásticos, más o menos complejos, y el anáiisis en e] dominio de la frecuencia (análisis espectral) y, a veces, como complemento previo a las mismas, se han desarrollado una serie de tests para contratar Ia existencia de cumponentes estacionales y cíclicas. , Dichos tests, más o menos sofisticados, están basados, en esencia, en la def^nición de un estadistico determinado, y en el estudw, bajo certeza de cierta hipótesis nula, de la distribución en el muestreo de una función del mismo, a fin de poder compararlo con alguna distribución conocida y tabuiada. Tal es el caso del test debido a Edwards (19fi1), quien, después de hacer una critica al test clásico X`', basada en la afirrnación de que su potencia es baja cuando existeri movimientos estacionales en la serie, propone un test de hipótesis nula simple contra alternativa simple en el que la hipótesis nula es la existencia de acontecimientos independientes uniformemente distribuidos en el tiempo, y la hipótesis alternativa la existencia de una tendencia armónica. FSTADtSTICA ESP^1Ñ01_A F n principic>, para su autc^r, el te^t t^s aplicahie cuandu la variable cunsiderada r^.ipresenta un númeru de acc^ntec imientc^s c^hs^t.^rvadus ^^n diferentes tiempus y c uandc^ nc^ exi^te aut^^c^^rrelación tierial. Más adelante, t^n este trabajc>, veremc^s que estas nc^ k^n c^^ndici«nes rigur«samente necesarias, y que, pc^r utra parte, existen c^tras c^^ndicic^nes preci^^as para p^.^der a^^egurar una minima eficacia en el emplec^ del test. h1 te st de F dv4^ards ( I^b I)(que puede con suliarse cc^n detalle en la referencia citada) proviene de un símil mecánico. Supongamvs que disponemos de datos tomados en intervalos iguales de tiempo, a lo largo de un año, durante varios años. Sean t, (i - I{ 1)r7 ) los tiempus en los yue se dispone de información a lo largo de cada añu, y sea N^ el número de c^bservaciUnes tc^tales en los tiempos t; de los diferentes años. Si consideramos un circulo dividido en sectores pc^r radios de 2 r^ i , y s^^bre cada uno de dich^s radius colocam^s a distancia unitaria n una masa m, que sea cualquier función monótona de N; (pc^r ejemplo, ^; NI;), es evidente que en ausencia de cumpc^nentes estacit^nales, el centro degraved^ de las masas coincidirá ec^n el def círculo. Sea D la distaneia entre amhos puntos. Si consideramus ^, N; _ =` 1+ A sen wi, o sea, la posible existencia de un movimiento armónico simple en Ic^^ti datos, Fdwards ^ l^b 1) demuestra que cuancic^ A no es grand e puede ser estimado direccic^nes c^^, = 7 .r = n otesis nula de ^ la hi p^ pur Á^- 4D, que var(Á) = --, siendo N=^ N;, y q ue ba'o N , =, I 1 uniformidad, ei estadistico E- z A` N converge en distribución a una X` con dos grados de libertad. Para expficar la furma de apiicación en la práctica del test de Edwards, cunsideremos un ejemplo empleando lvs datc^s de días de lluvia totales por mes ubservadUS en ia estación meteurológica de Motril (Granada} durante el decenio IyS8-b7. Seguiremos rigurosamente en este ejemplo la forma de ^perar descrita par Fdwards ( lyfil ). Lc^s cálculos para el test se dispvnen de la siguiente f^rma: N; c^^; N ^ sen wi N; cos wi E nero . . . . . . . . . Febrero . . . . . . . . 49 48 O° 0.00 Marzc^ . . . . . . . . . A hri 1 . . . . . . . . . . Mayc^ . . . . . . . . . . 78 54 3U b0 ^0 25 l20 3.4b 7 . ^9 ?. 34 4.3b 7 .00 5.y5 4.41 O.OU 2.50 8? ANALISIS DE CQNVERGENCU DEL ES?ADISTI(JD DE EDWARDS N; N; sen wi (r)i N^ cos wi Junio . . . . . . . . . . 19 150 2 .17 3 . 74 J ul io . . . . . . . . . . 12 180 0.00 3 .46 Ago sto . . . . . . . . 3 210 0 .8fi 1.48 Septiembre ..... 16 240 3.44 2.00 Octubre ....... 53 270 7.28 0.00 Noviembre ..... 59 30(} á.óU 3.93 Diciembre ..... 73 330 4.27 7.36 N•= 489 S = 2.4? C- 1 S.47 S2 = 6.10 C 2= 239. 32 V = ^ ^, ^ N; = 72 .13 ^ Z 2 D_ ^;S +X _0.21719 V ^ A =4D = 0.86876 E ---Áz• N = 184.53 2 E> X^(0.01)=9.21 Luego aceptamos la hipótesis alternativa de una tendencia estacional armónica en la serie de diez años en la que el parámetro indicador de la amplitud del movimienta armónico viene estimado por. A A = 0.8687ó ^ y su varianza Var(A) _ 2 = U.0040 489 El máximo del movimiento estacional viene dado por (^ - arctg S = arctg U.159ó ^ 9.° C La aproximación a un movimiento armónico simple es un movimiento con alta ^ estacionalidad (A = O.8b876) y con máximo en la segunda semana de enero. El test de Edwards ha sido utilizado en la práctica exclusivamente en prob^emas biológicos, y más concretamente de medicina y genética humana, y esto es debido a g8 ESTADISTICA ESPA!'^^LA h^^her sido pen^;ado, en principic^, para dicho tipo de prc^^blemas, así como al hecho de que en estas disciplinas se plantearan ccan más frecuencia que en otras el tip^c^ de series que reúnen las cundiciones yue el test exige, Entre las aplicacivnes del test de Edwards podemc^s considerar la.S llevadas a cabo por Wehrung y Hay ( i9fió), quienes realizaron varios estudios sobre malformaciones cong+énitas en los Estados Unidc^s. Trabajando sobre series cronológicas de un número considerable de observaciones obtuvieron resultados satisfactorios empleando ei test de Edwards para el análisis de componentes estacionales en dichas series. Hev^ritt (197t ) es el primerc^ que estudia las condiciones de empleo del test de Edward5 en cuanto al tamaño de la muestra llegando a la conclusión, válida para cierto tipo de problemas, de que la aproximación del estadístico a la distribución Xz no es suficientemente buena como para llevar a cabo inferencias cuando el número de observaciones tc^tales es inferior a^6. Hewit { 197^) empleará posteriormente el test para estudiar la aparición estacional de fallos car^diacos. Por otra parte, Smith { 1^61) había utilizado el test de Edwards demostrando que si la tendencia cíclica no es demasiado grande el test es válido incluso cuando existe autocorrelación en la serie. Más adelante veremos en este trabajo que la tendencia ciclica no podrá tampoco ser demasiado pequeña, pues el test tendrá poca potencia. Recientemente, Calatrava (1y78) ha discutido la estacionalidad en la demanda de tractores en Andalucía, utilizando, entre otros, el criterica de Edwards. Aparte de los trabajos citados, las condiciones de empleo óptimas del iest de Edwards no han sido detalladamente estudiadas. E1 presente trabajo trata de llevar a cabo un análisis de la convergencia del estadístico E hacia Xzc2g^) en diferentes condiciones, bajo certeza de la hipótesis nula de uniformidad, y estudiar asimismo la potencia del test bajo distintos supuestos de naturaleza de los datos. Se emplearán, para ello, técnicas de simulación; las generaciones de datos simulados en los distintos supuestos se han llevado a cabo utilizando un microordenador Hewley-Packard del Centro de Cálculo del INIA, en Andalucía. CONVERGENCIA DEL E.STADISTICO E, BAJO LA HIPOTESIS NULA A efectos de analizar la eficacia del tesi de Edwards se ha estudiado, en primer lugar, como ya se ha indicado laconvergenc^a del estadístieo E hacia ladistribución X`^Zgi^ bajo certeza de la hipótesis nula. Se empleó para ello un programa de simulación mediante el cual observaciones simuladas fueron asignadas de forma oleatoria a cada uno de los doce meses empleando K9 ANAI_ISIS DF CCN^fVERGENCIA DEL 1~STADISTICO DE EDWARDS una suhrrutina de generación de núrneros pseudvaleat^^rie^s U((), f). cunsiderando una ubservación perteneciente al mt^ i, si^ 5 T 6 _s (i i -I)^ lOR ^' f^ De esta fc^rma se han generado ^00 grupos sucesivos de N observaciones, y para cada uno de los grupos se ha calculado el valur del estadístico E, cabteniendo así una estimación ^(E> de su función de densiciad.f(E). EI proceso se ha repetido para distintos valores de N= 20, 40, 60, R0, tUO, 180, 200, 250 y 300, viéndase yue, efectivamente existe una cunvergencia en distribución tal que: lim ^rr(E) _ '1. ; g. l . N-+ ! siendo pN(E) la función de densidad cie E para N observaciones. En la tabla 1 se han in^luidu los tres primeros momentos con respecto al origen de la distribución obtenida para el estadístico ^^ en función del número de observaciones, así com^ los valores de la variable yue delimitan un S por 100 de cc^la superior en la distribución de E. Asimismo incluyen en la citada tabla los correspondientes valores teóricos de la distribución ^r` con 2 grados de libertad. N.° de observaciones, N ^» ^! f ^l ^ .^^ rrt , = 1 ^r , ^ .^- ^ jr2 j^ 1 ^r ^: .t ; Valores de X tal que P(X >:x )^ 0.05 20 4.58 41.9 630 i 3.82 40 3.02 19. 2 208 9.14 60 2.3y 1 1.9 97 80 2.2 S 9.9 64 7.32 6. 74 100 ?.19 9.7 bl b.65 1 ^0 ?.12 9.K 57 6.52 200 2.OR 8.9 54 6.37 ? 50 2.0^ 8.4 54 6.31 300 2.03 8. 1 ^1 f^.28 X;gl 2.0? S.0 4R 5.^ Tabla I: Mumentos respectu al origen del estadísticc^ de Edwards bajo la hipótesis nu1a, comparados con los de la distribución x` con dos grados de libertad (muestras simuladas = S00). E STADISTICA ESPATIULA Vemos en la tabla 1 que la convergencia jiv{E ^ --+ x=^^^^^ es buena para N> 2(NJ. aceptahl^^ para I(x) ^^ N> ?U0, y nv admisible para N<- lt^. Esic^ cc^incide en lineas generalc^s cvn la ya citada cc^nclusión de Hewit 11y71 ), yuien pone en N= 96 la frc^ntera entre la admisibilidad u n^^ del uso del estadístic^^ E pur falta de c^^nvergencia de su distrihución de la ^ ` iz,^. ^,. P+nTENCIA DEL TEST BAJO LA HIPOTESIS ALTERNATIVA DE UNA TENDENCIA ARMONICA SIMPLE La hipótesis alternativa de tendencia armónica simple supone que a cada mes pueda asignarte una probabilidad: 1 [(1 P^ _ + A c us ( c^^r + B)] 12 Tratamos de estudiar la potencia del test de Edwards para distintos valores de «A» y diferentes conjunt^s de observacic^nes A tal efecto se han considerado los vaiores de A= 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.5t, y 1 de N = 20, 40, b0, S(}, 100, 150, 200, 2^0 y 300 observaciones y se han generado 500 conjuntos de datos para cada una de las combinaciones posibles. En cada caso ha sido calculada la potencia del test empleando los valores de X;(O.OS) teóricos tabt^lados, por una parte, y los obtenidos anteriormente (ver tabla I), pur otra. Lc^s resultados han sido expresados pur las tablas II y III, respectivamente. Por otra parte, a efectos de visualizar mejor las conclusiones, se representan en la figura I los casos correspondientes a A= 0.2 (estacionalidad baja), U.5 (media) y 0.8 (alta). De la observación de tablas y gráficas obtenemos las siguientes conclusiones: En el caso de estacionalidad baja el test es poco potente para cualquier valor de N, no diferenciándose demasiado los resultados obtenidos con los valores teóricos y los estimados. Conforme aumenta la estacionalidad la potencia del test crece, las diferencias entre potencias obtenidas empleando valores teóricos y estimados son grandes, para valores pequeñus de N, convergiendo ambas series tanto más a prisa cuanto mayor es la estacionalidad. ANALISIS DE CONVERt3ENCU DE1. ESTAD4STiC0 DE ED^WARDS 9I TA B LA I I POTF.NCIA DEL TEST DE EDWARDS PARA DIFERENTES GRADOS DE ESTACIONALIDAD DE LA SERIE (A} Y DIFERENTES MAGNITUDES DE CONJUNTOS DE DATOS ( N), EMPLEANDO LOS VALORES TE©R1COS X2 (5 ^^ ). (SERIE SIIVIULADA 500 CONJUNTOS DE DATO^S) N 20 4Q 64 80 100 150 200 250 300 O.l 0.112 0.124 0.161 0.18b 0.203 0.299 0.240 0.293 0.347 0.2 0.128 0.221 0.228 0.231 0.248 0.330 0.441 0.502 0.530 0.3 0.387 0.304 0.369 0.421 0.520 0.692 0.822 0.901 0.924 0.4 0.470 0.498 0.556 0.640 0.763 0.843 0.980 0.998 1.000 0.5 0.578 0.672 0.713 0.813 0.915 0.980 0.999 1.000 1.000 0.b 0. b85 0.$O 1 0.40 l 0.974 0.989 1.000 1.000 1.OC10 1.000 0.7 0.776 0.889 0.9b4 0.988 1.000 1.000 1.000 1.000 1.000 0.8 0.908 0.963 0.998 1.000 l.0(?0 1.000 1.000 1.000 1.000 0.9 0.968 0.982 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1 0. 9 91 0. 999 1. 000 1. 000 1. U00 1. 000 l. 000 1. 000 1. 000 A 92 ESTAD^^STiCA ESPAÑOLA TwH^^ III PC)TENCIA DEL TEST DE EDWARDS PARA DIFERENTES GRADOS DE ESTACIONALIDAD EN LA SERIE {A) l^ DIFERENTES MAGNITUDES DE CC)NJUNTC)S DE DATOS N. E MPLEANDO LOS VALORES DE E(S ^) ESTIMADOS ANTERIORMENTE (ULTIMA COLUMNA TABLA 1). (SERIE SIMULADA 500 CC)NJUNTOS DE DATOS) N 20 40 60 80 I 00 1 SO 200 250 300 0.1 0.037 0.061 0.069 0.083 0.09b Q.106 0.125 0.243 0.301 0.2 0.078 0.129 0.134 0.162 0.200 0.268 0.372 0.450 0.512 0.3 0. t31 0.24b 0.312 0.379 0.485 O.ó78 0,8(}4 0.883 4.915 0.4 O. l68 0.284 U.353 O.S l9 0.73b 0.821 0.970 0.992 1.Q00 0.5 0.247 0.432 0.596 0.7rS0 0.901 0.946 0.998 1.000 1.000 0. b 0. 340 0. 75 3 0. 8 5 3 0. 97 l 0. 083 0. 999 1. 000 1. 000 1.400 0. 7 0.49fi 0. 868 0.95 2 0. 985 1.000 l. 000 1.000 1.000 1. 000 0.8 0.639 0.942 0.984 1.000 1.000 1.000 1.U00 1.000 1.000 0.9 0. 801 0.978 1.000 l.O^DO 1.000 1.000 1.OOQ 1,000 1.000 10 0.924 0.999 1.000 1.000 1.000 1.00(} 1, 000 1. 000 1. 00(} A POTENCIA DEL TEST BAJO LA HIPOTESIS ALTERNATIVA DE UNA TENDENCIA NO E^ACTAMENTE ARM ^)NICA Normalmente 1a serie cro^ológica no responde exactamente al comportamiento teórico de una tendencia armónica simple como la considerada en el apartado anterior, sino que adopta otras formas que pueden diferenciarse considerablemente de1 esquema teórico sinusoidal; por e11o parece interesarse, para rematar este anáJisis, el estudiar 93 ANALISIS DE CON VERGÉJVCIA DEL ESTAD[ST[00 DE EDWARDS la potencia del test para diferentes hipcitesis alternativas que han sido sirnuladas. Se han considerado, entre otros posibles, los siguientes casos: a) Cusv dE^ Sc^ritjs IIr1111iOdCl^C^s plurrus. Para contrastar el test, en este caso, se han simulado SUO conjuntos de datos siguiendo los esquemas teóricos representados en la fgura 2, en donde febrero, marzo y abril reciben, en 1a generación de valores pseudoaleatorios, probabilidad 0.1 y el resto de los meses 0,0777 en el caso {a) y 0.1833 y 0,05, respectivamente, en el caso (b). Se han generado para cada caso valores N= 50, 100 y 200. Los resultados han sido las siguientes: N.° observaciones Caso (a}: (Estacionalidad débil) Caso ( fi): ( Estac ionalid ad fuerCe) Potencial (5 ^^ ) 50 O.í32 100 0. 246 200 0.314 50 0 . ó94 l00 0.7a2 200 0 . 892 Vearnos, pues, que la potencia dei test es mucho mayor en el caso de tendencias unimodales fuertemente marcadas y, asimismo, para mayor número de observaciones la potencia crece, pero no tanto en el caso (^a) como en el (b). b) Cusc) de SE^ri^s unimvdul^s ukudas: Para contrastar el test en este caso se han simulado, asimismo, 500 conjuntos de datos, siguiendo los esquemas teóricos representados en la figura 3, en donde marzo recibe, en lagenecación de valores pseudoaleativos, probabilidad 0.25, febrero y abril, 0.15 y 0.05 cada uno de los meses restantes en el caso (a), siendo en el caso (^b) estos valores 0.15, 0.10 y 0.07222, respectivamente. Los resultados han sido los siguientes: N.° observaciones Caso f a) Caso (^b) Potencia c^ (5 ^1) 50 0.121 100 O. l 72 200 0.267 50 100 0.583 0.798 200 0 .902 ESTrRDlSTlCA ESPAÑOIrA Vemos, que realmente, los resultados son similares a los obtenidos para modas planas, siendca la poten^ia ligeramente inferior tanto en el caso (a) y algo superior en el (^b). c) C'usc^ dci Sc^ri^^s c•c^n rrtcis dc^ unu mr^c^ci Se han considerado tendencias con dos madas planas de dos meses de anchura, separadas entre sí seis meses y considerando dos distintas posibilidades de altura modal tal y como se indica en la figura 4, en la que los meses que constituyen la moda han recibido probabilidades de 0. i 5 y 0.10 en los casos (^b) y^a}, respecti vamente, repartiendo la probabilidad restante entre los otros meses. Se han simulado 500 conjuntas de 50, 100 y 200 observaciones y los resultados han sido los siguientes. Caso (a) Caso Cb) N.° obse rvac io ne s 5(} 1 QO Po te nc ia c^ { 5%) (}.052 0. Oó2 Zoo a.o^a so l 0U 200 o.oba 0.074 0.082 Vemos que la potencia del test es prácticamente nula en todos los casos cuando la serie es bimodal, lo cual supone una limitación considerable para el uso del test de Edwards. CONCLUSIONES Fodemos concluir que la convergencia hacia X2^,i del estadístico E, bajo certeza de la hipótesis nu1a, es efectiva para más de lU0 observaciones, aproximadamente, siendo muy clara para N> 200 y no observándose convergencia para N< 100. Par otra parte, la potencia del text, en el caso de existencia de una comp©nente esiacional armónica simple, es funció^n del grado de estacionalidad ( valor de A) y del número de observaciones simuladas. Para una estacionalidad baja la potencia es pequeña, incluso para grandes valores de N. En el caso de estacionalidad media, ia potencia del test es considerable para N> 100, pudiendo usarse el test con potencia grande en el caso de alta estacionalidad para vaior de N> 40. A1 cansiderar posibles hipótesis alternativas de tendencias unimodales no exaectamente armónicas hemos encontrado asimismo una relación entre la potencia, el grado de estacionalidad y el número de abservaciones, alcanzando (tanto en modas planas como ANAL[SIS DE CONVERGENCU^ DEL ESTADtSTiCO DE ED^WARDS agudas) suf;ciente potencia en el contraste sólo en el caso en el que 95 N>_ 200 con estacionalidad alta. En series con más de una moda, la potencia del test se reduce, prácticamente, a cero en todos los casos estudiados. E I test de Edwards se manifiesta, pues, como un test útil y eficaz para series que presenten estacionalidad unimodal media o alta con un número grande de observaciones. En estos casos el test de Edwards puede ser preferido a otros alternativos por su senci1le z y fac il id ad de cálculo . Resumiendo, el test puede ser empleado bajo certeza de la hipótesis nula o bajo una hipótesis alternativa de esquema serial muy similar al armónico simple teórico, para valores de N> 100. Cuando las series son unimodales alejándose relativamente del esquema arrnónico simple, el test es suficientemente potente para N> 200^ , no siendo útil su aplicación para casos de series con más de una moda. RESUMEN E1 presente trabajo supone una descripción del test de Edwards para contraste de existencia de componentes estacionales en series cronológicas, y un análisis de las condiciones óptimas de empleo de dicho test, así como el cálculo de su potencia para diferentes hipótesis alternativas. SU MM A RY The aim of the present work Is to describe the Edwards test for recognition and estimation of seasonal trends in time series. Optimal conditions of application of the test are studied and it power agains different alternatives hypothesis is analysed. Key words: seasonality, cyclical componends, Edwards criterion. Palabras clave: estacionalidad, componentes cíclicas, test de Edwards. A.M.S.: Subject classification b2 M lU. B IB LIOGRAFIA CALATRAVA J.: Ancilisis dc^ la estuc•iunulidud ^n lu adyc^isic•ic^n dF^ muyr^inuriu ukrr^•ulu t^n las distintas ;onas dc^ lu prc^vinciu d^ C'círdc.^hu, INIA (en preparación). EDwwRDS, J. P.: Th^ rc^c•c^knitic^n und stimatic^n c^f c•yc•licul trf^nds. Ann Hum. Genet. 2S 83 ( 19ó1). HEwrrT ET AL: C1n ^drt^clyds c•rit^rrvn c^f sc^usnnulit}^ ctnd c^ nun-pcYrclm^^tric• altE^rnative. B rit . J . Pre v. Soc . Med .^S 174 (1971) HEWITT ET AL.: Seasc^nal influenc•^s c^n thc^ risk c^f curdiac mulfurmutivn. In. J. Epid. I No. 3(1972). SMITH. C.A.B.: Nc^tc^ c^n thc^ errr^r vuriunc•e. Ann. Hum. ^'ienet. 25 86 (19ó1). WENRUNG AND HAY: A study vf seasvnal incidFnc•^ vf cc^ngenitul mulformation in the Unit^d Stutes. Brit. J. Prev. Soc. Med. 20 67 {19G6). ESTADiSTICA ESPA1^oL.A ^ (N) .. - a.s^ -T 200 100 N F^g. 1. Gráficos de la Petencia del test de Edward en función del número de observaciones para distintos niveles de estacionalidad en la serie y empleando valores tabulados de X2 (S ^o) (raya discontinua) y estimados de E(S °^^) (raya continua). (Serie simulada: S00 conjuntos de datos.) 0. 20 ^ 0.1633 -i 0 .15 -^ 0,10 -^^ o.o^^^r o.os^ E F M A M J J A O N D Fig. 2. SERIES UNIMODALES PLANAS SIMULADAS: ^a} Estacionalidad equivalente débil; (ti) Estacional idad equivalente fuerte. 97 ANALiS1S DE CONVERGENCIA DEL ESTAD[STICD DE EDyVARDS 0.25^ 4.20 ^ 4.15^ 0.10 ^ o.on2^ 0.05 ^ E F M A M J J A S 4 N - -T p F^g. 3. SERIES UNIMODALES AGUDAS SIMULADAS: (a) Estacionalidad equivalente débil; (^b) Estac ional idad equi vale nte fuerte . 0. 20 ^ 0.15 ^ a.^o i a.o^5 ^ 0.05 ^ E F M A M J J A S O N D Fig. 4. SERIES BIM(JDALES SIMULADAS: (a) Estacionalidad equivalente débil; (fi) Estacionalidad equivalente fuerte.