Estadística para Relaciones Laborales. TEMA VI 1ª Parte. TEMA 6 (I Parte) APLICACIONES ESTADÍSTICAS EN EL AMBITO DE LAS RELACIONES LABORALES. SERIES TEMPORALES. 6.1. SERIES TEMPORALES O CRONOLÓGICAS. Una característica común a muchas de las variables estudiadas en Relaciones Laborales es la evolución que estás presentan a lo largo del tiempo y, sobre todo, que este aspecto dinámico de las variables también tiene interés práctico. Podemos cuestionarnos como aumentan los salarios, o si se reducen las diferencias entre trabajadores con el paso del tiempo; ahora es la evolución de la variable la que interesa, a veces incluso más que los valores concretos en un momento dado. Por todo ello, en este tema se pretende dar una primera aproximación al tratamiento estadístico de series temporales. Se abordara la definición y el desarrollo de algunas técnicas que permitan la descripción de la evolución de una variable, tanto en el pasado como la previsible evolución futura. Las series temporales son distribuciones estadísticas bidimensionales en las que una de las variables es el tiempo. La forma más usual de presentar estas distribuciones es mediante una tabla de dos columnas: en la primera de ellas aparece la variable tiempo, que se suele designar por T, y en la otra, representada por Y, aparecen los valores de la variable objeto de estudio. Las observaciones se pueden realizar de tres formas diferentes: En un instante dado (Magnitud stock) Son valores concretos en un tiempo concreto. Podríamos citar como ejemplo el número de médicos de un determinado hospital en un momento dado, la temperatura que hay en una ciudad durante el mes de agosto, etc.... Ejemplo: La venta de revistas durante los primeros 15 días de un determinado mes se han anotado a la hora de cerrar el quiosco: Días 1 2 3 4 5 Revistas 166 123 122 167 56 6 7 8 9 10 11 12 13 14 15 111 145 178 145 198 176 193 152 132 124 Estamos ante una serie temporal de magnitud stock. Como suma de cantidades en un determinado periodo (Magnitud Flujo) En realidad es el total acumulado de una variable desde la observación anterior. El periodo suele ser de un día, un mes un trimestre, un año, etc....Por ejemplo el número de accidentes de tráfico durante un fin de semana, el número de vuelos que salen durante un mes de un aeropuerto, el número de motos vendidas en un determinado año en un país..... Ejemplo: La siguiente tabla representa la ventas de automóviles en el mes de marzo entre el año 2000 y el 2008: Año 2000 Turismos 64553 2001 72563 Profesor: Aristóteles de la E. Gosálbez. 2002 75773 2003 84702 2004 93456 2005 2006 2007 2008 102453 126732 104321 94567 54 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. Como media mensual El INE publica en sus boletines mensuales estadísticas referidas a series temporales sobre: media mensual de afiliados a la Seguridad Social, media mensual del IPC, media mensual de Tasa de Paro........... Ejemplo: La siguiente tabla representa la variación mensual del IPC entre Octubre de 2008 y Septiembre de 2009 Oct. O,3 Nov. 1 Dic. o.4 Enero Febr. Marz. Abril Mayo Junio Julio 0,5 0,1 0.8 0,2 0,6 0,1 0,1 Agost. Sep. 0,4 0,3 6.2. DESCRIPCIÓN Y COMPONENTES DE LAS SERIES TEMPORALES. El estudio de una Serie Temporal trata de poner de manifiesto las causas de las variaciones que sufre un fenómeno estadístico a lo largo del tiempo, este estudio se hace con una doble finalidad, una explicativa y otra predictiva. Suponiendo que el tiempo al que se extiende la serie es suficientemente grande, estas variaciones son debidas a cuatro causas que se llaman componentes de la serie y que son: 1. Tendencia secular: Consiste en la evolución a largo plazo de la serie (generalmente más de diez años) y que nos indica la marcha general del fenómeno, crecimiento, decrecimiento o estacionamiento. La tendencia secular obedece a factores estables que suelen tener pocas variaciones a lo largo del tiempo. Es usual encontrarse con series temporales que presentan un movimiento sostenido en la misma dirección durante un amplio periodo de tiempo, con independencia de pequeñas oscilaciones al alza o a la baja. Un ejemplo sería el caso de la serie de afiliados a la Seguridad Social. 2. Variaciones cíclicas: Son los cambios experimentados por la serie temporal con carácter mas o menos periódico y de amplitud entre 3 y 8 años. Estas oscilaciones son propias de las variables económicas (ciclos bursátiles, oscilaciones de los tipos de interés, cambio en la moda, etc.). 3. Variaciones estacionales: Engloba a los movimientos oscilatorios alrededor de la componente de tendencia que se repiten de forma periódica y con amplitud inferior a un año. Estas variaciones son debidas, en su mayor parte, a factores relacionados con las estaciones del año y de ahí su nombre. Por ejemplo, en los meses de verano, disminuye el número de parados en el sector servicio o el número de huelgas aumenta en los meses centrales del año, presentando un máximo en junio de cada año. Todos estos efectos tienen en común la persistencia a lo largo de los años, lo que origina unos altibajos que pueden predecirse con la relativa fiabilidad, por lo que permiten mejorar de forma apreciable las predicciones de valores futuros. Profesor: Aristóteles de la E. Gosálbez. 55 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. 4. Variaciones accidentales: Son las componentes que alteran la trayectoria de la serie de una forma brusca e imprevista. Surgen de forma accidental y generalmente obedecen a la ley del azar (huelgas, accidentes, fenómenos naturales, competencia imprevista, etc.). Estas cuatro componentes, por consiguiente, son las que, determinan conjuntamente los valores de la variable analizada en cada instante, sin que pueda valorarse con precisión el influjo individual de cada una de ellas. Hay que aclarar que en una determinada serie no es obligatorio que aparezcan las cuatro componentes. Sólo vamos a estudiar la tendencia secular, que es la que tiene mayor influencia sobre la variable y un comportamiento más uniforme. Las otras tres componentes modifican sólo parcialmente los valores de la variable debidos a la tendencia secular. 6.3. DETERMINACIÓN DE LA TENDENCIA SECULAR. PREDICCION. Tres son los métodos más usuales para determinar la tendencia secular: 1. Método gráfico: Si se tiene la serie temporal ( ti , yi ) representada en un sistema de ejes cartesianos, siendo el eje horizontal el de los tiempos T y el vertical el de la variable Y, y se unen los puntos máximos de la gráfica mediante una poligonal, y a su vez, los puntos mínimos mediante otra, existe una línea poligonal equidistante de las anteriores que se obtiene uniendo los puntos medios de los segmentos verticales delimitados por las poligonales anteriores trazadas por cada punto de máximo y de mínimo. Esta nueva poligonal nos proporciona la tendencia secular. Profesor: Aristóteles de la E. Gosálbez. 56 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. 2. Método de las medias móviles centradas: Este segundo método trata de hallar la tendencia secular de la serie diluyendo la importancia individual de cada valor de la variable Y, promediándola mediante una media aritmética con los valores inmediatamente anterior y posterior. La tendencia secular se puede obtener por este método de diversas formas, dependiendo del número de valores a promediar; este número se llama tamaño de las medias móviles, y las más utilizadas son las medias de tamaño impar: 3, 5, ......... Si el tamaño es par, las medias móviles no quedan centradas, y es preciso volver a promediar. Si la serie temporal estuviera dada por ocho valores sería: ti yi yi __ t1 t2 t3 t4 t5 t6 t7 t8 y1 y2 y2 y3 y3 y4 y4 y5 y5 y6 y6 y7 y7 y8 __ Donde de las medias móviles de tamaño tres representadas por yi , vendrían dadas: y1 y 2 y3 3 y y 4 y5 y4 3 3 y y6 y7 y6 5 3 y 2 y3 y 4 3 y y5 y 6 y5 4 3 y y 7 y8 y7 6 3 y2 y3 Es evidente, en este caso, la inexistencia de las medias móviles y1 e y8 , al no existir valor anterior a y1 ni posterior a y8 . Ejemplo: Veamos como analizaríamos la tendencia secular por el método de las medias móviles (de tamaño tres) de la producción de acero en una región de América entre los años 1993 y 1999. Año (ti) 1993 1994 1995 1996 1997 1998 1999 Profesor: Aristóteles de la E. Gosálbez. Acero producido (yi) 300 290 350 360 320 330 400 yi 313,3 333,3 343,3 336,7 350 57 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. De la misma manera se calcularían las medias móviles de tamaño cinco, no pudiendo calcular las dos primeras ni las dos últimas. Se recomienda hacer una representación gráfica de la serie original y las obtenidas por medias móviles. 3. Método analítico de los mínimos cuadrados: Como se comentaba al inicio del tema, toda serie temporal es una distribución estadística bidimensional donde una de las variables es el tiempo. Por tanto, la evolución de la serie estará condicionada por la relación estadística existente entre ésta y el tiempo. Si la correlación es fuerte, la tendencia podría ser expresada como una función lineal del tiempo, es decir, mediante una recta de regresión. Este procedimiento de encontrar la tendencia secular, además de ser el más exacto, dispone de una medida de la bondad del ajuste, dada por el coeficiente de determinación. El método analítico tiene además la ventaja sobre los dos anteriores, que permite predecir el comportamiento de la variable Y en el futuro, al venir dada la tendencia secular de la serie como la ecuación de una recta o una parábola, susceptible de dar nuevos valores a T, en forma de ecuación Y f T . Ejemplo: El número de turistas (en millones) que visitaron nuestro país (España) está dado por la siguiente tabla, se pide el estudio de la tendencia secular por el método analítico de los mínimos cuadrados a una recta. Años T 1993 1994 1995 1996 1997 1998 1999 2000 2001 -4 -3 -2 -1 0 1 2 3 4 yi 57,26 61,42 57,59 60,65 64,55 70,85 72,02 74,4 75,7 Vamos a calcular una recta de regresión de la variable Y (nº de turistas) sobre la variable T (tiempo). Para ello vamos a realizar una traslación en el tiempo para poder simplificar los cálculos, es decir, asignamos al año 1997 el valor 0, al 1998 el valor 1, al 1996 el valor – 1 y así sucesivamente. Si el número de años fuera par, podríamos asignar al año 1993 el valor 1, al año 1994 el valor 2 y así sucesivamente. Los parámetros necesarios serian: t 0 St 2,582 St2 6,666 y 66,05 S y 6,857 S y2 47,023 Sty 16,862 Calculamos el coeficiente de correlación lineal pues, si no hubiera una alta correlación no tendría sentido calcular la recta de regresión: R Profesor: Aristóteles de la E. Gosálbez. S ty St S y 16,862 0,95 2,582 6,857 58 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. La ecuación de la recta de regresión de Y sobre T es la recta: y 66,05 16,862 (t 0) y 2,53t 66,05 6,666 Podemos acompañar el estudio de la tendencia con el valor del coeficiente de determinación R 2 0,952 0,902, podríamos decir que la tendencia lineal (los años) explica aproximadamente el 90% de la variación de turistas en España. Como hemos apuntado antes, si queremos hacer una estimación para el año 2005, sustituiríamos en la ecuación anterior por t 8 , pues si 1997 es t 0 , entonces 2005 es t 8 y (8) 2,53 8 66,05 86,29 Lo que quiere decir que el número de turistas que se espera visiten España en el año 2005 es de 86,29 millones (si no cambia la tendencia ). 6.4. AUTOCORRELACIÓN. En muchas ocasiones los valores de una serie temporal dependen linealmente de los valores observados en un tiempo anterior. Dada una serie temporal (t i , yi ) , se considera la serie (t i , yi h ) , obtenida mediante un retardo de h unidades de tiempo (suele utilizarse un retardo de 1 ó 2 años). El estudio de la correlación entre la variable yi y la variable retardada yi-h se denomina autocorrelación de la serie temporal dada. La existencia de autocorrelación en una serie temporal indica, en menor o mayor medida, la dependencia lineal que una serie temporal tiene con ella misma con un retardo en el tiempo; esta medida viene determinada por el coeficiente de correlación entre las variables yi e yi-h, llamado coeficiente de autocorrelación, que viene dado por la fórmula: r S yi yi h S yi S yi h El coeficiente de autocorrelación mide la dependencia de los valores de una variable respecto a los valores de la misma en tiempos anteriores. Ejemplo: Obtener el coeficiente de autocorrelación de la siguiente serie temporal con un retardo de 1 año. Años (ti) yi 1995 1996 1997 1998 1999 (3) 4 6 5 8 23 Profesor: Aristóteles de la E. Gosálbez. 2 y i 1 yi ·yi 1 yi 3 4 6 5 18 12 24 30 40 106 16 36 25 64 141 yi 1 9 16 36 25 86 59 2 Estadística para Relaciones Laborales. TEMA VI 1ª Parte. Calculando la covarianza S yi yi 1 y las desviaciones típicas S yi y S yi 1 : n S yi yi 1 y ·y i i 1 N n S yi y i 1 106 23 18 · 0,625 4 4 4 2 yi N y i 1 y i ·y i 1 2 i n S yi 1 i 1 2 141 23 2,19 1,47 4 4 2 i 1 N 2 yi 1 2 86 18 1,25 1,11 4 4 con lo que el coeficiente de autocorrelación resultante es: r S yi yi 1 S yi S yi 1 0,625 0,38 1,47·1,11 lo cual indica que no existe dependencia entre los valores de cada año con los del año anterior, ya que el coeficiente de autocorrelación es muy bajo. Para que exista dependencia, este coeficiente ha de ser igual o superior a 0,80. Profesor: Aristóteles de la E. Gosálbez. 60