T 06_1 - Monovardigital

Anuncio
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
TEMA 6 (I Parte)
APLICACIONES ESTADÍSTICAS EN EL AMBITO
DE LAS RELACIONES LABORALES.
SERIES TEMPORALES.
6.1. SERIES TEMPORALES O CRONOLÓGICAS.
Una característica común a muchas de las variables estudiadas en Relaciones Laborales
es la evolución que estás presentan a lo largo del tiempo y, sobre todo, que este aspecto
dinámico de las variables también tiene interés práctico. Podemos cuestionarnos como
aumentan los salarios, o si se reducen las diferencias entre trabajadores con el paso del tiempo;
ahora es la evolución de la variable la que interesa, a veces incluso más que los valores
concretos en un momento dado.
Por todo ello, en este tema se pretende dar una primera aproximación al tratamiento
estadístico de series temporales. Se abordara la definición y el desarrollo de algunas técnicas
que permitan la descripción de la evolución de una variable, tanto en el pasado como la
previsible evolución futura.
Las series temporales son distribuciones estadísticas bidimensionales en las que una de
las variables es el tiempo. La forma más usual de presentar estas distribuciones es mediante
una tabla de dos columnas: en la primera de ellas aparece la variable tiempo, que se suele
designar por T, y en la otra, representada por Y, aparecen los valores de la variable objeto de
estudio.
Las observaciones se pueden realizar de tres formas diferentes:
 En un instante dado (Magnitud stock)
Son valores concretos en un tiempo concreto. Podríamos citar como ejemplo el número
de médicos de un determinado hospital en un momento dado, la temperatura que hay en
una ciudad durante el mes de agosto, etc....
Ejemplo: La venta de revistas durante los primeros 15 días de un determinado mes se
han anotado a la hora de cerrar el quiosco:
Días
1
2
3
4
5
Revistas 166 123 122 167 56
6
7
8
9
10 11 12 13 14 15
111 145 178 145 198 176 193 152 132 124
Estamos ante una serie temporal de magnitud stock.
 Como suma de cantidades en un determinado periodo (Magnitud Flujo)
En realidad es el total acumulado de una variable desde la observación anterior. El
periodo suele ser de un día, un mes un trimestre, un año, etc....Por ejemplo el número
de accidentes de tráfico durante un fin de semana, el número de vuelos que salen
durante un mes de un aeropuerto, el número de motos vendidas en un determinado año
en un país.....
Ejemplo: La siguiente tabla representa la ventas de automóviles en el mes de marzo
entre el año 2000 y el 2008:
Año
2000
Turismos 64553
2001
72563
Profesor: Aristóteles de la E. Gosálbez.
2002
75773
2003
84702
2004
93456
2005
2006
2007
2008
102453 126732 104321 94567
54
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
 Como media mensual
El INE publica en sus boletines mensuales estadísticas referidas a series temporales
sobre: media mensual de afiliados a la Seguridad Social, media mensual del IPC,
media mensual de Tasa de Paro...........
Ejemplo: La siguiente tabla representa la variación mensual del IPC entre Octubre
de 2008 y Septiembre de 2009
Oct.
O,3
Nov.
1
Dic.
o.4
Enero Febr. Marz. Abril Mayo Junio Julio
0,5
0,1
0.8
 0,2 0,6
 0,1 0,1
Agost. Sep.
0,4
0,3
6.2. DESCRIPCIÓN Y COMPONENTES DE LAS SERIES TEMPORALES.
El estudio de una Serie Temporal trata de poner de manifiesto las causas de las
variaciones que sufre un fenómeno estadístico a lo largo del tiempo, este estudio se hace con
una doble finalidad, una explicativa y otra predictiva.
Suponiendo que el tiempo al que se extiende la serie es suficientemente grande, estas
variaciones son debidas a cuatro causas que se llaman componentes de la serie y que son:
1. Tendencia secular: Consiste en la evolución a largo plazo de la serie (generalmente más
de diez años) y que nos indica la marcha general del fenómeno, crecimiento, decrecimiento
o estacionamiento. La tendencia secular obedece a factores estables que suelen tener pocas
variaciones a lo largo del tiempo.
Es usual encontrarse con series temporales que presentan un movimiento sostenido en la
misma dirección durante un amplio periodo de tiempo, con independencia de pequeñas
oscilaciones al alza o a la baja. Un ejemplo sería el caso de la serie de afiliados a la
Seguridad Social.
2. Variaciones cíclicas: Son los cambios experimentados por la serie temporal con carácter
mas o menos periódico y de amplitud entre 3 y 8 años. Estas oscilaciones son propias de
las variables económicas (ciclos bursátiles, oscilaciones de los tipos de interés, cambio en
la moda, etc.).
3. Variaciones estacionales: Engloba a los movimientos oscilatorios alrededor de la
componente de tendencia que se repiten de forma periódica y con amplitud inferior a un
año. Estas variaciones son debidas, en su mayor parte, a factores relacionados con las
estaciones del año y de ahí su nombre. Por ejemplo, en los meses de verano, disminuye el
número de parados en el sector servicio o el número de huelgas aumenta en los meses
centrales del año, presentando un máximo en junio de cada año. Todos estos efectos tienen
en común la persistencia a lo largo de los años, lo que origina unos altibajos que pueden
predecirse con la relativa fiabilidad, por lo que permiten mejorar de forma apreciable las
predicciones de valores futuros.
Profesor: Aristóteles de la E. Gosálbez.
55
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
4. Variaciones accidentales: Son las componentes que alteran la trayectoria de la serie de
una forma brusca e imprevista. Surgen de forma accidental y generalmente obedecen a la
ley del azar (huelgas, accidentes, fenómenos naturales, competencia imprevista, etc.).
Estas cuatro componentes, por consiguiente, son las que, determinan conjuntamente los
valores de la variable analizada en cada instante, sin que pueda valorarse con precisión el
influjo individual de cada una de ellas. Hay que aclarar que en una determinada serie no es
obligatorio que aparezcan las cuatro componentes.
Sólo vamos a estudiar la tendencia secular, que es la que tiene mayor influencia sobre
la variable y un comportamiento más uniforme. Las otras tres componentes modifican sólo
parcialmente los valores de la variable debidos a la tendencia secular.
6.3. DETERMINACIÓN DE LA TENDENCIA SECULAR. PREDICCION.
Tres son los métodos más usuales para determinar la tendencia secular:
1. Método gráfico: Si se tiene la serie temporal ( ti , yi ) representada en un sistema de ejes
cartesianos, siendo el eje horizontal el de los tiempos T y el vertical el de la variable Y, y se
unen los puntos máximos de la gráfica mediante una poligonal, y a su vez, los puntos
mínimos mediante otra, existe una línea poligonal equidistante de las anteriores que se
obtiene uniendo los puntos medios de los segmentos verticales delimitados por las
poligonales anteriores trazadas por cada punto de máximo y de mínimo. Esta nueva
poligonal nos proporciona la tendencia secular.
Profesor: Aristóteles de la E. Gosálbez.
56
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
2. Método de las medias móviles centradas: Este segundo método trata de hallar la
tendencia secular de la serie diluyendo la importancia individual de cada valor de la
variable Y, promediándola mediante una media aritmética con los valores inmediatamente
anterior y posterior.
La tendencia secular se puede obtener por este método de diversas formas, dependiendo del
número de valores a promediar; este número se llama tamaño de las medias móviles, y las
más utilizadas son las medias de tamaño impar: 3, 5, ......... Si el tamaño es par, las medias
móviles no quedan centradas, y es preciso volver a promediar. Si la serie temporal
estuviera dada por ocho valores sería:
ti
yi
yi
__
t1
t2
t3
t4
t5
t6
t7
t8
y1
y2 y2
y3 y3
y4 y4
y5 y5
y6 y6
y7 y7
y8 __
Donde de las medias móviles de tamaño tres representadas por yi , vendrían dadas:
y1  y 2  y3
3
y  y 4  y5
y4  3
3
y  y6  y7
y6  5
3
y 2  y3  y 4
3
y  y5  y 6
y5  4
3
y  y 7  y8
y7  6
3
y2 
y3 
Es evidente, en este caso, la inexistencia de las medias móviles y1 e y8 , al no existir
valor anterior a y1 ni posterior a y8 .
Ejemplo: Veamos como analizaríamos la tendencia secular por el método de las medias
móviles (de tamaño tres) de la producción de acero en una región de América entre los años
1993 y 1999.
Año (ti)
1993
1994
1995
1996
1997
1998
1999
Profesor: Aristóteles de la E. Gosálbez.
Acero producido (yi)
300
290
350
360
320
330
400
yi
313,3
333,3
343,3
336,7
350
57
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
De la misma manera se calcularían las medias móviles de tamaño cinco, no pudiendo
calcular las dos primeras ni las dos últimas. Se recomienda hacer una representación gráfica de
la serie original y las obtenidas por medias móviles.
3. Método analítico de los mínimos cuadrados: Como se comentaba al inicio del tema, toda
serie temporal es una distribución estadística bidimensional donde una de las variables es el
tiempo. Por tanto, la evolución de la serie estará condicionada por la relación estadística
existente entre ésta y el tiempo. Si la correlación es fuerte, la tendencia podría ser
expresada como una función lineal del tiempo, es decir, mediante una recta de regresión.
Este procedimiento de encontrar la tendencia secular, además de ser el más exacto, dispone
de una medida de la bondad del ajuste, dada por el coeficiente de determinación.
El método analítico tiene además la ventaja sobre los dos anteriores, que permite
predecir el comportamiento de la variable Y en el futuro, al venir dada la tendencia secular de
la serie como la ecuación de una recta o una parábola, susceptible de dar nuevos valores a T,
en forma de ecuación Y  f T  .
Ejemplo: El número de turistas (en millones) que visitaron nuestro país (España) está
dado por la siguiente tabla, se pide el estudio de la tendencia secular por el método analítico de
los mínimos cuadrados a una recta.
Años
T
1993
1994
1995
1996
1997
1998
1999
2000
2001
-4
-3
-2
-1
0
1
2
3
4
yi
57,26
61,42
57,59
60,65
64,55
70,85
72,02
74,4
75,7
Vamos a calcular una recta de regresión de la variable Y (nº de turistas) sobre la variable
T (tiempo). Para ello vamos a realizar una traslación en el tiempo para poder simplificar los
cálculos, es decir, asignamos al año 1997 el valor 0, al 1998 el valor 1, al 1996 el valor – 1 y
así sucesivamente. Si el número de años fuera par, podríamos asignar al año 1993 el valor 1, al
año 1994 el valor 2 y así sucesivamente.
Los parámetros necesarios serian:
t 0
St  2,582 St2  6,666
y  66,05 S y  6,857
S y2  47,023
Sty  16,862
Calculamos el coeficiente de correlación lineal pues, si no hubiera una alta correlación
no tendría sentido calcular la recta de regresión:
R
Profesor: Aristóteles de la E. Gosálbez.
S ty
St  S y

16,862
 0,95
2,582 6,857
58
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
La ecuación de la recta de regresión de Y sobre T es la recta:
y  66,05 
16,862
(t  0)  y  2,53t  66,05
6,666
Podemos acompañar el estudio de la tendencia con el valor del coeficiente de
determinación  R 2  0,952  0,902, podríamos decir que la tendencia lineal (los años)
explica aproximadamente el 90% de la variación de turistas en España.
Como hemos apuntado antes, si queremos hacer una estimación para el año 2005,
sustituiríamos en la ecuación anterior por t  8 , pues si 1997 es t  0 , entonces 2005 es t  8
y (8)  2,53 8  66,05  86,29
Lo que quiere decir que el número de turistas que se espera visiten España en el año
2005 es de 86,29 millones (si no cambia la tendencia ).
6.4. AUTOCORRELACIÓN.
En muchas ocasiones los valores de una serie temporal dependen linealmente de los
valores observados en un tiempo anterior.
Dada una serie temporal (t i , yi ) , se considera la serie (t i , yi h ) , obtenida mediante un
retardo de h unidades de tiempo (suele utilizarse un retardo de 1 ó 2 años). El estudio de la
correlación entre la variable yi y la variable retardada yi-h se denomina autocorrelación de la
serie temporal dada.
La existencia de autocorrelación en una serie temporal indica, en menor o mayor
medida, la dependencia lineal que una serie temporal tiene con ella misma con un retardo en el
tiempo; esta medida viene determinada por el coeficiente de correlación entre las variables yi e
yi-h, llamado coeficiente de autocorrelación, que viene dado por la fórmula:
r
S yi yi  h
S yi S yi  h
El coeficiente de autocorrelación mide la dependencia de los valores de una variable
respecto a los valores de la misma en tiempos anteriores.
Ejemplo: Obtener el coeficiente de autocorrelación de la siguiente serie temporal con
un retardo de 1 año.
Años (ti)
yi
1995
1996
1997
1998
1999
(3)
4
6
5
8
23
Profesor: Aristóteles de la E. Gosálbez.
2
y i 1
yi ·yi 1
yi
3
4
6
5
18
12
24
30
40
106
16
36
25
64
141
yi 1
9
16
36
25
86
59
2
Estadística para Relaciones Laborales.
TEMA VI 1ª Parte.
Calculando la covarianza S yi yi 1 y las desviaciones típicas S yi y S yi 1 :
n
S yi yi 1 
 y ·y
i
i 1
N
n
S yi 
y
i 1
106 23 18
 ·  0,625
4
4 4
2
 yi
N
y
i 1
 y i ·y i 1 
2
i
n
S yi 1 
i 1
2
141  23 

    2,19  1,47
4  4
2
i 1
N
2
 yi 1
2

86  18 
    1,25  1,11
4 4
con lo que el coeficiente de autocorrelación resultante es:
r
S yi yi 1
S yi S yi 1

0,625
 0,38
1,47·1,11
lo cual indica que no existe dependencia entre los valores de cada año con los del año anterior,
ya que el coeficiente de autocorrelación es muy bajo. Para que exista dependencia, este
coeficiente ha de ser igual o superior a 0,80.
Profesor: Aristóteles de la E. Gosálbez.
60
Descargar