TRABAJO DE ESTADÍSTICA El objetivo de este estudio es el análisis de una variable principal y una secundaria. En este trabajo, la variable principal elegida es el número de viajeros residentes en el extranjero llegados a España. Es una variable numérica, las unidades vienen dadas en número de viajeros. La variable secundaria son los ingresos que realizan los viajeros en nuestro país, también es una variable numérica, las unidades vienen dadas en pts. FUENTE: Libro Estadística Básica Aplicada al Sector Turístico. Antonio Fernández Morales y Beatriz Lacomba Arias Ágora Universidad. DATOS Ingresos por Turismo y Viajeros residentes en el Extranjero llegados a España. AÑO 1992 1993 1994 1995 1996 1997 Total VIAJEROS (106 personas) 12,483 12,914 15,310 16,286 17,009 18,304 92,306 INGRESOS (109 pts.) 2.265 2.514 2.875 3.166 3.504 3.387 17.711 Fuente: Boletín Mensual de Estadística I.N.E. DESCRIPCIÓIN DE LA VARIABLE PRINCIPAL (VIAJEROS) Nos centraremos en la variable principal viajeros. Para ello se realizarán métodos numéricos y gráficos para su interpretación. METODOS GRÁFICOS 1 Resumen Estadístico para VIAJEROS Frecuencia = 6 Media = 15,3843 Mediana = 15,798 Moda = Media geométrica = 15,237 Varianza = 5,30056 Desviación típica = 2,30229 Mínimo = 12,483 Máximo = 18,304 Coef. de variación = 14,9652% Esta tabla muestra el resumen estadístico para VIAJEROS. Incluye las medidas de tendencia central, medidas de variabilidad, y medidas de forma. De particular interés están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una distribución normal. Los valores de estos estadísticos fuera del rango de −2 a +2 indican alejamiento 2 significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis estandarizado está dentro del rango esperado para los datos de una distribución normal. Percentiles para VIAJEROS 1,0% = 12,483 5,0% = 12,483 10,0% = 12,483 25,0% = 12,914 50,0% = 15,798 75,0% = 17,009 90,0% = 18,304 95,0% = 18,304 99,0% = 18,304 Este cuadro muestra los percentiles de la muestra para VIAJEROS. Los percentiles son valores bajo los cuales se encuentran porcentajes específicos de datos. Puede ver los percentiles gráficamente seleccionando Gráfico Cuantil de la lista de Opciones Gráficas. Diagrama de Tallo y Hojas para VIAJEROS: unidad = 0,1 1|2 representa 1,2 2 12|49 2 13| 2 14| 3 15|3 3 16|2 2 17|0 1 18|3 Aquí se muestra la distribución de frecuencias para VIAJEROS. El rango de datos ha sido dividido en intervalos de 7 (llamados tallos), cada uno representado por una fila de la tabla. El tallo se etiqueta utilizando los primeros dígitos de los valores que se encuentran dentro del intervalo. 3 En cada fila, los valores de los datos individuales son representados por un dígito (llamado hoja) a la derecha de la línea vertical. Esto nos da un histograma de los datos del que puede recuperar al menos dos dígitos significativos de cada valor. Si hay cualquier punto que queda alejado de la mayoría de los otros (llamados puntos externos), se sitúan en tallos altos y bajos separados. En este caso, no hay ningún punto externo. Los puntos externos se representan en el gráfico de caja y bigotes, al cuál puede acceder a través del listado de Opciones Graficas. La columna de números situada más a la izquierda contiene el recuento acumulado desde la parte superior de la tabla hacia la inferior, deteniéndose en la fila que contiene la mediana. 4 HISTOGRAMA POLIGONAL 5 ESTUDIO DE LA VARIABLE SECUNDARIA INGRESOS RESUMEN ESTADÍSTICO Frecuencia = 6 Media = 2,95183 Mediana = 3,0205 Moda = Media geométrica = 2,91626 Varianza = 0,241893 Desviación típica = 0,491827 Mínimo = 2,265 Máximo = 3,504 Rango = 1,239 Primer cuartil = 2,514 6 Segundo cuartil = 3,387 Rango intercuar. = 0,873 Las medidas de tendencia central, medidas de variabilidad, y medidas de forma. De particular interés están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una distribución normal. Los valores de estos estadísticos fuera del rango de −2 a +2 indican alejamiento significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis estandarizado está dentro del rango esperado para los datos de una distribución normal. PERCENTILES PARA INGRESOS 1,0% = 2,265 5,0% = 2,265 10,0% = 2,265 25,0% = 2,514 50,0% = 3,0205 75,0% = 3,387 90,0% = 3,504 95,0% = 3,504 99,0% = 3,504 Este cuadro muestra los percentiles de la muestra para INGRESOS. Los percentiles son valores bajo los cuales se encuentran porcentajes específicos de datos. DIAGRAMA DE TALLO Y HOJAS PARA INGRESOS: unidad = 0,1 1|2 representa 1,2 1 2|2 2 2|5 2 2| 3 2|8 3 3|1 2 3|3 7 1 3|5 Aquí se muestra la distribución de frecuencias para INGRESOS. El rango de datos ha sido dividido en intervalos de 7 (llamados tallos), cada uno representado por una fila de la tabla. El tallo se etiqueta utilizando los primeros dígitos de los valores que se encuentran dentro del intervalo. En cada fila, los valores de los datos individuales son representados por un dígito (llamado hoja) a la derecha de la línea vertical. Esto nos da un histograma de los datos del que puede recuperar al menos dos dígitos significativos de cada valor. Si hay cualquier punto que queda alejado de la mayoría de los otros (llamados puntos externos), se sitúan en tallos altos y bajos separados. En este caso, no hay ningún punto externo. REPRESENTACIONES GRÁFICAS 8 La caja central está construida sobre el primer cuartil 2,514, la mediana y el tercer cuartil. La distribución es simétrica. HISTOGRAMA POLIGONAL 9 ESTUDIO DE LAS DOS VARIABLES PRINCIPAL Y SECUNDARIA Análisis de Regresión − Modelo Lineal Y = a + b*X Variable dependiente: INGRESOS Variable independiente: VIAJEROS PARÁMETRO ESTIMACIÓN ESTADÍSTICO P−VALOR 10 ORDENADA PENDIENTE ERROR ESTÁNDAR 0,458727 0,0295434 −0,206424 0,20529 −0,449992 6,94878 0,6760 0,0023 Análisis de la Varianza FUENTE MODELO RESIDUO SUMA DE CUADRADOS 1,11694 0,0925279 GL 1 4 CUADRADO MEDIO 1,11694 0,023132 COCIENTE−F P−VALOR 48,29 0,0023 Coeficiente de Correlación = 0,960987 La salida muestra los resultados del ajuste al modelo lineal para describir la relación entre INGRESOS y VIAJEROS. La ecuación del modelo ajustado es INGRESOS = −0,206424 + 0,20529*VIAJEROS R2=92.34% indica que el modelo explica un 92.347 % de la variabilidad en ingresos. El coeficiente de correlación al ser positivo y cercano a la unidad demuestra una relación lineal directa entre las dos variables. El coeficiente de correlación es igual a 0,960987, indicando una relación relativamente fuerte entre las variables. El error estándar de la estimación muestra la desviación típica de los residuos que es 0,152092. GRÁFICO DE DISPERSIÓN 11 12 Gráfica que representa los ingresos realizados por los turistas extranjeros en nuestro país 13