TRABAJO DE ESTADÍSTICA

Anuncio
TRABAJO DE ESTADÍSTICA
El objetivo de este estudio es el análisis de una variable principal y una secundaria.
En este trabajo, la variable principal elegida es el número de viajeros residentes en el extranjero
llegados a España. Es una variable numérica, las unidades vienen dadas en número de viajeros.
La variable secundaria son los ingresos que realizan los viajeros en nuestro país, también es una
variable numérica, las unidades vienen dadas en pts.
FUENTE: Libro Estadística Básica Aplicada al Sector Turístico.
Antonio Fernández Morales y Beatriz Lacomba Arias
Ágora Universidad.
DATOS
Ingresos por Turismo y Viajeros residentes en el Extranjero llegados a España.
AÑO
1992
1993
1994
1995
1996
1997
Total
VIAJEROS (106 personas)
12,483
12,914
15,310
16,286
17,009
18,304
92,306
INGRESOS (109 pts.)
2.265
2.514
2.875
3.166
3.504
3.387
17.711
Fuente: Boletín Mensual de Estadística I.N.E.
DESCRIPCIÓIN DE LA VARIABLE PRINCIPAL (VIAJEROS)
Nos centraremos en la variable principal viajeros. Para ello se realizarán métodos numéricos y gráficos
para su interpretación.
METODOS GRÁFICOS
1
Resumen Estadístico para VIAJEROS
Frecuencia = 6
Media = 15,3843
Mediana = 15,798
Moda =
Media geométrica = 15,237
Varianza = 5,30056
Desviación típica = 2,30229
Mínimo = 12,483
Máximo = 18,304
Coef. de variación = 14,9652%
Esta tabla muestra el resumen estadístico para VIAJEROS. Incluye las medidas de tendencia central,
medidas de variabilidad, y medidas de forma. De particular interés están los coeficientes de asimetría y
curtosis estandarizados que pueden utilizarse para determinar si la muestra procede de una
distribución normal. Los valores de estos estadísticos fuera del rango de −2 a +2 indican alejamiento
2
significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la
desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del
rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis
estandarizado está dentro del rango esperado para los datos de una distribución normal.
Percentiles para VIAJEROS
1,0% = 12,483
5,0% = 12,483
10,0% = 12,483
25,0% = 12,914
50,0% = 15,798
75,0% = 17,009
90,0% = 18,304
95,0% = 18,304
99,0% = 18,304
Este cuadro muestra los percentiles de la muestra para VIAJEROS.
Los percentiles son valores bajo los cuales se encuentran porcentajes específicos de datos. Puede ver los
percentiles gráficamente seleccionando Gráfico Cuantil de la lista de Opciones Gráficas.
Diagrama de Tallo y Hojas para VIAJEROS:
unidad = 0,1 1|2 representa 1,2
2 12|49
2 13|
2 14|
3 15|3
3 16|2
2 17|0
1 18|3
Aquí se muestra la distribución de frecuencias para VIAJEROS. El rango de datos ha sido dividido en
intervalos de 7 (llamados tallos), cada uno representado por una fila de la tabla.
El tallo se etiqueta utilizando los primeros dígitos de los valores que se encuentran dentro del intervalo.
3
En cada fila, los valores de los datos individuales son representados por un dígito (llamado hoja) a la
derecha de la línea vertical. Esto nos da un histograma de los datos del que puede recuperar al menos
dos dígitos significativos de cada valor. Si hay cualquier punto que queda alejado de la mayoría de los
otros (llamados puntos externos), se sitúan en tallos altos y bajos separados. En este caso, no hay ningún
punto externo. Los puntos externos se representan en el gráfico de caja y bigotes, al cuál puede acceder
a través del listado de Opciones Graficas. La columna de números situada más a la izquierda contiene
el recuento acumulado desde la parte superior de la tabla hacia la inferior, deteniéndose en la fila que
contiene la mediana.
4
HISTOGRAMA POLIGONAL
5
ESTUDIO DE LA VARIABLE SECUNDARIA INGRESOS
RESUMEN ESTADÍSTICO
Frecuencia = 6
Media = 2,95183
Mediana = 3,0205
Moda =
Media geométrica = 2,91626
Varianza = 0,241893
Desviación típica = 0,491827
Mínimo = 2,265
Máximo = 3,504
Rango = 1,239
Primer cuartil = 2,514
6
Segundo cuartil = 3,387
Rango intercuar. = 0,873
Las medidas de tendencia central, medidas de variabilidad, y medidas de forma. De particular interés
están los coeficientes de asimetría y curtosis estandarizados que pueden utilizarse para determinar si la
muestra procede de una distribución normal. Los valores de estos estadísticos fuera del rango de −2 a
+2 indican alejamiento
significante de normalidad que tendería a invalidar cualquier test estadístico con respecto a la
desviación normal. En este caso, el valor del coeficiente de asimetría estandarizado está dentro del
rango esperado para los datos de una distribución normal. El valor del coeficiente de curtosis
estandarizado está dentro del rango esperado
para los datos de una distribución normal.
PERCENTILES PARA INGRESOS
1,0% = 2,265
5,0% = 2,265
10,0% = 2,265
25,0% = 2,514
50,0% = 3,0205
75,0% = 3,387
90,0% = 3,504
95,0% = 3,504
99,0% = 3,504
Este cuadro muestra los percentiles de la muestra para INGRESOS. Los percentiles son valores bajo
los cuales se encuentran porcentajes específicos de datos.
DIAGRAMA DE TALLO Y HOJAS PARA INGRESOS: unidad = 0,1 1|2 representa 1,2
1 2|2
2 2|5
2 2|
3 2|8
3 3|1
2 3|3
7
1 3|5
Aquí se muestra la distribución de frecuencias para INGRESOS. El rango de datos ha sido dividido en
intervalos de 7 (llamados tallos), cada uno representado por una fila de la tabla. El tallo se etiqueta
utilizando los primeros dígitos de los valores que se encuentran dentro del intervalo. En cada fila, los
valores de los datos individuales son representados por un dígito (llamado hoja) a la derecha de la línea
vertical. Esto nos da un histograma de los datos del que puede recuperar al menos dos dígitos
significativos de cada valor. Si hay cualquier punto que queda alejado de la mayoría de los otros
(llamados puntos externos), se sitúan en tallos altos y bajos separados. En este caso, no hay ningún
punto externo.
REPRESENTACIONES GRÁFICAS
8
La caja central está construida sobre el primer cuartil 2,514, la mediana y el tercer cuartil. La
distribución es simétrica.
HISTOGRAMA POLIGONAL
9
ESTUDIO DE LAS DOS VARIABLES PRINCIPAL Y SECUNDARIA
Análisis de Regresión − Modelo Lineal Y = a + b*X
Variable dependiente: INGRESOS
Variable independiente: VIAJEROS
PARÁMETRO
ESTIMACIÓN
ESTADÍSTICO
P−VALOR
10
ORDENADA
PENDIENTE
ERROR
ESTÁNDAR
0,458727
0,0295434
−0,206424
0,20529
−0,449992
6,94878
0,6760
0,0023
Análisis de la Varianza
FUENTE
MODELO
RESIDUO
SUMA DE
CUADRADOS
1,11694
0,0925279
GL
1
4
CUADRADO
MEDIO
1,11694
0,023132
COCIENTE−F P−VALOR
48,29
0,0023
Coeficiente de Correlación = 0,960987
La salida muestra los resultados del ajuste al modelo lineal para describir la relación
entre INGRESOS y VIAJEROS. La ecuación del modelo ajustado es
INGRESOS = −0,206424 + 0,20529*VIAJEROS
R2=92.34% indica que el modelo explica un 92.347 % de la variabilidad en ingresos.
El coeficiente de correlación al ser positivo y cercano a la unidad demuestra una relación lineal directa
entre las dos variables.
El coeficiente de correlación es igual a 0,960987, indicando una relación relativamente fuerte entre las
variables. El error estándar de la estimación muestra la desviación típica de los residuos que es
0,152092.
GRÁFICO DE DISPERSIÓN
11
12
Gráfica que representa los ingresos realizados por los turistas extranjeros en nuestro país
13
Descargar