Organización y resumen de datos categóricos Contenidos 1. Organización y resumen de datos categóricos: tablas de frecuencias. 2. Gráfico de barras. Gráficos de pastel. 3. Tablas de contingencia. Gráficos comparativos. Distribuciones unidimensionales de frecuencias Una parte importante del planeamiento de la información administrativa, consiste en resumir y presentar los datos de modo que se pueda obtener información de manera rápida y sencilla La información obtenida antes de ser organizada y analizada, se conoce como datos sin procesar. Ejemplo: La dirección de Estadísticas e Investigaciones Económicas de la Provincia de Mendoza realiza desde diciembre del 2002 la “Encuesta de Caracterización del Turista que visita la Provincia”. Los días 5, 6 y 7 de Marzo de 2009, se realizó la onda número 60 y coincide con la fiesta provincial de la Vendimia. Metodológicamente, el estudio consiste en la aplicación de un cuestionario estructurado a través del cual se indagan personas residentes en el país y en el exterior que, al momento de la investigación, se encuentran visitando la Ciudad de Mendoza. El relevamiento se realizó en cuatro puntos muestrales del microcentro de la Ciudad de Mendoza. Los datos siguientes muestran la participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitaron Mendoza en la onda 60. La codificación respectiva es: 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario. 4- Casas de familiares o amigos 5- Otros: Bed & Breakfast, Hostel o Albergue Turístico, Motel ,Hostería o Posada. Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza. Mendoza. Marzo 2009 - Sexagésima Onda 1 4 2 1 1 4 1 2 4 4 1 4 2 4 4 4 5 3 4 1 4 4 4 4 4 4 1 3 3 4 3 1 4 1 1 3 2 3 5 4 3 1 4 4 4 3 4 2 5 4 3 2 1 1 4 4 Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009 Autores: Liliana Marconi / Adriana D´Amelio La variable es tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza. La escala de medición es nominal. Una primera organización de estos datos sería contar cuántos datos tenemos en cada categoría. Esto se llama distribución de frecuencias absolutas: 1 : ½½½½ ½½½½ ½½½ 13 2 : ½½½½ ½ 6 3 : ½½½½ ½½½½ 9 4 : ½½½½ ½½½½ ½½½½ ½½½½ ½½½½ 25 5 : ½½½½ 5 Trabajar con proporciones o porcentajes, en muchas ocasiones nos brinda mayor información, por lo que la tabla de distribución de frecuencias la vamos a completar con la frecuencia relativa, que se obtiene dividiendo la frecuencia absoluta por el número total de observaciones, y la frecuencia porcentual que es la frecuencia relativa multiplicada por 100%. fi f fr = i n Frecuencia absoluta: nº de observaciones en cada categoría Frecuencia relativa: Frecuencia relativa porcentual fr% = fi .100% n Muy importante: Ahora estamos en condiciones de elaborar una tabla de frecuencias. En estas tablas hay que poner en el encabezamiento el título (lo que responda a ¿qué?, ¿cuándo?, ¿dónde?) de manera que la persona que lea el cuadro se ubique sobre el tema. Al final de la tabla de colocan la fuente (quién obtuvo los datos, en qué fecha, en qué lugar a ser posible) y todas las explicaciones adicionales o comentarios. 1. Tabla de frecuencias La tabla formada por las distintas categorías de las variables y por las frecuencias absolutas, relativas y porcentuales recibe el nombre de distribución de frecuencias . La tabla, debe constar de: Autores: Liliana Marconi / Adriana D´Amelio [Título adecuado: el cual debe ser claro y conciso, que responda a las preguntas: qué relaciona, cuándo y dónde se hicieron las observaciones. [El cuerpo: o tabla en sí, donde van las categorías y las frecuencias, generalmente se utilizan la frecuencia absoluta y el público a quien va dirigido y el diseño artístico del gráfico. [ Notas al pie: en caso que se haga necesario dar explicaciones adicionales o comentarios. [ Fuente: donde se indica donde se obtuvieron los datos, quién los obtuvo los datos, en qué fecha, en qué lugar, a ser posible En nuestro ejemplo sería: Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza. Mendoza. Marzo 2009 - Sexagésima Onda Alojamiento 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 4-Casas de familiares o amigos 5-Otros Total fi 13 6 9 25 3 56 f ri f ri % 0.23 23% 0.11 11% 0.16 16% 0.45 45% 0.05 5% 1 100% Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009 Vamos a leer la categoría 4-Casas de familiares o amigos: "De las 56 personas de origen chileno entrevistadas, 25 se alojaron en casas de familiares o amigos y corresponde a una proporción de 0,45 que representa el 45% de las personas entrevistadas" § § Para calcular la f ri se posiciona en la celda se coloca el signo igual se marca la celda 13 / 56 y se dá enter. Para calcular f ri % se copian las celdas de las f ri y se va a formato-celda-porcentaje y enter Vemos que la información está expresada de manera más resumida. · Muchas veces en estas tablas se representan la frecuencia absoluta y los porcentajes únicamente. Otra forma de presentar los datos anteriores sería utilizando gráficas 2. Gráficos de barra v Las barras separadas se diseñan en forma horizontal o vertical v Todas las barras deben tener el mismo ancho v Los espacios entre barras van desde la mitad del ancho de una barra hasta el ancho Autores: Liliana Marconi / Adriana D´Amelio total v Se deben incluir escalas y algunas indicaciones que ayuden a la lectura de las gráficas v Los ejes se deben identificar en forma clara v Dentro del cuerpo de la gráfica se deben incluir todo tipo de claves v El título se coloca, preferentemente encima del cuerpo v Las notas de pie de página y las fuentes se colocan debajo de la gráfica Tipo de alojamiento elejido por turistas chilenos que visitan Mendoza. Onda 60 3 Tipo de alojamiento 5-Otros 25 4-Casas de familiares o amigos 9 3-Casas, departamentos o habitaciones de alquiler temporario 6 2-Apart Hotel 13 1-Hotel o Petit Hotel 0 5 10 15 20 25 frecuencia absoluta Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009. Tipo de alojamiento elegido por turistas chilenos que visitan Mendoza. Onda 60. 30 25 frecuencia absoluta 25 20 15 13 9 10 6 5 3 0 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos 4-Casas de familiares o o habitaciones de alquiler amigos temporario 5-Otros Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009. Autores: Liliana Marconi / Adriana D´Amelio 30 § Se marca las celdas de las categorías y las de frecuencias, en el menú se hace clic en Asistente para gráficos. Bajo Tipo de gráficos se selecciona columnas, y bajo Subtipo de gráficos seleccione en la esquina superior izquierda el tipo de barras que quiere se representen. § Luego marque siguiente en título coloque el título correspondiente a la variable en estudio teniendo en cuenta que esté territoriada y la fecha. En eje de categorías (X) escriba “Tipo de alojamiento” y en eje (Y) escriba el tipo de frecuencia que representó puede ser cualesquiera de las tres. § Pase a la parte superior a la pestaña Leyenda, y quite si no quiere ver la leyenda la palomita que dice Mostrar leyenda. Si quiere rotular los datos se va a la pestaña Rótulos de datos y elige en el contenido del rótulo lo que quiere mostrar ( valores, porcentajes, etc.). Si quiere que muestre la tabla, se va a la pestaña Tabla de datos y le pone la palomita a mostrar tabla de datos . Luego marca finalizar. § Si quiere cambiar los colores del gráfico cómo así las tramas, las fuentes, etc. se debe posicionar en el gráfico y ahí le van apareciendo las opciones. Gráfica de pastel v Se dibuja un círculo y se divide en sectores. v Para calcular los grados de ángulo que le corresponde a cada sector se multiplica la frecuencia relativa f r por 360º. v Son válidas todas las sugerencias sobre escalas, títulos, fuentes e información que se coloca en el cuerpo del gráfico Tipo de alojamiento elegido por turistas chilenos que visitan Mendoza. Onda 60 5-Otros 5% 4-Casas de fam iliares o amigos 45% 1-Hotel o Petit Hotel 23% 2-Apart Hotel 11% 3-Cas as , departam entos o habitaciones de alquiler tem porario 16% Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009. Autores: Liliana Marconi / Adriana D´Amelio Tipo de alojamiento elegido por turistas chilenos que visitan Mendoza. Onda 60 5% 23% 45% 11% 16% 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 4-Casas de familiares o amigos 5-Otros Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009. El programa R es de distribución gratuita. Tiene una amplia gama de paquetes estadísticos que hacen que cada vez más a nivel mundial se utilice y recomiende el mismo. En http://www.r-project.org se baja el programa en la forma Windows, y en CRAN se elige el país desde el que se quiere bajar. Además se pueden obtener manuales en varios idiomas, incluyendo castellano. Una introducción al uso de R en castellano (version power-point) se puede ver en: http://www.etsu.edu/math/seier/R.htm Manuales en castellano en http://www.R-project.org • R Para Principiantes traducida por Jorge A. Ahumada (PDF). • “Introducción a R” por Andrés González y Silvia González (PDF ) • “Gráficos Estadísticos con R” por Juan Carlos Correa y Nelfi González (PDF). • “Cartas sobre Estadística de la Revista Argentina de Bioingeniería” Marcelo R. Risk (PDF). • “Introducción al uso y programación del sistema estadístico R” por Ramón Díaz-Uriarte. Realizamos el gráfico de pastel > pie(x,alojamiento) Poniendo título >pie(x,alojamiento,main="Tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.Onda 60. Marzo 2009") Autores: Liliana Marconi / Adriana D´Amelio Tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza.Onda 60. Marzo 2009 Apart Hotel Hotel o Petit Hotel Casas,departamentos o habitaciones de alquiler temporario Otros Casas de familias o amigos Fuente: Dirección de Estadísticas e Investigaciones Económicas. Encuesta de caracterización del turista que visita Mendoza. Mayo 2009. 2. Tablas estadísticas de doble entrada o tablas de contingencia Consideramos una población de n individuos, donde cada uno de ellos presenta dos caracteres que representamos mediante las variables X e Y, La variable X presenta k categorías, y la variable Y p categorías , Por ejemplo: Una empresa automotriz inició un estudio acerca del tipo de automóvil utilizado por los empleados administrativos de una organización pública, Los datos obtenidos se muestran en la siguiente tabla de contingencia: Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. Tipo de Alojamiento Onda 47-2008 Onda 60 - 2009 13 45 1-Hotel o Petit Hotel 6 20 2-Apart Hotel 9 9 3-Casas, departamentos o habitaciones de alquiler temporario 25 13 4-Casas de familiares o amigos 3 13 5-Otros Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, Autores: Liliana Marconi / Adriana D´Amelio § Se marca las celdas de las categorías y las de frecuencias, en el menú se hace clic en Asistente para gráficos, Bajo Tipo de gráficos se selecciona columnas, y bajo Subtipo de gráficos seleccione en la esquina superior izquierda el tipo de barras que quiere se representen, § Luego marque siguiente en título coloque el título correspondiente a la variable en estudio teniendo en cuenta que esté territoriada y la fecha, En eje de categorías (X) escriba “Tipo de alojamiento” y en eje (Y) escriba el tipo de frecuencia que representó puede ser cualesquiera de las tres, § Pase a la parte superior a la pestaña Leyenda, y quite si no quiere ver la leyenda la palomita que dice Mostrar leyenda, Si quiere rotular los datos se va a la pestaña Rótulos de datos y elige en el contenido del rótulo lo que quiere mostrar ( valores, porcentajes, etc,), Si quiere que muestre la tabla, se va a la pestaña Tabla de datos y le pone la palomita a mostrar tabla de datos , Luego marca finalizar, § Si quiere cambiar los colores del gráfico cómo así las tramas, las fuentes, etc, se debe posicionar en el gráfico y ahí le van apareciendo las opciones, Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, X es tipo alojamiento elegido por turistas chilenos en 2008 (onda 47) e Y es la variable es tipo alojamiento elegido por turistas chilenos en 2009 (onda 60) También se puede utilizar un gráfico de barras apiladas Autores: Liliana Marconi / Adriana D´Amelio Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, Con la intención de reunir en una sola estructura toda la información disponible, creamos una tabla de contingencia formada por k x p casillas, en nuestro ejemplo 5 x 2 organizadas de forma que se tengan k (en nuestro caso 5) filas y p (en nuestro caso 2) columnas, La casilla denotada de forma general mediante el subíndice ij hará referencia a los elementos de la muestra que presentan simultáneamente las modalidades xi e yj. Cada celda de la tabla representa la frecuencia bivariante de las características correspondientes a su fila y columna Por ejemplo, (xi=2 , yj=1) representa a turistas que seleccionaaron Apart Hotel en 2008 Con estas tablas se puede obtener una descripción cuantitativa de las distintas cualidades bivariantes de la muestra, en forma de frecuencias y porcentajes, Estos últimos pueden ser relativos al total de la muestra, al total de una fila o al total de una columna,, Llamamos: Ø frecuencia bivariante total al número de datos n, Ø frecuencia absoluta conjunta fij al número de datos que presentan simultáneamente las características xi de la primera variable e yj de la segunda variable , La suma de los datos de todas las casillas nos da el total de datos n f ij Ø frecuencia relativa conjunta es el cociente f rij = n , La suma de los datos de todas las casillas nos da 1 Ø frecuencia relativa porcentual es el cociente frij% = f ij n ,100%, La suma de los datos de todas las casillas nos da 100% a) Utilizando la frecuencia absoluta conjunta: Autores: Liliana Marconi / Adriana D´Amelio Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. Tipo de Alojamiento Onda 47-2008 Onda 60 - 2009 13 45 1-Hotel o Petit Hotel 20 6 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 9 9 13 25 4-Casas de familiares o amigos 5-Otros 3 13 Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, o Observamos que respondieron que elegían casas de familiares o amigos 25 turistas chilenos en 2008 y 13 en 2009 b) Utilizando la frecuencia absoluta porcentual Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. Tipo de Alojamiento 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 4-Casas de familiares o amigos 5-Otros Total Onda 47-2008 8% 4% 6% 16% 2% 36% Onda 60 - 2009 Total 29% 37% 13% 17% 6% 12% 8% 24% 8% 10% 64% 100% Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, o Observamos que respondieron que elegían casas de familiares o amigos el 16% de los turistas chilenos en 2008 y el 8% en 2009 a) Usando los porcentajes por fila Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. Tipo de Alojamiento 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 4-Casas de familiares o amigos 5-Otros Onda 47-2008 Onda 60 - 2009 Total 22% 78% 100% 23% 77% 100% 50% 50% 100% 66% 34% 100% 19% 81% 100% Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo 2009, o Dentro del grupo que eligió Hotel o Petit hotel, observamos que el 22% lo eligió en 2008 y el 78% en 2009 Autores: Liliana Marconi / Adriana D´Amelio Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009 b) Usando los totales por columna Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. Tipo de Alojamiento 1-Hotel o Petit Hotel 2-Apart Hotel 3-Casas, departamentos o habitaciones de alquiler temporario 4-Casas de familiares o amigos 5-Otros Total Onda 47-2008 Onda 60 - 2009 23% 45% 11% 20% 16% 9% 45% 13% 13% 5% 100% 100% Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009, o Observamos que entre los turistas chilenos que nos visitaron en el 2008, el 23%se alojó en Hoteles o Petit Hotel, el 11% en apart Hotel, el 16% en casa, departamentos o habitaciones de alquiler temporario, el 45% en casas de familiares o amigos el 5% restante en otros establecimientos. Participación relativa del tipo de alojamiento elegido por los turistas chilenos que visitan Mendoza, marzo 2009. 100% Total 90% 80% 5-Otros 70% 60% 50% 4-Casas de familiares o amigos 40% 30% 3-Casas, departamentos o habitaciones de alquiler temporario 2-Apart Hotel 20% 10% 0% Onda 47-2008 Onda 60 - 2009 Fuente: Dirección de Estadísticas e Investigaciones Económicas, Encuesta de caracterización del turista que visita Mendoza, Mayo2009 Autores: Liliana Marconi / Adriana D´Amelio