FACULTAD DE CIENCIAS EXACTAS Y NATURALES SEMILLERO DE MATEMÁTICAS Grado 9 Taller # 5 Nivel II Análisis de Datos Reseña histórica (Karl Pearson 1857-1936) Graduado por la Universidad de Cambridge en 1879. Cursó estudios de derecho poco después de su graduación, aunque dedicó la mayor parte de su vida a enseñar matemáticas aplicadas, mecánica y genética en el University College de Londres. Muy pronto se sintió interesado por la aplicación de las matemáticas al estudio de la evolución de las especies y la herencia. En 1901 funda la revista Biometrika, en la que publica una monumental biografía sobre Francis Galton, del que fue alumno. Muy interesado por el trabajo de Galton, que intentaba encontrar relaciones estadísticas para explicar cómo las características biológicas iban pasando a través de sucesivas generaciones. Su investigación colocó en gran medida las bases de la estadística del siglo XX, definiendo los significados de correlación, análisis de la regresión y desviación típica. En el año 1911 fue profesor de eugenesia en el University College, examinando la recopilación y análisis de la información en el sentido que las características como inteligencia, criminalidad, pobreza y creatividad se transmiten a través de generaciones. Autor de La gramática de las ciencias (1892). A Pearson se deben aportaciones tan importantes en estadística como el coeficiente de correlación lineal, la distribución o el test de Pearson para el estudio de la bondad del ajuste de una distribución empírica mediante una teórica. A Galton y a Pearson se les considera hoy día los padres de la Estadística moderna OBJETIVO GENERAL Reconocer los conceptos básicos relacionados con estadística y sus diferentes usos. OBJETIVOS ESPECIFICOS Identificar las diversas herramientas de estadística descriptiva y sus representaciones gráficas. Extraer información de un conjunto de datos usando análisis estadísticos y las gráficas asociadas. GLOSARIO Estadística, diagramas de barras, medidas de tendencia central, media, mediana, moda. ELEMENTOS TEÓRICOS Y EJEMPLOS. Definición: (Estadística) Es la ciencia encargada de la recolección, organización, análisis, interpretación y representación de datos para, a partir de ésto, sacar conclusiones y establecer previsiones. 1 En el estudio de la estadística es fundamental distinguir población, muestra y variables estadísticas: La población, es el conjunto de individuos, objetos o fenómenos de los cuales se desea estudiar una o varias características. La muestra, es un subconjunto de la población que se escoge para obtener información sobre la variable a estudiar. La variable estadística es la característica que se estudia en cada elemento de la población o muestra. Dichas variables pueden ser cuantitativas, o cualitativas o sea, cuando la característica se puede medir numéricamente;, o sea, cuando la característica no se puede medir numéricamente. Medidas de Tendencia central: Medidas en torno a las se disponen los elementos de las distribuciones. Las más importantes son la media, la mediana y la moda. Moda: Es la Media Aritmética o promedio de los datos. Mediana: Es el valor que ocupa el lugar central cuando los datos están ordenados de menor a mayor. Si el número de términos de la distribución es impar, la mediana es el valor del medio. Si el número de términos de la distribución es par, la mediana es el valor promedio de los dos datos del centro. Moda: Es el valor que más se repite. Una distribución puede tener más de una moda o no tener ninguna Distribución de frecuencias: Es una tabla donde aparecen los datos con sus respectivas frecuencias. En la tabla de frecuenta se deben tabular: a) la frecuencia absoluta: el número de observaciones por cada categoría b) la frecuencia relativa: la proporción de observaciones por cada categoría, donde la n proporción es P i con n i el número de individuos en una categoría, y N el número N total de observaciones Ejemplo. En una encuesta sobre estudios realizados por 300 personas se obtuvieron los siguientes datos: Posgrado: 6 personas; pregrado: 45 personas; secundarios: 63 personas; primarios: 120 personas; sin estudio pero saben leer: 60; sin estudio y no saben leer: 6 personas. Construya una tabla de frecuencias para los datos y realice las gráficas descriptivas correspondientes e interprete lo que observa. Solución: La tabla de frecuencias queda de la siguiente forma: 2 Tabla de Frecuencias (Estudios realizados) Estudios Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia absoluta absoluta relativa relativa porcentual porcentual acumulada acumulada acumulada Posgrado 6 6 6/300=0.02 0.02 2 2 Pregrado 45 51 45/300=0.15 0.17 15 17 Secundarios 63 14 63/300=0.21 0.38 21 38 Primarios 120 234 120/300=0.4 0.78 40 78 Sin estudio y saben leer 60 294 60/300=0.2 0.98 20 98 Sin estudio y no saben 6 300 6/300=0.02 1.00 2 100 leer Total 300 1.00 100 Las gráficas correspondientes son: GRAFICO DE BARRAS. 140 120 100 80 60 40 20 0 Posgrado Pregrado Secundarios Primarios Sin estudio y saben leer Sin estudio y no saben leer 3 GRAFICO CIRCULAR Sin estudio y no saben leer 2% Sin estudio y saben leer 20% Posgrado 2% Pregrado 15% Secundarios 21% Primarios 40% De ambas gráficas es claro que: La mayoría que los que estudiaron solamente hasta la primaria forman la mayoría de los encuestados. Los que tienen posgrado, así como los que son completamente analfabetas son una minoría. El porcentaje de las personas encuestadas que no estudiaron pero saben leer. EJERCICIOS 1. Si la media muestral o media aritmética se calcula con la fórmula X 1 n X i , siendo n i 1 X i las observaciones y n la cantidad de observaciones, Halle: a) La media muestral para los siguientes datos: 8; 2; 8; 6; 2; 2; 6; 8; 2; 4 b) Identifique la mediana y la moda para los datos anteriores. 2. A un grupo de familias, se les pregunto por el número de hijos y los resultados fueron los siguientes: 2 0 2 4 4 6 6 4 6 7 4 4 7 4 2 0 4 6 7 7. Construya una tabla de frecuencias con los datos anteriores y luego grafique el diagrama de barras que muestre la frecuencia porcentual. 3. Una fábrica de gaseosa proyecta lanzar al mercado un nuevo sabor. Se realiza un test de aceptación de dicho sabor en una muestra de 30 niños, utilizando una escala de 1 a 10 puntos, para medir el grado de aceptación. El puntaje dado por cada uno de los 30 niños fue el siguiente: 2 6 8 7 4 5 10 6 6 7 6 7 3 8 7 6 8 6 5 4 7 8 5 7 6 7 2 7 2 7 4 a) b) c) d) e) f) ¿Cuál es la población? ¿Cuál es la muestra? ¿Cuál es la variable? ¿Es la variable cualitativa o cuantitativa? ¿Qué escala se ha utilizado en la medición de la variable? Construya una tabla de frecuencias y luego grafique el diagrama de Barras con las frecuencias absolutas. 1 n g) Calcule la media muestral definida por X X i , siendo X i las observaciones y n n i 1 la cantidad de observaciones. h) Calcule la mediana y la moda para estos datos. i) Según la gráfica anterior, ¿Qué puede concluir acerca de la aceptación del producto? Explique. 4. Un test de inteligencia aplicado a un grupo de estudiantes arrojó los siguientes resultados: Puntaje obtenido Número de estudiantes En cada puntaje 85 90 95 100 105 110 115 3 7 5 4 12 4 2 Responda las preguntas de la (a) hasta la (h) del problema (4) para este caso. 5. Los siguientes datos corresponden al tiempo, en minutos, que han necesitado 30 clientes de un banco para llevar a cabo una transacción bancaria. 20 42 62 32 28 20 38 26 30 18 42 54 16 32 42 36 18 56 41 16 14 42 34 14 24 51 49 24 18 56 Se pide elaborar: a) Una tabla de frecuencias b) Un diagrama de barras con las frecuencias porcentuales. c) Calcule el tiempo promedio para realizar una transacción. (media muestral) d) Calcule la mediana y la media muestral. 5 EJERCICIOS SOBRE ANÁLISIS DE GRAFICAS. De acuerdo a la siguiente información, conteste las preguntas de 1 al 8. 14 12 10 8 6 4 2 0 MATEMÁTICAS CINCO CUATRO TRES DOS UNO ESPAÑOL CERO No. Estudiantes La gráfica muestra los resultados de todos los estudiantes que se matricularon en dos grupos en jornadas distintas, uno de español y otro de matemáticas. Se aprueba (se gana) una materia con una nota mayor a dos y no se puede habilitar (reforzar) una materia con una nota inferior a dos. Nota Final 1. Del curso de matemáticas, el porcentaje de estudiantes con una nota menor a cuatro es: a. 55% b. 65% c. 45% d. 26% 2. Del curso de español la fracción de estudiantes que obtuvo una nota de uno es: a. 1/7 b. 6/40 c. 6/5 d. 1/6 3. Del curso de matemáticas el número de estudiantes con una nota menor a cuatro es: a. 26 b. 34 c. 12 d. 40 4. El número de estudiantes de matemáticas relacionados en el gráfico es: a. 40 b. 12 c. 42 d. 10 5. El número de estudiantes que puede habilitar matemáticas es: a. 14 b. 8 c. 6 d. 7 6 6. El número de estudiantes de español relacionados en el gráfico es: a. 12 b. 42 c. 52 d. 32 7. De la gráfica podemos deducir que: a. El porcentaje de los que ganan matemáticas es igual al porcentaje de los que ganan español. b. El porcentaje de los que ganan matemáticas es mayor que el porcentaje de los que ganan español. c. El porcentaje de los que ganan matemáticas es menor que el porcentaje de los que ganan español. d. El 50% de los estudiantes ganan matemáticas. 8. El porcentaje de estudiantes que puede habilitar matemáticas es: a. 21% b. 20% c. 15% d. 16% Responde las preguntas DEL 9 Al 12 con base en la siguiente información: En la televisión se están presentando cuatro clases de programas: novelas, dibujos animados, noticieros y películas de acción. En una encuesta realizada acerca de cuál es la clase de programa que prefieren los jóvenes televidentes, se encontró que los 3/5 de los encuestados prefieren novelas, 1/6 películas de acción, 2/15 dibujos animados y 1/10 noticias. 9. A partir de los datos presentados sobre el número de encuestados que prefieren cada programa se puede concluir. a. Los televidentes tienen mayor preferencia por los noticieros que por las novelas b. El programa que menos prefieren son las novelas c. Los televidentes prefieren las novelas que los dibujos animados d. El programa preferido es los dibujos animados. 10. El gráfico que representa las preferencias de los televidentes es: A B 7 C D 11. Si se elige al azar una persona de las encuestadas, hay mayor posibilidad de que esta persona prefiera un programa de: a. Dibujos animados b. Películas de acción c. Noticias d. Novelas 12. Si el total de encuestados es de 100 personas, el porcentaje de personas que prefiere las novelas es: a. 20% b. 50% c. 60% d. 5% Resuelva los problemas 13 al 15 de acuerdo con la siguiente información: El siguiente cuadro muestra parte de la factura de un teléfono celular, donde se muestran marcaciones, tiempo y valor de cada una de ellas. AREA 932 933 933 912 932 912 933 932 932 933 932 912 TELEFONO 428040 537190 432083 287090 428040 287090 537190 428040 428040 432083 293316 287090 MINUTOS 1.0 1.27 2.35 5.0 4.7 3.6 2.1 2.0 1.5 1.7 3.1 4.2 VALOR 770 1540 2310 3850 3850 3080 2310 1540 1540 1540 3080 3850 8 13. Al observar la tabla ¿podemos afirmar que el promedio de tiempo de las llamadas de este usuario es 2.71 minutos? A. No, pues al realizar la operación no se tuvo en cuenta el número total de datos. B. Sí, pues es el valor que corresponde al cociente entre la suma de los minutos de todas las llamadas y el número de llamadas. C. No, porque no corresponde a un mayor porcentaje de llamadas. D Sí, pues corresponde al valor medio de tiempo gastado en las llamadas. 14. Para averiguar cuál teléfono corresponde a la moda en esta tabla de datos, se debe: A Realizar una nueva tabla donde se especifique la frecuencia absoluta de cada número telefónico y tomar el de mayor frecuencia. B Contar el total de veces que se marcó cada número y tomar el de más marcaciones. C Sumar el valor de las llamadas en cada número y tomar el resultado mayor. D Tomar aquel que haya sido marcado la menor cantidad de veces. 15. La frecuencia relativa del teléfono 428040 es 0.333..., porque A Corresponde al cociente entre el valor total de llamadas a este número y el número de llamadas. B Al sumar ésta a las demás frecuencias relativas el resultado aproximado es uno. C Corresponde al cociente entre la frecuencia absoluta de este teléfono y el número total de datos. D Coincide con el promedio de llamadas hechas a este número. Pruebas saber 1. Si el producto de dos números entonces su suma podría ser: (A) divisible por 16 (B) divisible por 8 (C) divisible por 49 (D) divisible por 5 (E) divisible por 3 enteros es igual a 9 2. ¿Cuál es la menor cantidad de cuadros blancos que habría que pintar de gris en la figura para que esta tenga u eje de simetria? (A) 4 (B) 6 (C) 5 (D) (E) 3 3. Si se eligen tres números del tablero de manera que todos pertenezcan A filas y columnas diferentes y se suman los tres números, ¿Cuál es la mayor suma que se puede obtener? (A) 24 (B) 18 (C)15 (D) 12 (E) 21 10