Docentes: Sr. Ricardo Carrillo Srta. Claudia Barrientos Departamento de Matematica Curso: Cuarto Medio Unidad 3: Estadistica y Prob. Guia N° 1 - 2013 GUÍA EJERCICIOS MATEMATICA 1. ELEMENTOS DE ESTADÍSTICA La estadística está ligada con los métodos científicos, en la toma, organización, recopilación, presentación y análisis de datos usados tanto para la deducción de conclusiones como para tomar decisiones de acuerdo con los análisis. El término estadística se usa también para denotar a números que se derivan de los datos, como promedios, medias, desviación standard, etc. 1.1 Población y muestra Al analizar una colección de datos que se refieren a las características de un grupo de individuos u objetos, como por ejemplo la estatura o los promedios de notas de un curso del Colegio, a veces es prácticamente imposible analizar al grupo completo de individuos u objetos, llamado población o universo, por lo que se analiza una pequeña parte del grupo o población, llamada muestra. Una población puede ser finita o infinita. La estadística que trata las condiciones bajo las cuales tales inferencias son válidas, se llama estadística inductiva o estadística inferencial. La parte de la estadística que trata solamente de describir y analizar a un grupo dado (muestra) sin sacar conclusiones o inferencias de un grupo mayor, se llama estadística descriptiva o deductiva. 1.2 Variables: Pueden ser Cualitativas y Cuantitativas. Las variables cuantitativas se clasifican en: a) Continuas: Si los valores que arroja la variable pertenecen a un intervalo continuo. (Números decimales) b) Discretas: Si los valores que arroja la variable son finitos o pertenecen al conjunto de los números naturales. Ejemplo 1 Se desea realizar un estudio estadístico de las estaturas de los alumnos de los cursos de E. Media del Colegio; entonces: Población: Alumnos de Enseñanza media del colegio. Muestra: Alumnos de los cursos A de E. Media del colegio. Variable estadística: ”Estatura de los alumnos de Enseñanza media del colegio”. Esta Variable es de tipo Continuo. 1.3 Distribución de frecuencias Cuando tenemos una gran cantidad de datos es conveniente distribuirlos en clases o categorías y determinar el número de datos pertenecientes a cada clase. Dicho número de datos es la frecuencia de clase. Una ordenación tabulada de los datos separados en clases, con las frecuencias correspondientes, se llama distribución de frecuencias o tabla de frecuencias. Agrupación de datos por intervalos de clase: intervalos iguales en los que se divide el número total de observaciones. Es conveniente utilizar los intervalos de clase cuando se tiene un gran número de datos de una variable continua. ¿Cómo saber cuántos intervalos considerar? ¿Cómo determinar su amplitud? Primero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el menor de los valores obtenidos. Rango = xmáx – xmín Luego debemos establecer el número de intervalos (N) y determinar la amplitud (A) de los mismos. De esta forma, A = rango / N Obs.: (N tú lo eliges, pero es conveniente que no sea muy pequeño) Ejemplo 2 En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable estatura, registrándose los siguientes valores: 1,52 1,64 1,54 1,64 1,73 1,55 1,56 1,57 1,58 1,58 1,59 1,53 1,60 1,60 1,61 1,61 1,65 1,63 1,79 1,63 1,62 1,60 1,64 1,54 1,65 1,62 1,66 1,76 1,70 1,69 1,71 1,72 1,72 1,55 1,73 1,73 1,75 1,67 1,78 1,63 En esta recolección de datos, el rango es: R = xmáx – xmín R = 1,79 – 1,52 = 0,27 Y si queremos trabajar con una amplitud A = 0,05; ¿cuál es, para nuestro caso, el número de intervalos? De ser necesario, podemos aproximar el valor hallado. Así: N = R / A N = 0,27/0,05 = 5,4 5 intervalos De esta modo, el primer intervalo será [1,52; 1.55[ y el segundo [1,55; 1,6[, y así sucesivamente hasta cubrir “todos los datos”. Luego estamos en condiciones de completar la siguiente tabla: Intervalo de Clase Marca de clase (x) fi fr fr% Fa Fa% Frecuencia Absoluta Frecuencia Absoluta Relativa Frecuencia Absoluta Porcentual Frecuencia Acumulada Frecuencia acumulada Porcentual 1.4 Representación gráfica de datos estadísticos. Para una lectura más rápida y clara de los datos estadísticos, es preferible representarlos a través de gráficos. Las representaciones más utilizadas son: el gráfico de barras, el histograma de frecuencias, el polígono de frecuencias, y el gráfico circular. a) Diagrama de Barras: Cada valor de las variables se representa mediante una barra proporcional a la frecuencia con que se presenta. Son apropiados para datos medidos en escala nominal u ordinal. b) Histogramas: Se usa para variables agrupadas en intervalos, asignando a cada intervalo un rectángulo de superficie proporcional a su frecuencia. Su diferencia de un diagrama de barra es que en éste las barras están separadas, mientras que en el histograma están juntas, pues la variable es continua. c) Poligono de Frecuancia: Es la línea que une los puntos medios correspondie-ntes a las frecuencias de cada valor. Se debe tomar siempre dos puntos cuya frecuencia sea cero, correspondiente al inicio y fin del polígono. d) Diagramas circulares: Son utilizados en aquellos casos donde nos interesa no sólo mostrar el número de veces que se da una característica o atributo de manera tabular sino más bien de manera gráfica, de tal manera que se pueda visualizar mejor la proporción en que aparece esa característica respecto del total. 1.5 Medidas de tendencia central I. La moda La moda de una serie de datos es aquel valor que se presenta con mayor frecuencia, es decir, es el valor que más se repite. La moda puede no existir y si existe, puede no ser única. Ejemplo 1: Dada la siguiente serie ordenada de datos: 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 17; la moda es 9 (se repite 3 veces) Ejemplo 2: La siguiente serie ordenada de datos no tiene moda. 1, 4, 6, 10, 11, 13, 16 Ejemplo 3: La moda de la siguiente serie de datos es 2 y 4. 2, 2, 4, 4, 5, 8, 10 II. La mediana La mediana de una colección de datos ordenados por magnitud es el valor central, si el número total de datos es impar, o la media aritmética de los valores centrales, si el número de datos es par. Geométricamente, la mediana es el valor de x que corresponde a la vertical que divide un histograma en dos partes de igual área. Ejemplo 1: Dada la siguiente serie ordenada de datos: 3, 4, 5, 5, 5, 8, 8, 8, 10; la mediana es 5 (ocupa la posición central en una serie impar de datos) Ejemplo 2: Dada la siguiente serie ordenada de datos: 5, 5, 7, 9, 11, 12, 15, 18 9 11 la mediana es = 10 (promedio de los dos datos centrales en una serie par de datos) 2 III. La media aritmética o promedio Es el promedio aritmético del total de datos obtenidos de la muestra o población. x= xi donde xi es cada dato y n es el número total de datos. n Ejemplos: 1. La siguiente tabla muestra la venta de revistas en un kiosco del centro de Santiago. i. ii. iii. iv. v. ¿Cuál es la variable? ¿Qué tipo de variable es? La moda es 12 (se repite 3 veces). La mediana es: 8 - 8 - 10 - 12 - 12 - 12 - 15 La media es: x Día Lunes Martes Miércoles Jueves Viernes Sábado Domingo 8 8 10 12 12 12 15 11 7 Nº de revistas 15 10 12 8 12 12 8 2. Se desea conocer el rendimiento en la P.S.U. de Matemática de los alumnos de un Preuniversitario. Para tal efecto, se eligen 2 cursos aleatoriamente: MAT-111 y MAT-222. Los puntajes obtenidos en estos cursos son los siguientes: MAT - 111: 437 551 681 551 456 639 772 489 472 662 722 494 563 560 582 670 717 510 508 624 617 472 477 572 620 589 579 MAT - 222: 468 375 556 482 622 437 387 608 769 605 781 522 589 489 660 551 795 723 i. Población: Alumnos del PREUNIVERSITARIO ii. Muestra: MAT - 111 y MAT - 222 iii. Media aritmética x iv. v. vi. vii. 437 551 681 .......... 551 795 723 577 ,9 45 Mediana. Se ordenan de menor a mayor los puntajes. Si el número total de alumnos es par, tomar los centrales adyacentes y hacer la semisuma. Si es impar, es el valor central. Mediana = 572 Moda. MOD = 551 (se repite 3 veces) Tabla de distribución de frecuencias. Elegimos clases de 50 en 50 puntos. CLASE RANGO DE PUNTAJE Nº DE ALUMNOS 1 351 – 400 2 2 401 – 450 2 3 451 – 500 9 4 501 – 550 3 5 551 – 600 11 6 601 – 650 7 7 651 – 700 4 8 701 – 750 3 9 751 – 800 4 i) Gráfico de barras Puntajes de Matemática Preu 12 10 8 Nº de alumnos 6 4 2 0 351 – 401 – 451 – 501 – 551 – 601 – 651 – 701 – 751 – 400 450 500 550 600 650 700 750 800 Puntajes ii) Polígono de frecuencias Puntajes de Matemática Preu 12 10 8 Nº de alumnos 6 4 2 0 351 – 400 401 – 451 – 450 500 501 – 551 – 601 – 651 – 550 600 650 700 701 – 751 – 750 800 Puntajes Ejercicios: 1. El siguiente gráfico muestra la variación del IPC durante seis meses. Con la información del gráfico señala cuáles afirmaciones son verdaderas y cuáles son falsas: a) La variación del IPC más alta del período ocurrió en Junio. b) La variación del IPC acumulada en el período es de un 5,5%. c) En el mes de Junio ocurrió la variación de IPC más alta del año. d) En febrero no hubo variación del IPC. e) En abril, el IPC registró una variación negativa. f) Siempre hubo variación del IPC en el período registrado. g) El IPC más bajo del período se registró en enero y abril. h) La variación promedio del IPC en el período fue de un 0,92% aprox. % de variación 2 1,5 1 0,5 0 E F M A M J Meses 2. El siguiente gráfico muestra los resultados de una prueba de Matemática aplicada a un curso. Con esta información indica cuál de las siguientes afirmaciones es verdadera y cuál es falsa: Nº de alumnos a) 5 alumnos obtuvieron nota 4. b) 6 alumnos obtuvieron nota inferior a 4. c) 1 alumno obtuvo nota 0. d) El curso tiene 21 alumnos. e) La media del grupo es un 4,5. f) La mediana es 4,5. g) 21 alumnos rindieron la prueba. h) La moda es 4. 5 4 3 2 1 0 1 2 3 4 5 6 7 Notas 3) Un alumno tiene dos notas (con escala de 1 a 7), en matemáticas. Si el promedio es 5,5 y la suma de sus notas es 11; ¿Cuáles son las notas? A) 4,0 y 7,0 B) 5,5 y 5,5 C) 5,0 y 6,0 D) 4,5 y 6,5 E) Cualquiera de las anteriores 4) Si la media aritmética de la muestra: 3 - 4 - 5 - 6 - 7 es: 5, y la media aritmética de la muestra: 7 - 8 - 9 - 10 11 es: 9, y la media aritmética de la muestra: 11 - 12 13 - 14 - 15 es: 13; ¿Cuál es la media aritmética de la muestra: 15 - 16 - 17 - 18 - 19? A) 16 B) 16,5 C) 17 D) 17,5 E) 18 5) La mediana de los siguientes valores: x, x - 1, x + 2, x + 3, x -2 es: A) x B) x - 2 C) x + 3 D) x - 1 E) x + 2 6) La frecuencia de la moda de la muestra {2, 2, 3, 3, 4, 4, 4, 5, 7, 7} es: A) 2 B) 3 C) 4 D) 5 E) 7