ASPECTOS GENERALES DE LA ESTADÍSTICA POBLACIÓN Y MUESTRA La estadística realiza el estudio de conjunt os de elementos. Así por ejemplo, puede ser objeto de la estadística estudiar las edades que tienen los alumnos de cuarto de secundaria de la ciudad de San Ramón se puede t omar una parte de ese conjunto, por ejemplo los alumnos de cuart o del colegio INA 18 . de la variable (edad) ordenados en forma creciente, en la segunda efectuamos el recuento y en la tercera escribimos la frecuencia (en recuento expresado en números) Variable (edad) 13 14 15 16 17 Observa las edades de 50 alumnos 15 14 14 15 16 16 16 15 15 17 13 15 14 15 16 15 16 15 13 14 15 14 16 14 15 16 17 14 15 13 16 15 15 14 14 13 15 14 16 15 14 16 15 14 17 15 13 15 13 16 Para observar estos datos con mayor claridad los podemos organizar en una tabla, donde la primera c olumna contiene los distintos valores Recuento |||| | |||||||| || |||||||||||| ||| |||||||| | ||| Total Frecuencia absoluta 6 12 18 11 3 n = 50 El conjunto de alumnos de cuarto de secundaria de la ciudad, se llama población o conjuntoe stadí stico. El subconjunto de 50 alumnos de la I.E INA 18 de la misma ciudad se llama muestra. El conjunt o que se quiere estudiar se llama población, y una parte representativa de la población se denomina muestra. La muestra es un subconjunto de la población. Variables Estadísticas Cualit ativa Cuantitativa Discreta Continua VARI ABLE ESTADÍSTICA La variable estadística es la característica que se estudia en cada elemento de la población VARI ABLE CUANTITATIVA Se quiso saber el número de libros leídos por los alumnos del Tercer grado de secundaria durante las últimas vacaciones. Cada uno de ellos respondió y se obtuvieron estos datos: 0; 1; 3; 4; 1; 0; 2; 3; 1; 5; 5; 5; 4; 4; 2; 3; 4; 2; 0; 4; 5; 0; 1; 3; 2; 2; 1; 1; 0; 1; 0; 2; 3. Organizamos los datos en una tabla: Variable: Recuento Frecuencia N° de libros absoluta 0 |||| | 6 1 |||| || 7 2 |||| | 6 3 |||| 5 4 |||| 5 5 |||| 4 Total n = 33 Vemos que la variable estadística: números de libros leídos se expresa mediante un número: 6 alumnos no leyeron ningún libro. 7 leyeron 1, etc. Variable cuantitativa es aquella cuyos valores se expresan mediant e números. Una variable cuantitativa, a su vez, puede ser continua o discreta. VARI ABLE CONTINUA Y DISCRETA La variable estatura es continua porque puede adoptar valores como 0,8 m; 1,5 m; 1,6 m; 2 m. En cambio, la variable número de hijos es discreta porque sus valores posibles son aislados. Puede adoptar como valores 1 hijo, 2 hijos, 3 hijos, 0 hijos, etc. y no admite valores intermedios como 3,3 hijos. VARI ABLE CUALITATIVA Si los valores de la variable no pueden s er expresados mediante números, sino mediante atributos o cualidades, la variable es cualitativa. El género es una variable cualitativa porque se expresa mediante los atributos “femenino” y “masculino”. La variable “color de ojos”, que puede adoptar las formas o atributos azul, verde, café, negro... etc., es también variable cualitativa. El estado civil es una variable cualitativa. EJERCI CIOS PARA LA CLAS E 1. Los siguientes son los datos que se obtuvieron al preguntarse a los alumnos de Tercero de secundaria sobre el número de años que están ya en el colegio. 9 2 5 9 4 4 5 5 2 5 3 9 10 2 2 4 3 2 5 8 3 5 4 3 7 10 10 3 5 6 5 7 8 5 10 6 2 9 10 5 a) Elabora la tabla de frecuencias e indica a cuántos han encuestado. b) Indica cuál es la variable. c) Halla el porcent aje de los que tienen más tiempo en el colegio. d) Halla el porcent aje de los que tienen menos tiempo. e) ¿Cuántos alumnos tienen menos de 5 años en el colegio? Variable Recuento Frecuencia absoluta % 2. En una encuesta sobre estudios realizados se obtuvieron las siguientes respuestas. Estudios Frecuencia absoluta Post-grado 16 Bachillerato 65 Secundarios 83 Primarios 220 Sin estudio y 63 sabe leer Sin estudio y 13 no saben leer total % Completa la tabla y resuelve: a) ¿De cuántos fue la muestra? b) ¿Cuál es la variable? c) Haz tres interpret aciones resultados. con los Total TABLAS ESTADÍSTICAS FRECUENCIA ABS OLUTA Y RELATIVA Frecuencia absoluta de una variable es el número de veces que se repite un dato. Frecuencia relativa es el cociente de la frecuencia absoluta entre el total de dat os o casos observados. Frecuencia relativa (hi) = Frecuencia absoluta (fi) Número total de datos -La suma de frec uencias relativas es siempre 1. Resumen: n fi hi % Agregamos la frecuencia relativa porcentual (%) en la tabla estadística: Total de datos Frecuencia absoluta Frecuencia relativa Frecuencia relativa porcentual -La suma de los porcent ajes es siempre 100. Para expresar este dato como porcentaje, multiplicamos la frecuencia relativa por 100 y decimos: El 23% de los alumnos encuestados prefiere helado de lúcuma. Tabla de distribución de frecuencias Variable Frecuencia Frecuencia % estadí sti ca absoluta relativa (hi ) (preferencias) ( i ) Vainilla 3 0,18 18 Fresa 3 0,18 18 Choc olate 2 0,12 12 Lúcuma 4 0,23 23 Coco 5 0,29 29 Total 17 1,00 100 AGRUP ACI ÓN DE DATOS OBS ERV ACION a) Determinación del recorrido R = X max – X min b) Determinación del número de intervalos K= 1 +3,322Log N c) Determinación de la amplitud C = R/k Un profesor de Educación Física midió, en centímetros, la estatura de 40 alumnos. Tras ordenarlos los resultados fueron: 147 157 165 148 158 165 149 158 166 159 158 168 Variable estatura (intervalo) 145 – 150 150 – 155 155 – 160 160 – 165 165 – 170 170 – 175 175 – 180 150 158 170 150 158 170 X i 151 159 170 151 159 171 152 160 173 153 162 173 Frecuencia absoluta ( i ) Total 4 8 10 6 4 6 2 n = 40 153 162 176 154 163 179 156 163 157 164 Frecuencia relativa (hi ) 0,10 0,10 0,20 0,25 0,10 0,15 0,05 1,00 PRACTICA 1) Elabora una tabla y encuentra las frecuencias absolutas y relativas, cada uno de los siguientes casos: a) Las edades en un grupo de niños son: 12; 14; 10; 13; 12; 11; 14; 10; 13. Edades. i hi % total b) Al lanzar un dado 30 vec es, se obtuvieron estos res ultados: 3; 5; 3; 2; 1; 1; 2; 3; 3; 4: 2; 6; 5; 3; 1; 4; 2; 5; 6; 6; 3; 3; 3; 5; 2; 3; 6; 2; 5; 3. VALORES hi % i total 2) La tabla muestra el número de autos vendidos por una empresa el segundo semestre del año 2000. Mes Jul Ago Set Oct Nov Dic Total I 60 86 78 94 90 112 hi % a) Determina en qué mes se vendieron más carros. ¿A qué porcentaje corresponde? b) Halla las frecuencias relativas y sin efectuar la operación, di cuál será la suma total de las frecuencias relativas. c) Determina cuánt os carros se vendieron en Agosto y cuántos en Setiembre. d) ¿Cuántos carros se vendieron ent re Julio y Setiembre? e) ¿Cuántos carros se vendieron en total? 3) Realiza esta encuesta en tu salón de clase y elabora la tabla estadística de distribución de frecuencias. 4) En una colecta entre 65 miembros de parroquia, los aportes en soles fueron: 45 46 47 40 40 40 41 42 49 48 57 58 59 60 56 56 56 57 62 62 55 55 54 53 52 50 49 50 51 55 49 50 50 62 62 64 69 69 70 68 55 64 66 64 67 84 81 84 42 56 una 49 61 86 68 61 a) Elige una amplitud de clase. b) Elabora la tabla de frecuencias. c) ¿Cuáles fueron los aportes más frecuent es? d) ¿Cuál fue el aport e total de la clase más frec uent e? e) Resulta la misma cantidad de aporte total si multiplicas la marca de clase más frecuente por su frecuencia absoluta. Explica el por qué. VALORES ENCUESTA MÚSICA FAVORITA Clase media i hi % Balada Rock Tecnocumbia Salsa música Balada Rock Tecnocumbia salsa i hi % total total REPRESENTACIONES GRÁFICAS Las representaciones gráficas permiten interpretar y analizar con mayor facilidad los datos obtenidos. GRÁFICO DE BARRAS Observa la tabla del margen con datos no agrupados de variable estadística cualitativa . Construiremos un gráfico de barras que nos permitirá una mejor lectura de las tablas de frecuencias. 45 60 89 69 60 45 60 88 69 45 Número de personas 50 40 30 20 10 0 Radio TV cine Teatro Medios de comunicación Para cada uno de los valores del eje de las abscisas, se traza un segmento perpendicular a dicho eje. A partir de este segmento, se construye la barra respectiva. Los valores del eje de las ordenadas determinan la altura de cada barra. Observa que sobre el eje de las ordenadas se ubican los valores de las frecuencias absolutas o relativas, y sobre el eje de las abscisas se ubican los valores de la variable. Una vez construido el gráfico de barras, podemos comparar las barras y responder preguntas como las siguientes: ¿Cuál es el medio de comunicación que más prefieren las personas? ¿Cuál es el medio de comunicación de menor preferencia? HISTOGRAMA Número de alumnos Si tenemos una tabla de distribución de frecuencias en la que los datos se representan agrupados por intervalos y queremos su representación gráfica usamos un histograma. Observa la tabla de estaturas, éstas están agrupadas en clas es de amplitud igual a 5. Su representación en un histograma será de este modo: 8 7 6 5 4 3 2 1 Fíjate que sobre el eje de las señalado los extremos de los intervalo está represent ado longitud. Sobre el eje de las ordenadas las frecuencias. abscisas hemos intervalos. Cada por la misma hemos señalado Debemos t ener en c uent a que cantidades iguales deben estar representadas por longitudes iguales. Sin embargo no es necesario que las escalas de los dos ejes, abscisas y ordenadas sean iguales. Mediante un histograma es fácil detectar los valores de la variable de mayor o menor frecuencia, o c omparar las frecuencias de varios valores. 150 155 160 165 170 175 Estatura Número de alumnos PICTOGRAMAS Se usan para representar variables cualitativos. Una figura o un dibujo sustituye a las barras. Sexo POLÍGONO DE FRECUENCIAS Observa al margen, tenemos una tabla de frecuencias donde se muestra el número de personas que asisten al cine Monumental durante una semana. Graficamos la tabla utilizando un polígono de frecuencias. Los puntos de las frec uencias absolutas se unen mediante segmentos, resultando una línea poligonal llamada polígono de frecuencias. Fíjate que la variable es cualitativa. N° de Asistentes 350 300 250 200 150 100 Día de la semana 50 L M Mi J V S D Un polígono de frec uencias es una línea que representa gráficamente una distribución de frecuencias. También podemos elaborar un polígono de frecuencias correspondiente a un histograma. Tomamos como ejemplo el histograma de la estatura de los alumnos: ESTATURA DE LOS ALUMNOS DE TERCER GRADO Número de alumnos Para elaborar el polígono hemos unido mediante segmentos los punt os medios de las bases superiores de cada uno de los rectángulos, que corresponden a las marcas de clase de cada int ervalo. Observa que en este caso, la variable es cuantitativa continua. 20% Estatura GRÁFICO DE SECTORES Observa cómo se elabora un gráfico de sectores, a partir de la tabla del margen, que corresponde a una encuesta hecha a 100 alumnos sobre el medio de t ransporte que usan para llegar al colegio. Para representar estos datos en un gráfico se reparten los 360 grados del círculo en partes proporcionales con la ayuda de la regla de tres. Bus escolar 40% 144° 54° Automóvil 15% 72° 90° Bicicleta Bus urbano Número de alumnos 100 40 15 25% Grados Sexagesimales 360° 40 360 x 144 100 15 360 x 54 100 En el c írculo, hemos trazado cuatro sectores circulares de 144°, 54°, 90° y 72°, que corresponden a las cuatro alternativas: bus escolar, automóvil, bus urbano y bicicleta, respectivamente. b) ¿Cuántos alumnos participaron de la prueba? EJERCI CIOS PARA LA CLAS E 1. Elabora un gráfico de barras representar esta información. Edades de Secundaria. 15 15 15 15 14 15 13 15 14 16 17 15 14 15 15 50 15 16 15 16 15 alumnos 15 14 15 14 16 13 15 14 17 15 de 15 14 15 16 17 15 15 15 16 15 para 4ro. de 14 13 16 16 14 14 16 15 13 15 Variable: Puntaje 300 – 350 250 – 300 200 – 205 150 – 200 100 – 150 50 – 100 0 – 50 i hi % 5 2 7 4 8 2 2 a) ¿Cuál es la frecuencia más alta? b) ¿Qué porc entaje repres entan los de menos edad? c) ¿Qué porcentaje representan los de 15 años? VALORES i hi % total 3. En los últimos Juegos Olímpicos realizados en Atenas 2004, estos países obt uvieron el mayor número de medallas. N° DE MEDALLAS OBTENI DAS POR PAÍSES – ATENAS 2004 País Total Oro Plata Bronce EE.UU. 96 41 30 25 Rusia 62 26 21 15 Alemania 60 19 17 24 China 49 16 21 12 Representa estos resultados en un gráfico de barras. 2. Construye un histograma usando la información de la tabla sobre las puntuaciones obt enidas en una prueba de aptitud académica de un grupo de alumnos. Además: a) Elabora la t abla de frecuencias relativas y porcentuales. 4. En un c olegio se ha realizado una encuesta sobre algunos talleres que los estudiantes desearían tomar. Este fue el resultado: i 18 22 Talleres Franc és Medios de comunicación Programación Astronomía Electrónica Teatro y danzas Ingles hi % 25 27 48 60 12 5. En una encuesta a alumnos de un colegio se les preguntó sobre sus deportes favoritos y se obtuvieron los siguientes resultados: Deportes (hi ) % ( i ) Fútbol 64 Voleibol 56 Básquetbol 44 Natación 50 Atletismo 16 Ping Pong 20 a) ¿Completa la tabla de frecuencias? b) Elabora el gráfico de sectores. a) Elabora la tabla de frecuencias. b) ¿Cuántos alumnos fueron encuestados? c) Construye el diagrama de barras. d) Si el colegio ofreciera cuatro talleres, ¿cuáles deberían ser? ¿Por qué? MEDIDAS DE TENDENCIA CENTRAL MEDIA ARITMÉTICA ( x) Observa cómo calculamos la media aritmética con datos agrupados. Variable estadí stica Estatura (cm) 145 – 150 150 – 155 155 – 160 160 – 165 165 – 170 170 – 175 175 – 180 Frecuencia absoluta ( i ) 4 8 10 6 4 6 2 40 Marca de clase x m = (a + b)/2 147.5 152.5 157.5 162.5 167.5 172.5 177.5 x m . i 590 1220 1575 975 670 1035 355 = 6420 En este caso, debemos obtener la marca de clase (x m ) como valor representativo. Cada marca de clase se multiplica por su frec uencia absolut a y la suma de estos productos se divide entre el total de datos: x x m n i 6420 160.5 40 La estatura media de los alumnos de esta sección es 160,5 cm. La media aritmética es una medida estadística que es igual al c ociente de la suma de los productos de cada variable por su frecuencia absolut a entre el total de frec uencias. MEDIANA (Me) Observa cómo calculamos la mediana con datos agrupados. Hallamos la mediana de las estaturas de los alumnos de la sección mostradas en la tabla anterior. Y Fi 40 Número de alumnos 35 30 25 20 15 10 5 X 145 150 155 160 165 170 175 Estaturas Me Sobre el eje X llevamos los intervalos y sobre el eje Y, las frecuencias absolutas acumuladas. Trazamos los rectángulos cuyas alturas corresponden a las frec uencias absolutas acumuladas. Unimos extremos superiores derechos de cada rectángulo obteniendo el polígono de frecuencias acumuladas. Ubicamos n/2 en la columna Y: 40/2 = 20. Trazamos una horizontal y en el punto de corte con el polígono bajamos la perpendicular. La mediana de las es taturas de los alumnos se encuent ra en el intervalo [155-160[. La mediana de un conjunto ordenado de datos es el valor que deja igual cantidad de datos por encima y por debajo de él. MODA (Mo) Observamos en la tabla la distribución de frecuencias vista anteriormente, que el intervalo que tiene mayor frecuencia es [155 – 160[ Entonces, la moda se encuentra en el intervalo [155 – 160[ llamado intervalo modal. MEDIDAS DE DISPERSIÓN Cuando de una distribución conocemos los valores centrales ya tenemos una buena información de la tendencia central de los dat os. Sin embargo, los promedios no proporcionan una información completa de la distribución, como se obs erva en el siguiente ejemplo: Observa en el cuadro del margen las estaturas de los integrantes de dos equipos de básquet. La media aritmética de cada equipo es 165 cm, sin embargo: - Las estaturas de los jugadores del equipo 2 están más próximas a la media. Las estaturas de los jugadores del equipo 1 están más distantes de la media. Esto se expresa diciendo que las estaturas de los jugadores del equipo 1 tienen mayor dispersión que las estaturas de los jugadores del equipo 2. Para medir la mayor o menor dispersión de un conjunto de datos se utiliza el recorrido y las des viaciones. RECORRIDO, DESVI ACIONES En las estaturas del equipo 1, el rec orrido es 180 – 150 = 30. En las estaturas del equipo 2, el rec orrido es 168 – 162 = 6. Se llama recorrido a la diferencia ent re el dato mayor y el dato menor. ¿Cuál es la des viación de la estatura de c ada jugador del equipo 1 y del equipo 2 respecto a la media aritmética? La des viación de cada estatura respecto a la media es la diferencia entre esa estatura y la media (x i – x ). Equipo 1: 150 – 165 = –15; 152 – 165 = –13; 165 – 165 = 0; 178 – 165 = 13; 18 – 165 = 15 Equipo 2: 162 – 165 = –3; 163 – 165 = –2; 165 – 165 = 0; 167 – 165 = 2; 168 – 165 = 3 DESVIACIÓN MEDI A Des viación media es el promedio de todas las des viaciones. Para evitar que la suma salga cero se utilizan los valores absolutos. Hallamos la des viación media (DM) de ambos equipos. Al igual que en el recorrido, cuanto mayor es la des viación media, mayor es la dispersión de los datos. Equipo 1: DM = |–15| + |–13| + |0| + |13| + |15| = 11,2 5 Equipo 2: DM = |–3| + |–2| + |0| + |2| + |3| = 2 5 Des viación media es el cociente de la suma de los valores absolut os de las des viaciones entre el total de frecuencias. VARI ANZA Y DESVIACIÓN TÍPICA Para hallar la varianza de las estaturas de cada equipo, calculamos el cociente entre la suma de los cuadrados de las des viaciones y el número de datos: Equipo 1: V 788 157,6 5 Equipo 2: V 26 5,2 5 Para hallar la des viación t ípica o des viación estándar, extraemos la raíz cuadrada al valor de la varianza. Equipo 1: D.S. = 157,6 12,55 Equipo 2: 5,2 2,28 EJERCI CIOS PROP UESTOS 1) Ordena estos datos y halla su recorrido 47; 54; 35; 71; 35; 50; 39; 79; 52; 45. 2) Al preguntar a diez conductores cuánt os galones de gasolina consume su carro en carret era por cada 400 km, éstas fueron sus respuestas: 8; 9; 10; 8; 6; 9; 5; 7; 7; 7. a) Encuentra el promedio o media aritmética. b) La mediana. c) La moda 3) Las últimas calificaciones de Enrique fueron: 14; 11; 15; 09; 17; 12; 13; 15. Usa la calculadora y halla: a) La media aritmética. b) La varianza. c) La des viación estándar. 4) Un comerciante realizó una encuesta para saber qué tallas de pant alones debe tener en su tienda. Los resultados fueron: Tallas i 30 2 31 2 32 3 33 5 34 6 35 8 36 14 37 11 38 9 Encuentra: a) La mediana. b) La moda. 5) Los siguient es son los sueldos de los empleados de una empresa: Un director: $ 600. Un subdirector: $ 500. Cuadro secretarias: $ 360 cada una. Dos auxiliares: $ 220 cada uno. Dieciséis empleados: $ 420 cada uno. Un administrador: $ 480. Hallar: a) El recorrido y las des viaciones. b) La media aritmética. c) La des viación estándar. 6) La tabla representa los pesos de un grupo de niños. Halla la varianza. 35 – 40 30 Peso (Kg) i 40 – 45 4 45 – 50 5 50 – 55 8 7) El diagrama de barras representa la cantidad de videos observados por un cierto número de personas al mes. Y 70 69 N° de personas 60 50 40 30 30 27 15 20 6 10 3 X 3 4 5 6 7 8 N° de videos Elabora la tabla de frecuencias y halla: a) b) c) d) ¿Cuántas personas forman esta muestra? ¿Cuál es el promedio de videos vistos? ¿Cuál es la mediana? Y, ¿cuál es la moda? ¿Cuál es la des viación media? i hi %