2º BACHILLERATO – MATEMÁTICAS APLICADAS A LAS CIENCIAS SOCIALES II – TEMA 3.- ESTADÍSTICA DESCRIPTIVA PROFESOR: RAFAEL NÚÑEZ ----------------------------------------------------------------------------------------------------------------------------------------------------------------- 1.- Terminología estadística Estadística descriptiva Es la ciencia que estudia conjuntos de datos obtenidos de la realidad. Estos datos son interpretados mediante tablas, gráficas y otros parámetros como la media, moda, varianza, etc. Población Es el conjunto formado por todos los elementos que queremos estudiar. Por ejemplo, si vamos a estudiar el peso de los jóvenes de 16 años nacidos en España, la población sería precisamente el conjunto formado dichos jóvenes Variable estadística Es la característica que queremos estudiar de la población. Hay distintos tipos de variables estadísticas Cualitativa Si los valores son cualidades. Por ejemplo, partido político preferido, color del pelo, etc. Discreta Cuando los valores son aislados. Por ejemplo, nº de hermanos, edad, etc. Cuantitativa Si los valores son números. Por ejemplo, nº de Continua hermanos, estatura, peso, edad, temperatura, Cuando entre dos valores, aunque estén muy etc. próximos entre sí, siempre es posible tomar otro valor. Por ejemplo, la temperatura, el peso, etc. 2.- Tablas de frecuencias Los datos obtenidos en estadística se organizan en unas tablas, llamadas tablas de frecuencias. Tabla de frecuencias para datos aislados Ejemplo: Edades de un grupo de alumnos de alumnos xi fi Fi hi Hi 13 6 6 30% 30% 14 5 11 25% 55% 15 7 18 35% 90% 16 1 19 5% 95% 18 1 20 5% 100% Suma total 20 = n - 100% - Tabla de frecuencias para datos agrupados Ejemplo: Notas en un examen de un grupo fi Fi hi Hi Clases [2,3) 3 3 15% 15% [3,4) 2 5 10% 25% [4,5) 3 8 15% 40% [5,6) 5 13 25% 65% [6,7) 3 16 15% 80% [7,8) 4 20 20% 100% Total 20 = n - 100% - xi representa los valores que hay en los datos. En el caso de datos agrupados, las clases son los intervalos fi se llama frecuencia absoluta y representa las veces que aparece cada valor en los datos En el caso de datos agrupados, fi representa el nº de datos que hay en el intervalo o clase Fi es la frecuencia absoluta acumulada y se calcula sumando uno a uno los valores de la columna fi. hi se llama frecuencia relativa y se calcula dividiendo cada valor fi entre el nº total de datos y se expresa en % Hi es la frecuencia relativa acumulada y se calcula sumando uno a uno los valores de la columna hi. 3.- Gráficos estadísticos Diagrama de barras Se representan los valores xi en un eje horizontal y para cada valor xi se dibuja una barra cuya altura sea la frecuencia de xi que se quiera representar. Las barras deben ser de la misma anchura y debemos dibujarlas separadas. Uniendo los extremos superiores de las barras por su punto medio, se obtiene una línea quebrada llamada polígono de frecuencias Ejemplo: Número de hijos de un grupo de matrimonios xi fi 0 4 1 9 2 12 3 10 4 8 5 4 6 2 7 1 Total 50 = n El diagrama de barras se suele utilizar para variables discretas con “pocos” valores y para variables cualitativas Histograma Es similar al diagrama de barras, sólo que la base de cada barra es el intervalo de la tabla de frecuencias y por tanto no hay espacios entre las barras. Ejemplo: Notas de 20 alumnos en un examen: Uniendo los extremos superiores de las barras por su punto medio, se obtiene la línea quebrada llamada polígono de frecuencias. Los histogramas se utilizan cuando los datos los agrupamos en intervalos Página 2 Diagrama de sectores Para dibujar el diagrama de sectores se dibuja un círculo y se divide en tantos sectores (quesitos) como valores haya en los datos. Ejemplo: Deporte preferido por un grupo de 30 alumnos fi hi (en %) Ángulo del sector Deporte Baloncesto 12 40 40% de 360º = 144º Natación 3 10 10% de 360º = 36º Fútbol 9 30 30% de 360º = 108º Ninguno 6 20 20% de 360º = 72º Total 30 100% 360º El diagrama de sectores se suele utilizar para variables discretas con “pocos” valores y para variables cualitativas 4.- Parámetros estadísticos La media aritmética Es la suma de todos los datos dividida entre el número total de datos, n. (x i f i ) ( Se calcula con la fórmula x = significa suma) n x ) Notas en un examen de un grupo de amigos xi fi xifi 4 1 4 5 2 10 6 4 24 7 3 21 Total n = 10 59 fi x in ( Ejemplo: 59 5,9 10 Si los datos están agrupados en intervalos, se toma como x i el punto medio del intervalo, llamado marca de clase Ejemplo: ) x fi x in ( Gasto mensual en teléfono móvil de un grupo de jóvenes 239 11,95 € 20 Página 3 fi xifi Clases xi [10,11) 10,5 4 42 [11,12) 11,5 6 69 [12,13) 12,5 7 87,5 [13,14) 13,5 3 40,5 Total n = 20 239 El rango, la varianza, la desviación típica y el coeficiente de variación Ejemplo: Se pregunta a un grupo de hoteleros cuántas habitaciones tiene su hotel xi xi fi fi clases xi2fi [0,100) [100,200) [200,300) [300,400) [400,500) Total 50 150 250 350 450 20 50 60 30 40 n = 200 1 000 50 000 7 500 1 125 000 15 000 3 750 000 10 500 3 675 000 18 000 8 100 000 52 000 16 700 000 El rango: Es la diferencia entre el mayor y el menor valor de xi . En este caso, rango = 500 – 0 = 500 Se puede calcular con la fórmula: s 2 ) En este caso, como x fi xin ( La varianza (s2): x 2i .fi n x2 2 16 700 000 52000 2602 15 900 260 , sustituyendo: s 200 200 La desviación típica (s): Es la raíz cuadrada de la varianza. En este caso, s 15 900 126,0952 El coeficiente de variación (CV): Se puede calcular con la fórmula: CV En este caso, el coeficiente de variación es C.V. s x 126,0952 0,485 260 2.- Muestras estadísticas Una muestra es una parte de la población que elegimos para estudiar la población. El número de elementos de la muestra se llama tamaño de la muestra y el proceso de elección de una muestra se llama muestreo estadístico. Hay varios tipos de muestreo estadístico. Los más usados son: Muestreo aleatorio simple Consiste en tomar al azar unos pocos elementos de la población. Muestreo aleatorio estratificado con afijación proporcional Consiste en dividir la población en grupos, llamados estratos, y tomar aleatoriamente en cada estrato una muestra proporcional al nº de elementos del estrato. Suponiendo que la población la podemos dividir en 3 estratos (E 1,E2,E3), procedemos así: Se construye una tabla como la siguiente: E1 E2 E3 Total Estratos Nº de elementos de la muestra x y z n Nº de elementos de la población N1 N2 N3 N El número de elementos x , y , z deben ser proporcionales a N1 , N2 y N3 , luego x y z n N1 N2 N3 N Página 4 ACTIVIDADES 1 Se considera la población {2, 4, 6}. Escriba todas las posibles muestras de tamaño dos elegidas mediante muestreo aleatorio simple y determine la desviación típica de las medias muestrales. (Propuesto para selectividad 2013) 2 En un centro docente la tercera parte de los alumnos estudia el idioma A, la mitad el idioma B y el resto el idioma C (cada alumno estudia sólo uno de estos idiomas). a) Se desea seleccionar una muestra de 60 alumnos, mediante muestreo aleatorio estratificado con afijación proporcional al número de los alumnos de cada idioma. ¿Cómo debería estar conformada la muestra? b) En otra muestra seleccionada por el procedimiento anterior, el número de alumnos tomados del idioma A es 14. Determine cuántos se han elegido de los otros dos idiomas. (Propuesto para selectividad 2014) 3 Una población de 6000 personas se ha dividido en 3 estratos, uno con 1000 personas, otro con 3500 y otro con 1500. En esa población se ha realizado un muestreo estratificado con afijación proporcional, en el que se han elegido al azar 15 personas del tercer estrato. Determine el tamaño de la muestra total obtenida con este muestreo y su composición. (Propuesto para selectividad 2013) 4 Resuelva los siguientes apartados: a) Dada la población {7, 4, 1} , construya todas las muestras posibles de tamaño 2 que puedan formarse mediante muestreo aleatorio simple, y halle la varianza de las medias muestrales de todas esas muestras. (Propuesto para selectividad 2013) b) Determine todas las muestras de tamaño 2 que, mediante muestreo aleatorio simple, se pueden extraer del conjunto {6, 9, 12} y calcule la varianza de las medias de estas muestras. (Propuesto para selectividad 2014) c) A partir de una población de elementos 1, 2, 3, 4 se seleccionan, mediante muestreo aleatorio simple, todas las muestras de tamaño 2. Escriba dichas muestras y calcule la varianza de las medias muestrales. (Propuesto para selectividad 2012) d) Una empresa fabrica cuatro productos A, B, C y D, de los que elabora diariamente 40, 15, 25 y 120 unidades respectivamente. Si un día se quiere elaborar una muestra de 40 unidades con los productos fabricados, por muestreo aleatorio estratificado con afijación proporcional, ¿qué número de unidades de cada producto se debe elegir? (Propuesto para selectividad 2014) e) Una ciudad de 2000 habitantes está poblada por personas de pelo negro, rubio o castaño. Se ha seleccionado, mediante muestreo aleatorio estratificado con afijación proporcional, una muestra constituida por 28 personas de pelo negro, 32 de pelo rubio y 20 de pelo castaño. Determine cuál es la composición, según el color del pelo, de esa ciudad. (Propuesto para selectividad 2001) f) En una ciudad viven 400 hombres y 320 mujeres y se quiere seleccionar una muestra de tamaño 54 utilizando muestreo estratificado por sexos, con afijación proporcional, ¿cuál sería la composición de la muestra? (Propuesto para selectividad 2012) g) Una población de tamaño 1000 se ha dividido en 4 estratos de tamaño 150, 400, 250 y 200. Utilizando muestreo aleatorio estratificado con afijación proporcional se han seleccionado 10 individuos del tercer estrato, ¿cuál es el tamaño de la muestra? (Propuesto para selectividad 2011) Página 5