Soluciones de los ejercicios de Selectividad sobre Inferencia Estadística de Matemáticas Aplicadas a las Ciencias Sociales II Antonio Francisco Roldán López de Hierro * Convocatoria de 2007 Las siguientes páginas contienen las soluciones de los ejercicios propuestos para las pruebas de acceso a la Universidad en Andalucía de la asignatura Matemáticas aplicadas a las Ciencias Sociales II sobre Inferencia Estadística. Cada uno lleva un código como el siguiente: 20076-B-4, que signi…ca ejercicio 4 de la opción B del modelo 6 de la convocatoria de 2007. 1. Algunas notas sobre la resolución de los ejercicios de Inferencia Estadística La mayor parte de los ejercicios de Inferencia Estadística que se proponen en las pruebas de acceso a la Universidad son muy parecidos. Se basan en cuatro fórmulas que hay que conocer muy bien y saber cuándo se deben utilizar. Para la media poblacional Intervalo de con…anza Tamaño mínimo x n z =2 z p Para la proporción # n p^ 2 =2 n E0 z =2 r p^ (1 p^) n z 2 =2 p^ (1 " p^) E02 En cada una de éstas fórmulas se utiliza un valor crítico z =2 asociado a un cierto nivel de con…anza p (o, lo que es lo mismo, a un cierto nivel de signi…cación = 1 p). El cálculo de este * Profesor del I.E.S. Acci de Guadix (Granada) - http://www.ies-acci.com/antonioroldan/ 1 Selectividad Matemáticas Aplicadas a las Ciencias Sociales II valor es un proceso automático. Por eso, no lo vamos a explicar en cada ejercicio. Simplemente damos, en la siguiente tabla, los valores críticos asociados a los niveles de con…anza más usuales. p p+1 2 =1 z =2 2 90 % 92 % 93 % 95 % 96 % 97 % 98 % 99 % 990 5 % 00 95 00 96 00 965 00 975 00 98 00 985 00 99 00 995 00 9975 10 645 10 75 10 81 10 96 20 055 20 17 20 325 20 575 20 81 Únicamente en los ejercicios que hayan sido propuestos en las convocatorias de junio o septiembre escribiremos cómo deducir estos valores críticos (aunque, debemos observar que, para que un ejercicio esté completo, se debe explicar cómo obtener el correspondiente valor crítico e incluso hacer una …gura adecuada como la que presentaremos). 2. Ejercicios de Selectividad Ejercicio 1 (2007-1-A-4) [2] El salario de los trabajadores de una ciudad sigue una distribución Normal con desviación típica 15 euros. Se quiere calcular un intervalo de con…anza para el salario medio con un nivel de con…anza del 98 %. Determine cuál es el tamaño mínimo de la muestra que se necesitaría recoger para que el intervalo de con…anza tenga una amplitud, como máximo, de 6 euros. Solución : Sea X la variable aleatoria que mide el “salario (en euros) de un trabajador, elegido al azar”. Según indica el problema, de esta variable sabemos que X ,! N ( ; = 15), siendo la media desconocida. Para un nivel de con…anza p = 00 98, el valor crítico correspondiente es z =2 = 20 325. Si queremos que la amplitud máxima del intervalo de con…anza sea de 6 e, el error máximo admisible debe ser E0 = 3 e (¡cuidado, el problema indica la amplitud máxima y no el error máximo!) Por tanto, el tamaño mínimo n que debemos tomar en una muestra para tener un error inferior a 3 e veri…ca: n z =2 E0 2 = 20 325 15 3 2 1350 14: Esto signi…ca que, para obtener un error máximo de 3 e, al 99 % de con…anza, debemos tomar una muestra con, al menos, 136 trabajadores. Andalucía 2 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II Ejercicio 2 (2007-1-B-4) [2] En una encuesta representativa realizada a 1230 personas de una ciudad, se obtuvo como resultado que 654 de ellas van al cine los …nes de semana. Calcule un intervalo de con…anza, al 97 %, para la proporción de asistencia al cine los …nes de semana en dicha ciudad. Solución : La proporción muestral de personas que van al cine los …nes de semana, en una muestra de tamaño n = 1230, es de p^ = 654=1230 00 532. Al 97 % de con…anza, el valor crítico asociado es z =2 = 20 17. Dado que n 30, n p^ = 1230 00 532 = 654 5 y n (1 p^) = 0 0 1230 0 468 = 575 64 5, podemos utilizar la aproximación de De Moivre para obtener la fórmula de intervalo del con…anza para la proporción de personas que van al cine los …nes de semana en esa ciudad, que es: " # " # r r p^ (1 p^) 00 532 00 468 0 0 = 0 532 2 17 IC = p^ z =2 n 1230 i 00 532 00 031 h = i h 00 501 ; 00 563 : Esto signi…ca que, al 97 % de con…anza, la proporción de personas que van al cine los …nes de semana en esa ciudad está entre el 50’1 % y el 56’3 %. Ejercicio 3 (2007-2-A-4, Junio) En una muestra aleatoria de 256 individuos se ha obtenido una edad media de 170 4 años. Se sabe que la desviación típica de la población Normal de la que procede esa muestra es de 2 años. a) [1] Obtenga un intervalo de con…anza al 95 % para la edad media de la población. b) [1] ¿Cuál debe ser el tamaño mínimo de la muestra para que el correspondiente intervalo de con…anza, al 90 %, tenga de amplitud a lo sumo 00 5? Solución : (Apartado a) Sea X la variable aleatoria que mide la “edad de una persona, elegida al azar, de esa población”. De esta variable sabemos que X ,! N ( ; = 2), siendo la media desconocida. Se elige una muestra de tamaño n = 256, que arroja una media muestral de x = 170 4 años. Como la población de partida es Normal, el intervalo de con…anza solicitado es: IC = x z =2 p n : Para aplicar esta fórmula, es necesario calcular el valor crítico z =2 al nivel de con…anza del 95 % (o lo que es lo mismo, a un nivel de signi…cación = 5 % = 00 05). Para ello, recordamos que el número z =2 es el único número real que cumple que p Z > z =2 = =2 = 00 025, siendo Z una variable con distribución Normal estándar. Como disponemos de una tabla de colas a la izquierda, Andalucía 3 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II traducimos esta condición con el suceso opuesto, es decir, p Z z =2 = 1 00 025 = 00 975. Buscamos este valor en la tabla de la distribución Normal estándar, encontrando el valor crítico z =2 = 10 96. y 0'95 0'025 _z 0'025 z 0'025 0'025 x Z ,! N (0; 1) De esta forma, el intervalo de con…anza es: IC = = x z i =2 p n = 170 4 10 96 p h 170 155; 170 645 : 2 256 i = 170 4 00 245 h = Esto signi…ca que la edad media de la población está, al 90 % de con…anza, entre 170 155 y 170 645 años. (Apartado b) Por otro lado, para que la amplitud del intervalo de con…anza sea A = 00 5 años, su error máximo admitido será E = A=2 = 00 25 años. Razonando como antes pero ahora al 90 % de con…anza, buscamos en la tabla de la distribución Normal estándar el valor (1 + p) =2 = (1 + 00 9) =2 = 00 95, lo que nos proporciona el valor crítico z =2 = 10 645 (serían aceptables las aproximaciones por defecto 10 64 y por exceso 10 65, aunque nosotros hemos tomado un valor intermedio). Con estos datos, el tamaño mínimo que debemos tomar en una muestra es: n z =2 E 2 = 10 645 2 00 25 2 = 130 162 = 1730 19: Por tanto, deberá tomarse una muestra de, al menos, 174 individuos. Ejercicio 4 (2007-2-B-4, Junio) En una granja avícola se ha tomado una muestra aleatoria de 200 polluelos de pato, entre los cuales se encontraron 120 hembras. Andalucía 4 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II a) [1’5] Halle un intervalo de con…anza, con un nivel del 98 %, para la proporción de hembras entre estos polluelos. b) [0’5] Razone, a la vista del intervalo encontrado, si a ese nivel de con…anza puede admitirse que la verdadera proporción de hembras de pato en esa granja es 0;5. Solución : (Apartado a) Como hay 120 hembras en una muestra de tamaño n = 200, la proporción muestral de hembras entre los polluelos de pato es p^ = 120=200 = 00 6. Dado que n 30, n p^ = 200 00 6 = 120 5 y n (1 p^) = 200 00 4 = 80 5, podemos utilizar la aproximación de De Moivre para obtener la fórmula de intervalo del con…anza para la proporción poblacional de hembras, que es: " # r p^ (1 p^) : IC = p^ z =2 n Para aplicar esta fórmula, es necesario calcular el valor crítico z =2 al nivel de con…anza del 98 % (o lo que es lo mismo, a un nivel de signi…cación = 2 % = 00 02). Para ello, recordamos que el número z =2 es el único número real que cumple que p Z > z =2 = =2 = 00 01, siendo Z una variable con distribución Normal estándar. Como disponemos de una tabla de colas a la izquierda, traducimos esta condición con el suceso opuesto, es decir, p Z z =2 = 1 00 01 = 00 99. Buscamos este valor en la tabla de la distribución Normal estándar, encontrando el valor crítico z =2 = 20 325 (también serían aceptables las aproximaciones por defecto 20 32 y por exceso 20 33). y 0'98 0'01 _z 0'01 z 0'01 0'01 x Z ,! N (0; 1) De esta forma, el intervalo de con…anza es: # " # r p^ (1 p^) I:C: = p^ z =2 = 00 6 n i h = 00 52; 00 68 : 0 2 325 r 00 6 00 4 200 " i 00 6 00 08 h = Esto signi…ca que, al 98 % de con…anza, la proporción de hembras en toda la población está entre el 52 % y el 68 %. Andalucía 5 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II (Apartado b) Desde luego, a este nivel de con…anza, hemos de rechazar la a…rmación que establece que la proporción de hembras de pato en esa granja sea del 50 % ya que el número 00 5 no está dentro del intervalo de con…anza que hemos determinado. Ejercicio 5 (2007-3-A-4, Septiembre) Se sabe que las puntuaciones de un test siguen una ley Normal de media 36 y desviación típica 4’8. a) [1] Si se toma una muestra aleatoria de 16 individuos, ¿cuál es la probabilidad de que la media de esta muestra sea superior a 35 puntos? b) [1] ¿Qué porcentaje de muestras de tamaño 25 tiene una media comprendida entre 34 y 36? Solución : (Apartado a) Sea X la variable aleatoria que mide la puntuación obtenida en el test por una persona elegida al azar. De esta variable sabemos que X ,! N ( = 36; = 40 8). Llamemos X16 a la variable aleatoria que mide la media obtenida al tomar muestras independientes de tamaño 16. Entonces sabemos que: X16 ,! N ;p n 40 8 36; p 16 =N = N 36; 10 2 ; y tras tipi…car la variable aleatoria, Z= X16 36 ,! N (0; 1) : 10 2 Entonces la probabilidad de que la media de una muestra de tamaño 16 sea superior a 35 puntos es: p X16 > 35 = p = X16 36 35 36 > 0 12 10 2 =p Z> 00 83 = p Z mirando la tabla de la normal N (0; 1) = 00 83 = 00 7967. (Apartado b) Llamemos ahora X25 a la variable aleatoria que mide la media obtenida al tomar muestras independientes de tamaño 25. Razonando como antes, sabemos que: X25 ,! N ;p n =N 40 8 36; p 25 = N 36; 00 96 ) Z= X25 36 ,! N (0; 1) : 00 96 Entonces, el porcentaje de muestras de tamaño 25 que tiene una media muestral comprendida Andalucía 6 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II entre 34 y 36 es: p 34 < X25 < 36 = p X25 36 34 36 36 36 < < 0 0 0 96 0 96 00 96 = p 0 < Z < 20 08 = p Z = 00 9812 00 5 = 00 4812 = 20 08 =p p (Z 20 08 < Z < 0 = 0) = 480 12 %. Ejercicio 6 (2007-3-B-4, Septiembre) Se sabe que (450 13; 510 03) es un intervalo de con…anza, al 95 %, para la media de una variable aleatoria que sigue una distribución Normal con desviación típica 15. a) [0’5] ¿Cuál es el error cometido? b) [1’5] Calcule, con el mismo nivel de con…anza, el tamaño muestral mínimo necesario para que el error cometido no sea superior a 10 8. (Apartado a) Como el intervalo de con…anza para la media es (450 13; 510 03), la media muestral obtenida es el punto medio entre sus extremos: Solución : x= 450 13 + 510 03 = 480 08; 2 y el error máximo cometido al calcular el intervalo es la distancia entre la media y cualquiera de los extremos del intervalo de con…anza, es decir: E = 480 08 450 13 = 20 95: (Apartado b) Por otra parte, supongamos que queremos cometer un error máximo E E0 = 10 8 al p = 1 = 95 % de con…anza. Entonces el tamaño mínimo muestral n que se debe tomar debe cumplir: 2 z =2 n ; E0 donde = 15 es la desviación típica, E0 = 10 8 es el máximo error admisible y z =2 es el único número real que cumple que p Z > z =2 = =2 = 00 025, siendo Z una variable con distribución Normal estándar. Como disponemos de una tabla de colas a la izquierda, traducimos esta condición con el suceso complementario, es decir, p Z z =2 = 1 00 025 = 00 975. Buscamos este Andalucía 7 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II valor en la tabla de la distribución Normal estándar, encontrando el valor crítico z =2 = 10 96. y 0'95 0'025 _z 0'025 z 0'025 0'025 x Z ,! N (0; 1) Así, el tamaño mínimo muestral debe cumplir: z n =2 2 E0 2 10 96 15 10 8 = = 49 3 2 = 2401 9 2660 78; por lo que tomaremos una muestra de, al menos, 267 individuos. Ejercicio 7 (2007-4-A-4) En una Universidad se toma, al azar, una muestra de 400 alumnos y se observa que 160 de ellos han aprobado todas las asignaturas. (a) [1] Halle un intervalo de con…anza, al 97 %, para estimar el porcentaje de alumnos de esa Universidad que aprueban todas las asignaturas. (b) [1] A la vista del resultado anterior se pretende repetir la experiencia para conseguir que el error no sea superior a 0.04, con el mismo nivel de con…anza. ¿Cuántos alumnos, como mínimo, ha de tener la muestra? Solución : (Apartado a) La proporción muestral de alumnos que han aprobado todas las asignaturas, en una muestra de tamaño n = 400, es de p^ = 160=400 = 00 4. Al 97 % de con…anza, el valor crítico asociado es z =2 = 20 17. Dado que n 30, n p^ = 160 5 y n (1 p^) = 400 00 6 = 240 5, el intervalo del con…anza para la proporción de alumnos que han aprobado todas las asignaturas en esa Universidad es: " " # # r r 0 4 00 6 0 p^ (1 p^) = 00 4 20 17 IC = p^ z =2 40 n i Andalucía 00 4 00 168 h = i h 00 232 ; 00 568 : 8 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II Esto signi…ca que, al 97 % de con…anza, el porcentaje de alumnos de esa Universidad que aprueban todas las asignaturas está entre el 23’2 % y el 56’8 %. (Apartado b) Si el error máximo admisible se …ja en E0 = 00 04, entonces el tamaño muestral debe veri…car: z 2 =2 p^ (1 p^) 20 172 00 4 00 6 = n 7060 34: 00 042 E02 Esto signi…ca que para conseguir que el error sea inferior a 00 04, al 97 % de con…anza, debemos tomar una muestra aleatoria de, al menos, 707 alumnos. Ejercicio 8 (2007-4-B-4) [2] Para realizar una encuesta en un Instituto se selecciona, aleatoriamente, una muestra de 50 alumnos y se les pregunta si tienen reproductores de mp3, contestando a…rmativamente 20 de ellos. Calcule un intervalo de con…anza, al 96 %, para la proporción de alumnos que poseen reproductores de mp3 en la población total de alumnos del Instituto. Solución : La proporción muestral de alumnos que poseen un reproductor de MP3, en una muestra de tamaño n = 50, es de p^ = 20=50 = 00 4. Al 96 % de con…anza, el valor crítico asociado es z =2 = 20 055. Dado que n 30, n p^ = 20 5 y n (1 p^) = 50 00 6 = 30 5, el intervalo del con…anza para la proporción de alumnos que poseen un reproductor de MP3 es: " # " # r r p^ (1 p^) 00 4 00 6 0 0 = 0 4 2 17 IC = p^ z =2 n 50 i 00 4 00 15 h = i h 00 25 ; 00 55 : Esto signi…ca que, al 96 % de con…anza, el porcentaje de alumnos poseen un reproductor de MP3 está entre el 25 % y el 55 %. Ejercicio 9 (2007-5-A-4) Se ha lanzado al aire una moneda 200 veces y se ha obtenido cara en 120 ocasiones. (a) [1] Estime, mediante un intervalo de con…anza, al 90 %, la probabilidad de obtener cara. (b) [1] Se pretende repetir la experiencia para conseguir que el error cometido sea inferior a 0.03, con un nivel de con…anza del 97 %. ¿Cuál debe ser el tamaño mínimo de la muestra? Andalucía 9 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II Solución : (Apartado a) La proporción muestral de las caras que se han obtenido, en una muestra de tamaño n = 200, es de p^ = 120=200 = 00 6. Al 90 % de con…anza, el valor crítico asociado es z =2 = 10 645. Dado que n 30, n p^ = 120 5 y n (1 p^) = 200 00 4 = 80 5, el intervalo del con…anza para la proporción de caras es: " # " # r r 0 6 00 4 p^ (1 p^) 0 = 00 6 10 645 IC = p^ z =2 n 200 i 00 6 00 057 h = i h 00 543 ; 00 657 : Esto signi…ca que, al 90 % de con…anza, el porcentaje de caras que aparecerán al lanzar la moneda está entre el 54’3 % y el 65’7 %. (Apartado b) Si el error máximo admisible se …ja en E0 = 00 03, al 97 % de con…anza (con valor crítico asociado 20 17), el tamaño muestral n debe veri…car: n z 2 =2 p^ (1 E02 p^) = 20 172 00 6 00 4 00 032 12550 71: Esto signi…ca que para conseguir que el error sea inferior a 00 03, al 97 % de con…anza, debemos tomar una muestra aleatoria de, al menos, 1256 lanzamientos de la moneda. Ejercicio 10 (2007-5-B-4) Con los datos de una muestra aleatoria se estima que el porcentaje de hogares con conexión a Internet es del 30 %, con un error máximo de la estimación de 0.06 y un nivel de con…anza del 93 %. (a) [0’5] Obtenga el intervalo de con…anza, al 93 %, de la proporción de hogares con conexión a Internet. (b) [1’5] Calcule el tamaño mínimo de la muestra utilizada. Solución : p^ = 00 3. (Apartado a) La proporción muestral de hogares con conexión a Internet es de Como el error máximo que se ha cometido en la aproximación es r p^ (1 p^) E = z =2 = 00 06; n Andalucía 10 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II el intervalo de con…anza para la proporción de hogares con conexión a Internet en la población estudiada es: " # r i h i h p^ (1 p^) = p^ E = 00 3 00 06 = IC = p^ z =2 n i = h 00 24 ; 00 36 : (Apartado b) Al 93 % de con…anza, el valor crítico asociado es z máximo admisible es E0 = 00 06, el tamaño muestral n debe veri…car: z 2 =2 p^ (1 n p^) E02 = 10 812 00 3 00 7 00 062 =2 = 10 81. Si el error 1910 11: Esto signi…ca que para conseguir que el error sea inferior a 00 06, al 93 % de con…anza, debemos tomar una muestra aleatoria de, al menos, 192 hogares. Ejercicio 11 (2007-6-A-4) En una población una variable aleatoria sigue una ley Normal con desviación típica 8. Se ha elegido, al azar, una muestra de tamaño 100 y su media ha sido 67. (a) [1] Calcule el intervalo de con…anza, al 93 %, para la media de la población. (b) [1] ¿Cuántos datos, como mínimo, son necesarios para estimar, con un nivel de con…anza del 99 %, la media de la población con un error no superior a 2? Solución : (Apartado a) Sea X la variable aleatoria de la que sabemos que X ,! N ( ; = 8), siendo la media desconocida. Se toma una muestra de tamaño n = 100 cuya media resulta ser x = 67. A un nivel de con…anza p = 00 93, el correspondiente valor crítico es z =2 = 10 81. Por tanto, el intervalo de con…anza para la media poblacional es: IC = x z =2 p n = 67 10 81 p i = 67 8 100 10 448 Esto signi…ca que, al 93 % de con…anza, la media poblacional y 68’448. Andalucía 11 h = i h 650 552; 680 448 : está comprendida entre 65’552 Antonio Roldán Selectividad Matemáticas Aplicadas a las Ciencias Sociales II (Apartado b) Al nivel de con…anza p = 00 99, el correspondiente valor crítico es z =2 = 20 575. Si …jamos E0 = 2 como error máximo admisible, entonces la muestra debe tener un tamaño n que veri…que: 2 z =2 20 575 8 2 =n 1060 09; n E0 2 es decir, debemos tomar una muestra de, al menos, 107 individuos. Ejercicio 12 (2007-6-B-4) [2] Para estimar la proporción de estudiantes de una Universidad que está a favor de un aumento del importe de las becas, se entrevistó, aleatoriamente, a 500 estudiantes, de los cuales 465 respondieron a…rmativamente. Calcule el intervalo de con…anza, al 98 %, en el cual se hallará la proporción de la población universitaria que está a favor del aumento de la cuantía de las becas. Solución : La proporción muestral de estudiantes que está a favor de un aumento del importe de las becas, en una muestra de tamaño n = 500, es de p^ = 465=500 = 00 93. Al 98 % de con…anza, el valor crítico asociado es z =2 = 20 325. Dado que n 30, n p^ = 465 5 y n (1 p^) = 500 00 07 = 35 5, el intervalo del con…anza para la proporción de estudiantes de esa Universidad que está a favor de un aumento del importe de las becas es: " # " # r r p^ (1 p^) 00 93 00 07 0 0 = 0 93 2 325 IC = p^ z =2 n 500 i 00 93 00 0265 h = i h 00 9035 ; 00 9565 : Esto signi…ca que, al 98 % de con…anza, el porcentaje de estudiantes de esa Universidad que está a favor de un aumento del importe de las becas está entre el 90’35 % y el 95’65 %. Andalucía 12 Antonio Roldán