Estimación de la media poblacional mediante intervalos de confianza. El objetivo de este apartado es conseguir una estimación de la media (desconocida) de una población, cuya desviación típica es conocida. Para ello se recurre a una muestra de tamaño n, para la que se obtiene su media, x . Nota: Sabemos que las medias muestrales se distribuyen según una normal (siempre que la población de partida lo sea, ó aún no siéndolo, siempre que n30). Definición: Decimos que el intervalo centrado en x , [ x -L, x +L] es un intervalo de confianza de con un nivel de confianza del 95%, (p.e.), si P( x L X x L) 0,95 . Nota: Podemos hablar de un 95% de nivel de confianza, ó alternativamente, de un 5% (100-95) de nivel de significación. Ejemplo 1: Deseamos valorar el grado de conocimientos en Historia de una población de varios miles de alumnos. Sabemos, por estudios anteriores, que la desviación típica poblacional es =2,3. Nos proponemos estimar pasando una prueba a 100 alumnos. La media de esta muestra de 100 alumnos ha resultado ser x =6,32. Halla el intervalo de confianza de con un nivel de confianza del 95%. Solución: 2,3 Puesto que n=100, sabemos que X N , N , 0,23 . 100 6,32 L X 6,32 L P(6,32 L X 6,32 L) 0,95 P( 0, 23 0, 23 0, 23 ) 0,95 L L L L Z ) 0,95 (donde Z N (0,1)) P( Z ) 0,975 1,96 (ver tabla) 0, 23 0, 23 0, 23 0, 23 L 1,96 0, 23 0, 45 , con lo que el int ervalo de confianza para , al 95%, y según esta muestra, es [6,32 0, 45;6,32 0, 45] [5,87;6,77] P( Esto quiere decir, que aunque no sabemos el valor de , “podemos asegurar que estará entre 5,87 y 6,77 con una probabilidad del 95%”. Al radio del intervalo de confianza, L, se le llama error máximo admisible; en el ejemplo anterior es L=0,45. Notas: Para un tamaño muestral fijado, podemos rebajar el error máximo admisible a costa de rebajar el nivel de confianza. Si lo que queremos es mantener fijo el nivel de confianza y rebajar el error, tendremos que aumentar el tamaño de la muestra. En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc Ejemplo 2: En el ejemplo anterior, y manteniendo el nivel de confianza en el 95%, ¿cuál ha de ser el tamaño de la muestra para que el error máximo admisible sea L=0,20? Solución: 2,3 Si el intervalo de confianza ha de ser [ x -0,20, x +0,20], entonces, como X N , , n 0, 20 0, 20 P ( x 0, 20 X x 0, 20) 0, 95 P Z 2, 3 2, 3 n n 0, 20 P Z 2, 3 n 0, 95 0, 20 1, 96 (ver tabla ) 0, 975 2, 3 n 0, 20 n 1, 96 2, 3 n 1, 96 2, 3 2, 54 n 508 0, 20 Ejemplo 3: Queremos saber la media de km recorridos por los taxistas de cierta población. Sabemos por estudios anteriores que = 2.250 km. Para ello, elegimos una muestra de 100 taxistas y obtenemos una media muestral x =15.200 km. a) Determina el intervalo de confianza al 99% para . b) ¿Cuál ha de ser el tamaño mínimo de la muestra para que el error no supere los 500 km con la misma confianza del 99%? Solución: 2.250 Puesto que n=100 (30), sabemos que X N , N , 225 . 100 a) P(15.200 L X 15.200 L) 0,99 P( L L Z ) 0,99 225 225 L L ) 0,995 2,575 (ver tabla) L 579, 225 225 con lo que el int ervalo de confianza para , al 99%, y según esta muestra, es [14.621;15.779] P( Z 2.250 b) Si el I.C. ha de ser [ x -500, x +500], entonces, como X N , , n 500 500 P ( x 500 X x 500) 0, 99 P Z 2.250 2250 n n 0, 99 500 n 500 n ) 0, 995 2, 575 (ver tabla ) 2.250 2.250 2, 575 2.250 n 11, 59 n 134, 32 n 135 500 P( Z En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc Ejemplo 4: De una población Normal de media desconocida y desviación típica = 6, se extrae la siguiente muestra: 82, 78, 90, 89, 92, 85, 79, 63, 71. c) Determina el intervalo de confianza al 98% para . d) Determina el tamaño muestral para que, con la misma confianza, el intervalo de confianza tenga una amplitud igual a 4,66. Solución: a) Como la población de partida es Normal, independientemente de cual sea el tamaño de la 6 muestra (en este caso, n=9), sabemos que X N , N , 2 . 9 La media de la muestra resulta ser x =81. Ha de suceder que P ( x L X x L ) 0, 98 P (81 L X 81 L ) 0, 98 81 L 81 L 81 L 81 L P Z Z 0, 98 0, 98 P 2 2 2 2 L L P Z 0, 99 2, 33 (ver tabla ) L 4, 66 2 2 el int ervalo pedido es [81- 4, 66 ; 81 4, 66] [76, 34 ; 85, 66] 4,66 6 b) Ahora X N , y L 2 2,33 . Hemos de determinar n para que n L L P Z 6 6 n n P( Z L n 6 L 0, 98 P Z 6 n ) 0, 99 P ( Z 0, 98 2, 33· n ) 0, 99 6 2, 33· n 2, 33 (ver tabla ) 6 n 6 n 36 Nota: Para el mismo nivel de confianza, si queremos que el intervalo de confianza sea el doble de estrecho (rebajar el error hasta la mitad), hemos de tomar un tamaño muestral 4 veces mayor. En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc Ejemplo 5: Un fabricante de pilas alcalinas sabe que la duración (horas) de estas sigue una Normal de media desconocida y varianza 2 =3.600 h. Con una muestra de su producción, elegida al azar, y un nivel de confianza del 95 %, ha obtenido, para , el intervalo de confianza [372,6 ; 392,2]. e) ¿Cuál fue el valor que obtuvo para la media de la muestra? ¿Cuál fue el tamaño muestral utilizado? f) ¿Cuál sería el error (L) de su estimación, si hubiese utilizado una muestra de tamaño 225 y un nivel de confianza del 86,9%? Solución: a) Sabemos que x es el centro del intervalo [372,6 ; 392,2], o sea, x =382,4 h. Como la población de partida es Normal, independientemente de cual sea el tamaño de la 60 muestra, sabemos que X N , . (Cuidado: 3.600 60 ) n 392, 2 382, 4 372, 6 382, 4 P (372, 6 X 392, 2) 0, 95 P Z 0, 95 n n 9,8 9,8 P Z =1,96 (ver tabla ) n 5 n 25 0, 975 n n 60 b) Si n=225, entonces, X N , N ( , 4) . 225 Para una confianza de 86,9%, ha de suceder que L L L P Z 0,869 P Z 0, 9345 4 4 4 L =1,51 (ver tabla ) L 6, 04 4 En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc Práctica: Estimación de la media poblacional mediante intervalos de confianza. En la práctica siguiente consideramos las estaturas de 100 personas (será nuestra población). Como puede observarse en el histograma de frecuencias, se distribuyen casi normalmente. xa xb xi 155 160 157,5 xi fi xi2 fi Fi 8 1260 198450 160 165 162,5 14 2275 369687,5 22 165 170 167,5 22 3685 617237,5 44 170 175 172,5 28 4830 833175 72 175 180 177,5 16 2840 504100 88 180 185 182,5 8 1460 266450 96 185 190 187,5 4 750 140625 100 100 17100 2929725 media desviación típica 8 = 171 = 7,50 Imaginaremos que es desconocida y vamos a tratar de estimarla tomando muestras de tamaño 9 (podemos hacerlo con muestras de tamaño <30 únicamente si la población de partida es normal). Vamos a generar 9 números aleatorios (entre 1 y 100)(*){55, 84, 45, 80, 53, 93, 01, 98, 67}. Como tenemos los datos ordenados de menor a mayor, la muestra resultante es {172,5 ; 177,5 ; 172,5 ; 177,5 ; 172,5 ; 182,5 ; 157,5 ; 187,5 ; 172,5}, con lo que la media muestral correspondiente resulta ser x =174,72. Vamos a construir, basándonos en esta muestra, un intervalo de confianza para al 95%. L L Z ) 0,95 7,5 / 9 7,5 / 9 3L 3L 3L 3L P( Z ) 0,95 P( Z ) 0,975 1,96 (ver tabla) 7,5 7,5 7,5 7,5 L 4,9, con lo que el int ervalo de confianza para , al 95%, y según esta muestra, es [169,82;179,62] P ( x L X x L) 0,95 P ( Vamos a repetir el ejercicio con otra muestra (ahora la tomaremos mediante muestreo sistemático)(**). Elegimos un primer individuo y los otros los tomamos de 11 en 11. {81, 92, 03, 14, 25, 36, 47, 58, 69} con lo que resulta la muestra {177,5 ; 182,5 ; 157,5 ; 162,5 ; 167,5 ; 167,5 ; 172,5 ; 172,5 ; 172,5}. Ahora es x =172,50 . Vamos a construir, basándonos en esta muestra, un intervalo de confianza para , ahora, al 90%. L L Z ) 0,90 7,5 / 9 7,5 / 9 3L 3L 3L 3L P( Z ) 0,90 P( Z ) 0,95 1,645 (ver tabla) 7,5 7,5 7,5 7,5 L 4,1, con lo que el int ervalo de confianza para , al 90%, y según esta muestra, es [168, 4;176,6] P( x L X x L) 0,90 P( (*) El muestreo simple consiste en elegir a todos los individuos al azar. (**) El muestreo sistemático consiste en determinar el paso k, entero más cercano a 100/9, en este caso, k=11, elegir un primer individuo al azar, y el resto de k en k. En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc TABLA DE NÚMEROS ALEATORIOS Donald B. Owen, Handbook of Statistical Tables, Reading Mass:Addisson-Wesley, 1.962. 3690 2492 7171 7720 6509 7549 2330 5733 4730 0813 6790 6858 1489 2669 3743 1901 4971 8280 6477 5289 4092 4223 6454 7632 7577 2816 9002 0772 2160 7236 0812 4195 5589 0830 8261 9232 5692 9870 3583 8997 1533 6466 8830 7271 3809 2080 3828 7880 0586 8482 7811 6807 3309 2729 1039 3382 7600 1077 4455 8806 1822 1669 7501 7227 0104 4141 1521 9104 5563 1392 8238 4882 8506 6348 4612 8252 1062 1757 0964 2983 2244 5086 0303 7423 3298 3979 2831 2257 1508 7642 0092 1629 0377 3590 2209 4839 6332 1490 3092 0935 5565 2315 8030 7651 5189 0075 9353 1921 2605 3973 8204 4143 2677 0034 8601 3340 8383 7277 9889 0390 5579 4620 5650 0210 2082 4664 5484 3900 3485 0741 9069 5920 4326 7704 6525 6905 7127 5933 1137 7583 6450 5658 7678 3444 8387 5323 3753 1859 6043 0294 5110 6340 9137 4094 4957 0163 9717 4118 4276 9465 8820 4127 4951 3781 5101 1815 7068 6379 7252 1086 8919 9047 0199 5068 7447 1664 9278 1708 3625 2864 7274 9512 0074 6677 8676 0222 3335 1976 1645 9192 4011 0255 5458 6942 8043 6201 1587 0972 0554 1690 6333 1931 9433 2661 8690 2313 6999 9231 5627 1815 7171 8036 1832 2031 6298 6073 3995 9677 7765 3194 3222 4191 2734 4469 8617 2402 6250 9362 7373 4757 1716 1942 0417 5921 5295 7385 5474 2123 7035 9983 5192 1840 6176 5177 1191 2106 3351 5057 0967 4538 1246 3374 7315 3365 7203 1231 0546 6612 1038 1425 2709 5775 7517 8974 3961 2183 5295 3096 8536 9442 5500 2276 6307 2346 1285 7000 5306 0414 3383 3251 8902 8843 2112 8567 8131 8116 5270 5994 4675 1435 2192 0874 2897 0262 5092 5541 4014 3543 6130 4247 4859 2660 7852 9096 0578 0097 3521 8772 6612 0721 3899 2999 1263 7017 8057 5573 9396 3464 1702 9204 3389 5678 2589 0288 7478 7569 7551 3380 2152 5411 2647 7242 2800 3339 2854 9691 9562 3252 9848 6030 8472 2266 5505 8474 3167 8552 5409 1556 4247 4652 2953 6381 2086 5457 7703 2758 2963 8167 6712 9820 En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc