estimación de la media por intervalos de confianza

Anuncio
Estimación de la media poblacional mediante intervalos de confianza.
El objetivo de este apartado es conseguir una estimación de la media  (desconocida) de una
población, cuya desviación típica  es conocida.
Para ello se recurre a una muestra de tamaño n, para la que se obtiene su media, x .
Nota: Sabemos que las medias muestrales se distribuyen según una normal (siempre que la
población de partida lo sea, ó aún no siéndolo, siempre que n30).
Definición: Decimos que el intervalo centrado en x , [ x -L, x +L] es un intervalo de confianza
de  con un nivel de confianza del 95%, (p.e.), si P( x  L  X    x  L)  0,95 .
Nota: Podemos hablar de un 95% de nivel de confianza, ó alternativamente, de un 5% (100-95)
de nivel de significación.
Ejemplo 1: Deseamos valorar el grado de conocimientos en Historia de una población de
varios miles de alumnos. Sabemos, por estudios anteriores, que la desviación típica
poblacional es  =2,3. Nos proponemos estimar  pasando una prueba a 100 alumnos. La
media de esta muestra de 100 alumnos ha resultado ser x =6,32.
Halla el intervalo de confianza de  con un nivel de confianza del 95%.
Solución:
2,3 

Puesto que n=100, sabemos que X  N   ,
  N   , 0,23 .
100 

6,32  L   X   6,32  L  
P(6,32  L  X  6,32  L)  0,95  P(
0, 23

0, 23

0, 23
)  0,95
L
L
L
L
Z
)  0,95 (donde Z  N (0,1))  P( Z 
)  0,975 
 1,96 (ver tabla)
0, 23
0, 23
0, 23
0, 23
 L  1,96  0, 23  0, 45 , con lo que el int ervalo de confianza para  , al 95%, y según esta muestra,
es [6,32  0, 45;6,32  0, 45]  [5,87;6,77]
 P(
Esto quiere decir, que aunque no sabemos el valor de  , “podemos asegurar que estará entre
5,87 y 6,77 con una probabilidad del 95%”.
Al radio del intervalo de confianza, L, se le llama error máximo admisible; en el ejemplo
anterior es L=0,45.
Notas:
Para un tamaño muestral fijado, podemos rebajar el error máximo admisible a costa de rebajar
el nivel de confianza.
Si lo que queremos es mantener fijo el nivel de confianza y rebajar el error, tendremos que
aumentar el tamaño de la muestra.
En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
Ejemplo 2: En el ejemplo anterior, y manteniendo el nivel de confianza en el 95%, ¿cuál ha de
ser el tamaño de la muestra para que el error máximo admisible sea L=0,20?
Solución:
 2,3 
Si el intervalo de confianza ha de ser [ x -0,20, x +0,20], entonces, como X  N   ,
,
n


0, 20
 0, 20
P ( x  0, 20  X  x  0, 20)  0, 95  P 
Z
2, 3
2, 3

n
n


0, 20

 P Z 
2, 3

n




  0, 95



0, 20

 1, 96 (ver tabla )
  0, 975  2, 3

n

0, 20  n
 1, 96 
2, 3
n
1, 96  2, 3
 2, 54  n  508
0, 20
Ejemplo 3: Queremos saber la media de km recorridos por los taxistas de cierta población.
Sabemos por estudios anteriores que  = 2.250 km. Para ello, elegimos una muestra de 100
taxistas y obtenemos una media muestral x =15.200 km.
a) Determina el intervalo de confianza al 99% para  .
b) ¿Cuál ha de ser el tamaño mínimo de la muestra para que el error no supere los 500
km con la misma confianza del 99%?
Solución:
 2.250 
Puesto que n=100 (30), sabemos que X  N   ,
  N   , 225 .
100 

a) P(15.200  L  X  15.200  L)  0,99  P(
L
L
Z
)  0,99
225
225
L
L
)  0,995 
 2,575 (ver tabla)  L  579,
225
225
con lo que el int ervalo de confianza para  , al 99%, y según esta muestra, es [14.621;15.779]
 P( Z 
 2.250 
b) Si el I.C. ha de ser [ x -500, x +500], entonces, como X  N   ,
,
n 


500
500
P ( x  500  X  x  500)  0, 99  P 
Z
 2.250
2250

n
n


  0, 99



500 n
500 n
)  0, 995 
 2, 575 (ver tabla )
2.250
2.250
2, 575  2.250
n
 11, 59  n  134, 32  n  135
500
P( Z 

En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
Ejemplo 4: De una población Normal de media desconocida y desviación típica  = 6, se
extrae la siguiente muestra: 82, 78, 90, 89, 92, 85, 79, 63, 71.
c) Determina el intervalo de confianza al 98% para  .
d) Determina el tamaño muestral para que, con la misma confianza, el intervalo de
confianza tenga una amplitud igual a 4,66.
Solución:
a) Como la población de partida es Normal, independientemente de cual sea el tamaño de la
6 

muestra (en este caso, n=9), sabemos que X  N   ,
  N   , 2 .
9

La media de la muestra resulta ser x =81. Ha de suceder que
P ( x  L  X  x  L )  0, 98  P (81  L  X  81  L )  0, 98
81  L  81 
L
 81  L  81
 L
 P
Z 
 Z    0, 98
  0, 98  P 
2
2
2


 2
L
L

 P  Z    0, 99 
 2, 33 (ver tabla )  L  4, 66
2
2

 el int ervalo pedido es [81- 4, 66 ; 81  4, 66]  [76, 34 ; 85, 66]
4,66
6 

b) Ahora X  N   ,
 y L  2  2,33 . Hemos de determinar n para que
n


L
L
P
Z 
 6
6

n
n

P( Z 
L
n
6


L
  0, 98  P  Z 


6


n


)  0, 99  P ( Z 

  0, 98 



2, 33· n
)  0, 99 
6
2, 33· n
 2, 33 (ver tabla ) 
6
n  6  n  36
Nota: Para el mismo nivel de confianza, si queremos que el intervalo de confianza sea el doble
de estrecho (rebajar el error hasta la mitad), hemos de tomar un tamaño muestral 4 veces
mayor.
En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
Ejemplo 5: Un fabricante de pilas alcalinas sabe que la duración (horas) de estas sigue una
Normal de media desconocida y varianza  2 =3.600 h.
Con una muestra de su producción, elegida al azar, y un nivel de confianza del 95 %, ha
obtenido, para  , el intervalo de confianza [372,6 ; 392,2].
e) ¿Cuál fue el valor que obtuvo para la media de la muestra? ¿Cuál fue el tamaño
muestral utilizado?
f) ¿Cuál sería el error (L) de su estimación, si hubiese utilizado una muestra de
tamaño 225 y un nivel de confianza del 86,9%?
Solución:
a) Sabemos que x es el centro del intervalo [372,6 ; 392,2], o sea, x =382,4 h.
Como la población de partida es Normal, independientemente de cual sea el tamaño de la
 60 
muestra, sabemos que X  N   ,
 . (Cuidado:   3.600  60 )
n

392, 2  382, 4 
 372, 6  382, 4
P (372, 6  X  392, 2)  0, 95  P 
Z
  0, 95 
n
n


9,8 
9,8

P Z 
=1,96 (ver tabla )  n  5  n  25
  0, 975 
n
n

60 

b) Si n=225, entonces, X  N   ,
  N ( , 4) .
225 

Para una confianza de 86,9%, ha de suceder que
L
L
 L

P
Z 
  0,869  P  Z 
  0, 9345
4
4
 4

L

=1,51 (ver tabla )  L  6, 04
4
En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
Práctica: Estimación de la media poblacional mediante intervalos de confianza.
En la práctica siguiente consideramos las estaturas de 100 personas (será nuestra población).
Como puede observarse en el histograma de frecuencias, se distribuyen casi normalmente.
xa
xb
xi
155 160 157,5
xi fi
xi2 fi
Fi
8
1260
198450
160 165 162,5 14
2275
369687,5
22
165 170 167,5 22
3685
617237,5
44
170 175 172,5 28
4830
833175
72
175 180 177,5 16
2840
504100
88
180 185 182,5
8
1460
266450
96
185 190 187,5
4
750
140625
100
100 17100
2929725
media
desviación típica

8
= 171
 = 7,50
Imaginaremos que  es desconocida y vamos a tratar de estimarla tomando muestras de tamaño 9
(podemos hacerlo con muestras de tamaño <30 únicamente si la población de partida es normal).
Vamos a generar 9 números aleatorios (entre 1 y 100)(*){55, 84, 45, 80, 53, 93, 01, 98, 67}.
Como tenemos los datos ordenados de menor a mayor, la muestra resultante es {172,5 ; 177,5 ; 172,5 ;
177,5 ; 172,5 ; 182,5 ; 157,5 ; 187,5 ; 172,5}, con lo que la media muestral correspondiente resulta ser
x =174,72. Vamos a construir, basándonos en esta muestra, un intervalo de confianza para  al 95%.
L
L
Z 
)  0,95
7,5 / 9
7,5 / 9
3L
3L
3L
3L
P(
Z
)  0,95  P( Z 
)  0,975 
 1,96 (ver tabla)
7,5
7,5
7,5
7,5
 L  4,9, con lo que el int ervalo de confianza para  , al 95%, y según esta muestra, es [169,82;179,62]
P ( x  L  X  x  L)  0,95  P (
Vamos a repetir el ejercicio con otra muestra (ahora la tomaremos mediante muestreo sistemático)(**).
Elegimos un primer individuo y los otros los tomamos de 11 en 11. {81, 92, 03, 14, 25, 36, 47, 58, 69}
con lo que resulta la muestra {177,5 ; 182,5 ; 157,5 ; 162,5 ; 167,5 ; 167,5 ; 172,5 ; 172,5 ; 172,5}.
Ahora es x =172,50 . Vamos a construir, basándonos en esta muestra, un intervalo de confianza para
 , ahora, al 90%.
L
L
Z 
)  0,90
7,5 / 9
7,5 / 9
3L
3L
3L
3L
P(
Z
)  0,90  P( Z 
)  0,95 
 1,645 (ver tabla)
7,5
7,5
7,5
7,5
 L  4,1, con lo que el int ervalo de confianza para  , al 90%, y según esta muestra, es [168, 4;176,6]
P( x  L  X  x  L)  0,90  P(
(*) El muestreo simple consiste en elegir a todos los individuos al azar.
(**) El muestreo sistemático consiste en determinar el paso k, entero más cercano a 100/9, en
este caso, k=11, elegir un primer individuo al azar, y el resto de k en k.
En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
TABLA DE NÚMEROS ALEATORIOS
Donald B. Owen, Handbook of Statistical Tables, Reading Mass:Addisson-Wesley, 1.962.
3690 2492 7171 7720 6509 7549 2330 5733 4730 0813 6790 6858 1489 2669 3743 1901
4971 8280 6477 5289 4092 4223 6454 7632 7577 2816 9002 0772 2160 7236 0812 4195
5589 0830 8261 9232 5692 9870 3583 8997 1533 6466 8830 7271 3809 2080 3828 7880
0586 8482 7811 6807 3309 2729 1039 3382 7600 1077 4455 8806 1822 1669 7501 7227
0104 4141 1521 9104 5563 1392 8238 4882 8506 6348 4612 8252 1062 1757 0964 2983
2244 5086 0303 7423 3298 3979 2831 2257 1508 7642 0092 1629 0377 3590 2209 4839
6332 1490 3092 0935 5565 2315 8030 7651 5189 0075 9353 1921 2605 3973 8204 4143
2677 0034 8601 3340 8383 7277 9889 0390 5579 4620 5650 0210 2082 4664 5484 3900
3485 0741 9069 5920 4326 7704 6525 6905 7127 5933 1137 7583 6450 5658 7678 3444
8387 5323 3753 1859 6043 0294 5110 6340 9137 4094 4957 0163 9717 4118 4276 9465
8820 4127 4951 3781 5101 1815 7068 6379 7252 1086 8919 9047 0199 5068 7447 1664
9278 1708 3625 2864 7274 9512 0074 6677 8676 0222 3335 1976 1645 9192 4011 0255
5458 6942 8043 6201 1587 0972 0554 1690 6333 1931 9433 2661 8690 2313 6999 9231
5627 1815 7171 8036 1832 2031 6298 6073 3995 9677 7765 3194 3222 4191 2734 4469
8617 2402 6250 9362 7373 4757 1716 1942 0417 5921 5295 7385 5474 2123 7035 9983
5192 1840 6176 5177 1191 2106 3351 5057 0967 4538 1246 3374 7315 3365 7203 1231
0546 6612 1038 1425 2709 5775 7517 8974 3961 2183 5295 3096 8536 9442 5500 2276
6307 2346 1285 7000 5306 0414 3383 3251 8902 8843 2112 8567 8131 8116 5270 5994
4675 1435 2192 0874 2897 0262 5092 5541 4014 3543 6130 4247 4859 2660 7852 9096
0578 0097 3521 8772 6612 0721 3899 2999 1263 7017 8057 5573 9396 3464 1702 9204
3389 5678 2589 0288 7478 7569 7551 3380 2152 5411 2647 7242 2800 3339 2854 9691
9562 3252 9848 6030 8472 2266 5505 8474 3167 8552 5409 1556 4247 4652 2953 6381
2086 5457 7703 2758 2963 8167 6712 9820
En C:/juanjo/apuntes/Inferencia Estadística/estimación de la media.doc
Descargar