Estimación puntual y por intervalos

Anuncio
02/12/2011
Análisis de datos y gestión veterinaria
Estimación puntual y por intervalos
Departamento de Producción Animal – Facultad de Veterinaria
Universidad de Córdoba
Córdoba, 30 de Noviembre de 2011
Estimación puntual y por intervalos
Estimación puntual
Características de los estimadores
Estimación por intervalos
I.C. media
I.C. varianza
I.C. proporciones
I.C. diferencia de medias
I.C. diferencia de proporciones
Tamaño muestral
1
02/12/2011
Estimación puntual y por intervalos
n = 10.000
votantes
los estadísticos
N = ??
se
utilizan como
?? = millones de votantes
Inferencias.
Generalizaciones
a
partir de la muestra a
la población.
estimadores
de los
parámetros de
la población,
como la edad
media de los
votantes de la
población
calculamos
estadísticos,
como la edad
media de los
votantes de la
muestra
Estimación puntual y por intervalos
Si se calcula un intervalo en el que se tiene
n = al
10.000
elevada seguridad de que contiene
verdadero
parámetro,
se
trata votantes
de
estimaciónNpor
intervalos
= ??
?? = millones de votantes
Si se calcula un único valor
como estimador, se trata de
estimación puntual
2
02/12/2011
Estimación puntual
La presión arterial de un caballo fue medida 10 veces en una
clínica determinada:
10, 16, 5, 10, 12, 8, 4, 6, 5, 4
Hallar estimaciones puntuales para la media, varianza, desviación
típica, y la proporción para los que la presión fue mayor que 8,5.
x=
1
80
xi =
=8
∑
n
10
sx2 =
sx = sx2 = 15, 78 = 3,97
1 
 782 − 10·82
xi2 − nx 2  =
= 15,78
∑

n −1 
9

pˆ x =
x 4
= = 0, 4
n 10
Estimación puntual
Población
Estimador
Estimación
Media
µX
X
x
Varianza
σ X2
S X2
sx2
Desv. típica
σX
SX
sx
Proporción
p
pˆ X
pˆ x
3
02/12/2011
Estimación puntual
Un estimador es insesgado si la media
de la distribución muestral es el parámetro
desconocido en la población.
()
E θˆ = θ
f(estimador)
0,4
Parámetro
0,3
0,2
0,1
0
-5
-3
-1
1
3
5
Estimador
Estimación puntual
Un estimador es insesgado si la media
de la distribución muestral es el parámetro
desconocido en la población.
()
E θˆ = θ
f(estimador)
0,4
Parámetro
0,3
0,2
0,1
0
-5
-3
-1
1
3
5
Estimador
4
02/12/2011
Estimación puntual
Un estimador es insesgado si la media
de la distribución muestral es el parámetro
desconocido en la población.
()
E θˆ = θ
E ( X ) = µX
E ( S X2 ) = σ X2
La desviación típica no es
un estimador insesgado
E ( pˆ X ) = p
Estimación puntual
Un estimador es más eficiente que otro
si su varianza es menor.
( )
( )
Var θˆ1 < Var θˆ2
Eficiencia relativa
( )
Var (θˆ )
Var θˆ2
1
5
02/12/2011
Estimación por intervalos
Para determinar la proporción
de
botellas
de
leche
defectuosas, el Dpto. de
Control de Calidad de una
empresa toma una muestra.
n = 100
10 botellas defectuosas
n = 1.000
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
Estimación por intervalos
Para determinar la proporción
de
botellas
de
leche
defectuosas, el Dpto. de
…pero…si n es 100 veces
superior,
¿no habrá
Control
de Calidad
de una
más confianza?...
empresa toma una muestra.
n = 100
n = 1.000
10 botellas defectuosas
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
6
02/12/2011
Estimación por intervalos
La estimación
puntual,
Para determinar la proporción
La
estimación
posiblemente,
de
botellaspuntual,
de más
leche
posiblemente,
coincide
defectuosas, el Dpto. de
coincide con la
Control
con ladeproporción
Calidad de una
proporción
empresa
toma una muestra.
poblacional
poblacional
n = 100
10 botellas defectuosas
n = 1.000
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
Estimación por intervalos
Para determinar la proporción
de
botellas
de
leche
defectuosas, el Dpto. de
…pero…si n es 100 veces
superior,
¿no habrá
Control
de Calidad
de una
más confianza?...
empresa toma una muestra.
n = 100
n = 1.000
10 botellas defectuosas
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
Con una “confianza” del
95%: 0,035 < p < 0,254
Con una “confianza” del
95%: 0,086 < p < 0,123
7
02/12/2011
Estimación por intervalos
Un estimador por intervalos de un
parámetro poblacional es un intervalo en el
que hay una probabilidad determinada de
encontrar dicho parámetro.
n = 100
10 botellas defectuosas
n = 1.000
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
Con una “confianza” del
95%: 0,035 < p < 0,254
Con una “confianza” del
95%: 0,086 < p < 0,123
Estimación por intervalos
Un estimador por intervalos de un
parámetro poblacional es un intervalo en el
que hay una probabilidad determinada de
encontrar dicho parámetro.
P ( A < θ < B) = 1−α
nivel de confianza del intervalo
1−α
n = 100
n = 1.000
10 botellas defectuosas
100 botellas defectuosas
pˆ x = 0,1
pˆ x = 0,1
Con una “confianza” del
95%: 0,035 < p < 0,254
Con una “confianza” del
95%: 0,086 < p < 0,123
8
02/12/2011
Estimación puntual y por intervalos
Estimación puntual
Características de los estimadores
Estimación por intervalos
I.C. media
I.C. varianza
I.C. proporciones
I.C. diferencia de medias
I.C. diferencia de proporciones
Tamaño muestral
I.C. para la media: población normal y
varianza poblacional conocida
X −µ
σ/ n
IC = 1 − α
0,4
0,3
fZ(z)
Z=
α
0,2
α
1−α
2
2
0,1
0
-5
-3
-1
1
3
5
Z
9
02/12/2011
I.C. para la media: población normal y
varianza poblacional conocida
Z=
X −µ
σ/ n
IC = 1 − α
1 − α = 0,9
α = 0,1
0,4
fZ(z)
0,3
0,2
5%
5%
90%
0,1
0
-5
-3
-1
1
3
5
Z
I.C. para la media: población normal y
varianza poblacional conocida
1 − α = 0,9
α = 0,1
µ
El 90% de los intervalos de confianza contendrán la media
poblacional
10
02/12/2011
I.C. para la media: población normal y
varianza poblacional conocida
X −µ
Z=
σ/ n
zα / 2 = z0,05
1 − α = 0,9
P ( Z < 1, 645 ) = Fz (1, 645) = 0,95
α = 0,1
P(−1,645 < Z < 1, 645) = 1 − P( Z > 1, 645) − P( Z < −1,645) = 1 − 0, 05 − 0, 05
0,4
fZ(z)
0,3
0,2
0,1
0
-5
-3
P ( Z < −1, 645) = 0, 05
-1
− z0,05
1
Z
z0,05
3
5
P ( Z > 1, 645) = 0, 05
I.C. para la media: población normal y
varianza poblacional conocida
P(−1,645 < Z < 1, 645) = 1 − P( Z > 1, 645) − P( Z < −1,645) = 1 − 0, 05 − 0, 05


X −µ
0,90 = P(−1, 645 < Z < 1, 645) = P  −1, 645 <
< 1, 645  =
/
n
σ


−1, 645σ 
 −1, 645σ
= P
< X −µ <
=
n
n 

−1, 645σ
−1, 645σ 

= P X −
<µ<X +

n
n 

x−
Intervalo de confianza del
100(1 − α )%
z α / 2σ
n
<µ<x+
P ( Z > zα / 2 ) =
z α / 2σ
n
α
2
11
02/12/2011
I.C. para la media: población normal y
varianza poblacional conocida
Una fábrica produce latas de sardinas. El peso de las latas sigue
una distribución normal, con desviación típica de 15 gr. El
contenido de una muestra de 25 latas pesa 100 gr de media.
Calcular un intervalo de confianza del 95% para el
verdadero peso medio de las latas de sardinas.
zα / 2 = z0,025
100(1-α)=95, por lo que α=0,05
z σ
z σ
x − α /2 < µ < x + α / 2
n
Fz ( z0,025 ) = 1, 96
100 −
n
1,96·1, 2
1,96·1, 2
< µ < 100 +
=
25
25
= 94,12 < µ < 105,88
I.C. para la media: población normal y
varianza poblacional conocida
La longitud del intervalo de confianza depende de:
1. El número de observaciones de la muestra lo disminuye
2. La varianza lo incrementa
3. La confianza del intervalo lo incrementa
12
02/12/2011
I.C. para la media: población normal y
varianza poblacional conocida
Si el tamaño muestral es grande,
- Se puede utilizar la varianza muestral como varianza
poblacional
- La población puede desviarse de la distribución normal
Intervalo de confianza del 100(1 − α )%
x−
zα / 2 sx
n
<µ<x+
P ( Z > zα / 2 ) =
zα / 2 sx
n
α
2
I.C. para la media: población normal y
varianza poblacional conocida
Se preguntó a 172 ganaderos sobre sus condiciones de trabajo en
una escala de 1 (muy malas) a 5 (muy buenas). La calificación
media fue de 3,28, con desviación típica de 0,70. Calcular un
intervalo de confianza del 99% para la media poblacional.
100(1-α)=99, por lo que α=0,01
zα / 2 = z0,005
Fz ( z0,005 ) = 2, 575
x−
zα /2σ
z σ
< µ < x + α /2
n
n
4,38 −
2,575·0, 70
2,575·0, 70
< µ < 4,38 +
=
172
172
= 4, 24 < µ < 4,52
13
02/12/2011
I.C. para la media: población normal y
varianza poblacional desconocida
Si el tamaño muestral es pequeño, se puede utilizar la
desviación típica muestral como desviación típica
poblacional.
t=
X −µ
sx / n
Esta variable aleatoria no sigue la
distribución normal estándar, sino la
distribución t de Student con (n – 1)
grados de libertad.
I.C. para la media: población normal y
varianza poblacional desconocida
Si el tamaño muestral es pequeño, se puede utilizar la
desviación típica muestral como desviación típica
poblacional.
0,4
f(t)
0,3
0,2
t=
X −µ
sx / n
Esta variable aleatoria no sigue la
0,1
distribución normal estándar, sino la
0
distribución
t de Student con (n – 1)
-7
-4
-1
2
5
8
grados de libertad.
t5
14
02/12/2011
I.C. para la media: población normal y
varianza poblacional desconocida
Si el tamaño muestral es pequeño, se puede utilizar la
desviación típica muestral como desviación típica
poblacional.
Intervalo de confianza del 100(1 − α )%
x−
tn −1,α /2 sx
n
<µ<x+
P (tn −1 > tn −1,α /2 ) =
tn −1,α / 2 sx
n
α
2
I.C. para la media: población normal y
varianza poblacional desconocida
Se estudió el porcentaje de incremento de censo ganadero (en
UGM) en 17 municipios andaluces, desde el año 2.000 a la
actualidad. La media muestral fue de 0,105 y la d.t. de 0,440.
Calcule un intervalo para la media del 95%, asumiendo la
distribución normal de la población.
100(1-α)=95, por lo que α=0,05
n – 1 = 16
x−
tn −1,α /2 sx
n
<µ<x+
tn −1,α / 2 sx
n
tn −1,α /2 = t16,0,025 = 2,120
0,105 −
2,120·0, 440
2,120·0, 440
< µ < 0,105 +
=
17
17
= −0,121 < µ < 0,331
15
02/12/2011
I.C. para proporciones de la población
(muestras grandes)
pˆ x − p
Z=
p (1 − p ) / n
Bastante fiable con n ≥ 40
Intervalo de confianza del 100(1 − α )%
pˆ x − zα /2
pˆ x (1 − pˆ x )
n
P ( Z > zα / 2 ) =
< p < pˆ x + zα / 2
pˆ x (1 − pˆ x )
n
α
2
I.C. para proporciones de la población
(muestras grandes)
A una muestra aleatoria de 142 clientes de una clínica veterinaria
se les preguntó por la calidad del servicio. 87 contestaron que
“bueno” o “muy bueno”. Calcule un intervalo de confianza del
95% para todos los clientes.
100(1-α)=95, por lo que α=0,05
zα / 2 = z0,025 = 1, 96
pˆ x − zα /2
pˆ x (1 − pˆ x )
< p < pˆ x + zα /2
n
0, 613 − 1,96
pˆ x (1 − pˆ x )
n
0, 613·0,387
0, 613·0,387
< p < 0, 613 + 1, 96
142
142
0,53 < p < 0, 693
16
02/12/2011
SiI.C.
la población
sigue una distribución
normal, este
para lanovarianza
de una población
procedimiento
es
muy
poco
fiable
normal
χ
=
2
n −1
(n − 1) sx2
σ2
f(chi-cuadrado)
0,1
0,08
α
0,06
2
α
0,04
1−α
0,02
2
0
0
χ v2,1−α /2
20 χ v2,α /2
10
30
40
chi-cuadrado
I.C. para la varianza de una población
normal
χ
2
n −1
=
(n − 1) sx2
σ2
Intervalo de confianza del 100(1 − α )%
(n − 1) sx2
χ n2−1,α /2
<σ2 <
(n − 1) sx2
χ n2−1,1−α /2
P ( χ n2−1 > χ n2−1,α /2 ) =
α
2
P ( χ n2−1 < χ n2−1,1−α /2 ) =
α
2
17
02/12/2011
I.C. para la varianza de una población
normal
Una muestra aleatoria de 15 pastillas para el dolor tiene una
desviación típica de 0,8% en la concentración del fármaco. Hallar
un I.C. del 90% para la varianza poblacional.
100(1-α)=90, por lo que α=0,10
χ
2
n −1,α / 2
=χ
χ
2
n −1,1−α /2
2
14,0,05
=χ
= 23, 68
2
14,0,95
= 6, 57
(n − 1) sx2
χ n2−1,α /2
<σ2 <
(n − 1) sx2
χ n2−1,1−α /2
14·0, 64
14·0, 64
<σ2 <
= 0,378 < σ 2 < 1,364
23, 68
6,57
I.C. media, varianza y proporciones
I.C. media (si la población no es normal, el error asumido es
pequeño)
Si la población es normal y la varianza
conocida, o si n es grande
Si la población es normal, la varianza
desconocida y n es pequeño
zα /2
tn −1,α /2
I.C. proporciones (fiable si n>40)
zα /2
I.C. varianza (si la población no es
χ n2−1,α / 2
normal, es poco fiable)
χ n2−1,1−α /2
18
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Un
ganadero
está
considerando el uso de
dos vacunas alternativas
y está interesado en la
diferencia
de
las
producciones
anuales
medias por oveja.
De la población con la vacuna A se extrae
una muestra aleatoria de ni individuos.
De la población con la vacuna B se extrae una
muestra aleatoria de nj individuos.
Se estudia la diferencia de medias de dos muestras independientes
extraídas aleatoriamente de poblaciones normales.
I.C. para la diferencia de medias de dos
poblaciones normales
Un veterinario está considerando la efectividad de un
programa de entrenamiento equino, interesado en la
velocidad de carrera.
De la población se extrae una muestra
aleatoria de n individuos.
Se estudia la diferencia de medias antes y después del
programa de entrenamiento en los mismos sujetos. Estos
sujetos constituyen una muestra, extraída aleatoriamente
de la población normal.
19
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
Se estudia la diferencia de medias de dos
muestras
independientes
extraídas
aleatoriamente de poblaciones normales.
Diferencia de medias con datos pareados
Se estudia la diferencia de medias antes y
después del tratamiento en los mismos
sujetos que constituyen una muestra,
extraída aleatoriamente de la población
normal.
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias con datos pareados
Se estudia la diferencia de medias antes y
después del tratamiento en los mismos
sujetos que constituyen una muestra,
extraída aleatoriamente de la población
normal.
20
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias con datos pareados
Un veterinario está considerando la efectividad de un
programa de entrenamiento equino para caballos, interesado
en la velocidad de carrera.
Se seleccionan 8 caballos para el programa de
entrenamiento. Se mide la velocidad antes y después del
programa de entrenamiento, que dura 8 semanas.
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias con datos pareados( µ x − µ y )
Si la distribución poblacional asumida es
normal, se plantea el cálculo de un intervalo de
confianza para la media poblacional
ii
11
22
33
44
55
66
77
88
caballo
caballopre
pre
xxi i
19,4
19,4
18,8
18,8
20,6
20,6
17,6
17,6
19,2
19,2
20,9
20,9
18,3
18,3
20,4
20,4
caballo
caballopost
post
yyi i
19,6
19,6
17,5
17,5
18,4
18,4
17,5
17,5
18
18
20
20
18,8
18,8
19,2
19,2
sumas
diferencias
di
xi2
-0,2
0,04
1,3
1,69
2,2
4,84
0,1
0,01
1,2
1,44
0,9
0,81
-0,5
0,25
1,2
1,44
21
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias con datos pareados
i
1
2
3
4
5
6
7
8
d=
caballo pre
xi
19,4
18,8
20,6
17,6
19,2
20,9
18,3
20,4
1 n
1
∑ d = 8·6, 2 = 0, 775
n i =1
caballo post
yi
19,6
17,5
18,4
17,5
18
20
18,8
19,2
sumas
diferencias
di
xi2
-0,2
0,04
1,3
1,69
2,2
4,84
0,1
0,01
1,2
1,44
0,9
0,81
-0,5
0,25
1,2
1,44
6,2
10,52
2
sd2 =
1  n 2
1

∑ di − nd 2  = 7·10,52 − 8·(0, 775)2  = 0,816
n − 1  i =1
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias con datos pareados
Intervalo de confianza del 100(1 − α )%
d−
tn −1,α / 2 sd
n
< µx − µ y < d +
P (tn −1 > tn −1,α /2 ) =
tn −1,α / 2 sd
n
α
2
22
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
Se estudia la diferencia de medias de dos
muestras
independientes
extraídas
aleatoriamente de poblaciones normales.
varianza conocida
o
tamaño muestral grande
varianzas poblacionales
son iguales
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
2 muestras aleatorias de 2 poblaciones independientes:
nx observaciones de una población con µ x y σ x2
ny observaciones de una población con µ y y σ y2
X e Y las medias muestrales
E ( X − Y ) = E ( X ) − E (Y ) = µ x − µ y
σ2
σ y2
Var ( X − Y ) = Var ( X ) + Var (Y ) = x +
nx n y
Como su distribución es
normal, la variable aleatoria
varianza conocidatamaño muestral
grande
Z=
( X −Y ) − (µ
σ x2
nx
+
x
− µy )
σ y2
ny
tiene una distribución normal estándar
23
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
varianza conocida o tamaño muestral grande
Intervalo de confianza del 100(1 − α )%
( x − y ) − zα /2
P ( Z > zα / 2 ) =
σ x2
nx
+
σ y2
ny
< µ x − µ y < ( x − y ) + zα /2
σ x2
nx
+
σ y2
ny
α
2
30 observaciones en cada muestra
son, en general, suficientes para
considerar “tamaño muestral grande”
I.C. para la diferencia de medias de dos
poblaciones normales
Para una muestra aleatoria de 96 cabras no vacunadas, el número
medio de días con mamitis fue de 2,15 y la d.t. muestral fue de
2,09 días al año. Para una muestra aleatoria independiente de 206
cabras vacunadas, el número de días con mamitis fue de 1,69, con
d.t. 1,91. Hallar un I.C. del 99% para la diferencia de
medias.
100(1-α)=99, por lo que α=0,01
( x − y ) − zα /2
zα /2 = z0,005 = 2,575
2
2
sx2 s y
s2 s
+
< µ x − µ y < ( x − y ) + zα / 2 x + y
nx n y
nx n y
2, 092 1,912
2, 09 2 1,912
+
< µ x − µ y < ( 2,15 − 1, 69 ) + 2,575
+
=
96
206
96
206
= −0,19 < µ x − µ y < 1,11
( 2,15 − 1, 69 ) − 2, 575
24
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
Se estudia la diferencia de medias de dos
muestras
independientes
extraídas
aleatoriamente de poblaciones normales.
varianza conocida
o
tamaño muestral grande
varianzas poblacionales
son iguales
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
Se estudia la diferencia de medias de dos
muestras
independientes
extraídas
aleatoriamente de poblaciones normales.
varianzas poblacionales
son iguales
25
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
2 muestras aleatorias de 2 poblaciones independientes:
nx observaciones de una población con µ x
n y observaciones de una población con µ y
µ común desconocida
Var ( X − Y ) = Var ( X ) + Var (Y ) =
 n + ny
=σ2  x
 nx n y

Z=
σ2
nx



( X −Y ) −(µ
x
+
σ2
ny
=
s =
2
( nx − 1) sx2 + ( ny − 1) s y2
(n
x
+ ny − 2 )
varianzas poblacionales
− Y )iguales
− ( µx − µ y )
( X son
t=
n + ny
s x
nx n y
− µy )
 nx + n y 

 nx ny 
σ 2 
I.C. para la diferencia de medias de dos
poblaciones normales
Diferencia de medias en muestras independientes
varianzas poblacionales son iguales
Intervalo de confianza del 100(1 − α )%
( x − y ) − tn +n −2,α /2 s
x
s =
2
nx + n y
y
nx n y
< µ x − µ y < ( x − y ) + tnx + ny − 2,α /2 s
nx + n y
nx n y
( nx − 1) sx2 + ( ny − 1) s y2
(n
x
+ ny − 2 )
P (tnx + ny −2 > tnx + ny − 2,α / 2 ) =
α
2
26
02/12/2011
I.C. para la diferencia de medias de dos
poblaciones normales
Se estudió el crecimiento anual de los ingresos de 6 clínicas
veterinarias que contaban con pajarería, siendo de media
9,972+7,470. La media de dicho crecimiento en otra muestra
aleatoria de 9 clínicas sin pajarería fue de 2,098+10,834.
Asumiendo normalidad en las poblaciones, hallar un I.C. del
90% para la diferencia de medias.
tnx + ny − 2,α /2 = t13,0,05 = 1, 771
100(1-α)=90, por lo que α=0,1
s2 =
( nx − 1) sx2 + ( n y − 1) s y2
nx + n y − 2
( x − y ) − tn + n −2,α / 2 s
x
y
=
nx + n y
nx n y
5·(7, 470) 2 + 8·(10,834) 2
= 93, 693
13
< µ x − µ y < ( x − y ) + tnx + ny − 2,α /2 s
( 9,972 − 2, 098 ) − 1, 771·9, 680
nx + n y
nx n y
6+9
6+9
< µ x − µ y < ( 9, 972 − 2, 098 ) + 1, 771·9, 680
=
54
54
= −1,161 < µ x − µ y < 16,909
I.C. para la diferencia entre dos
proporciones poblacionales
(muestras grandes)
Muestras grandes significa al menos 40 observaciones
E ( pˆ x − pˆ y ) = E ( pˆ x ) − E ( pˆ y ) = px − p y
Var ( pˆ x − pˆ y ) = Var ( pˆ x ) + Var ( pˆ y ) =
Z=
( pˆ
x
px (1 − px ) p y (1 − p y )
+
nx
ny
− pˆ y ) − ( px − p y )
pˆ x (1 − pˆ x ) pˆ y (1 − pˆ y )
+
nx
ny
27
02/12/2011
I.C. para la diferencia entre dos
proporciones poblacionales
(muestras grandes)
Muestras grandes significa al menos 40 observaciones
Intervalo de confianza del 100(1 − α )%
( pˆ
x
− pˆ y ) − zα /2
P ( Z > zα /2 ) =
pˆ x (1 − pˆ x )
nx
+
pˆ y (1 − pˆ y )
ny
< px − p y < ( pˆ x − pˆ y ) − zα / 2
pˆ x (1 − pˆ x )
nx
+
pˆ y (1 − pˆ y )
ny
α
2
I.C. para la diferencia entre dos
proporciones poblaciones
(muestras grandes)
Se extrajeron dos muestras aleatorias independientes de
estudiantes de veterinaria. De 120 hombres, 107 esperaban
trabajar como veterinarios en un máximo de 10 años. De 141
mujeres, 73 tenían la misma esperanza. Hallar un I.C. del 95%
para la diferencia de proporciones.
100(1-α)=95, por lo que α=0,05
( pˆ
x
− pˆ y ) − zα /2
pˆ x (1 − pˆ x ) pˆ y (1 − pˆ y )
+
< px − p y < ( pˆ x − pˆ y ) − zα / 2
nx
ny
zα /2 = z0,025 = 1,96
pˆ x (1 − pˆ x ) pˆ y (1 − pˆ y )
+
nx
ny
α
0,892·0,108 0,518·0, 482
0,892·0,108 0,518·0, 482
+
< pˆ x − pˆ y < ( 0,892 − 0,518 ) + 1,96
+
=
120
141
120
141
= 0, 275 < pˆ x − pˆ y < 0, 473
( 0,892 − 0,518) − 1,96
28
02/12/2011
I.C. diferencia de medias o proporciones
I.C. diferencia de medias
Población normal,
datos pareados
muestra
aleatoria,
tn −1,α /2
Población normal, muestras aleatorias e
independientes, varianza conocida o n>30
zα /2
Población normal, muestras aleatorias e
independientes, igualdad de varianzas
tnx + ny −2,α /2
I.C.
diferencia
(muestras
n>40)
aleatorias
de
proporciones
e
independientes,
zα /2
Tamaño de la muestra
Proporción poblacional
Varianza conocida
Varianza desconocida
29
02/12/2011
Tamaño de la muestra
Proporción poblacional
Intervalo de confianza del 100(1 − α )%
pˆ x − zα /2
pˆ x (1 − pˆ x )
< p < pˆ x + zα /2
n
L = zα /2
pˆ x (1 − pˆ x )
n
L* = zα /2
0, 25 0,5 zα /2
=
n
n
pˆ x (1 − pˆ x )
n
pˆ x (1 − pˆ x ) ≤ 0, 25
Tamaño de la muestra
Proporción poblacional
Intervalo de confianza del 100(1 − α )%
0, 25zα2 /2
n=
L2*
30
02/12/2011
Tamaño de la muestra
Proporción poblacional
Varianza conocida
Varianza desconocida
Tamaño de la muestra
Varianza conocida
Intervalo de confianza del 100(1 − α )%
x−
zα /2
L=
zα /2σ
n
n
<µ<x+
zα / 2
n
31
02/12/2011
Tamaño de la muestra
Varianza conocida
Intervalo de confianza del 100(1 − α )%
n=
zα /2σ
L2
P ( Z > zα / 2 ) =
α
2
Tamaño de la muestra
Proporción poblacional
Varianza conocida
Varianza desconocida
32
02/12/2011
Tamaño de la muestra
Varianza desconocida
Intervalo de confianza del 100(1 − α )%
n=
zα / 2σ
L2
P ( Z > zα /2 ) =
estimaciones de la
varianza
α
2
33
Descargar