Subido por Antonio Rodriguez

Clase 15 Prueba Hipotesis Diferencia de Medias

Anuncio
Sesión 15
Prueba de Hipótesis para la
Diferencia de medias
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
¿En qué contexto es útil una prueba de
hi ót i para lla diferencia
hipótesis
dif
i de
d medias?
di ?
1. Cuando se trabaja
j simultáneamente con una variable categórica
g
(posible VI) y una variable dependiente (posible VD).
• Se debe considerar el número de niveles de la variable categórica.
• El objetivo
bj ti es comparar los
l valores
l
d la
de
l variable
i bl cuantitativa
tit ti en
función de los niveles de la variable categórica.
• Se asume q
que los ggrupos
p son independientes.
p
• ¿Es posible asumir que la población se distribuye normalmente?
2. Cuando se trabaja con muestras relacionadas, lo que significa dos
mediciones
di i
cuantitativas
tit ti
en ell mismo
i
grupo.
• Lo habitual es considerar al mismo grupo de sujetos medidos dos
veces;; también se p
pueden comparar
p
a p
pares de sujetos
j
((ej:
j
gemelos).
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Actividad 1:
Determine las variable(s) incluida(s) en el objetivo
y si las muestras son independientes o no.
•
•
•
Establecer el nivel de satisfacción conyugal que
muestran ambos miembros de la pareja transcurridos 7
años de matrimonio.
Evaluar el grado de impacto que tiene un tratamiento
para controlar la ansiedad entre hombres y mujeres.
Determinar el efecto que tiene un taller de
reforzamiento en Estadística Inferencial para
estudiantes que asisten y no asisten a clases.
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Contexto de la prueba de Hipótesis para
l diferencia
la
dif
i de
d medias
di
• Dos poblaciones Y1 e Y2, con medias μ1 y μ2, y dos
muestras de tamaño n1 y n2, que se han seleccionado
aleatoriamente de su población.
p
• Lo que se pretende, en términos generales, es contrastar
la hipótesis de que las medias poblacionales no difieren.
• Es decir: μ1 = μ2.
• ¿Cómo realizar dicho contraste?
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Posibilidades en la Prueba de Hipótesis
para muestras
t
independientes
i d
di t
1. Las poblaciones se distribuyen normalmente con
varianzas conocidas.
2. Las p
poblaciones se distribuyen
y
normalmente con
varianzas desconocidas pero iguales.
3. Las p
poblaciones se distribuyen
y
normalmente con
varianzas desconocidas y diferentes.
4. Las Poblaciones no se distribuyen normalmente.
Para escoger
g entre 2 y 3 debemos analizar el IC p
para la
razón de varianzas: el resultado permitirá tomar la
opción correcta.
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
1. Poblaciones normalmente distribuidas
con varianzas
i
iiguales
l
• Si es posible conocer las varianzas poblacionales,
poblacionales se
utiliza como estadístico de prueba a Z.
• En este caso Ho: μx – μy = 0 (Contraste bilateral).
bilateral)
• La fórmula es la siguiente (ver Dócimas de hipótesis
paramétricas):
paramétricas)
Z =
X − Y − δ
σ
2
x
nx
+
σ
0
2
y
ny
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
2. Poblaciones normalmente distribuidas
con varianzas
i
d
desconocidas
id
pero iiguales
l
• En p
primer lugar
g se debe establecer si efectivamente las varianzas
poblacionales son iguales (Supuesto).
• Para ello es necesario construir un IC para la razón de varianzas (se
obtiene
bi
utilizando
ili d ell estadístico
dí i F).
F)
• Ya verificada la igualdad de varianzas, se utiliza como estadístico de
prueba a T.
• La Ho es: μx – μy = 0 (Contraste bilateral) y el estadístico se calcula así:
T =
X − Y − δ
Sp ⋅
0
1
1
+
nx
ny
Nota: Sp es la Varianza ponderada.
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Construcción del IC para razón de
varianzas
i
2
2
⎡ S12
⎤
σ1 S1
IC ⎢ 2 ⋅ Fα
≤ 2 ≤ 2 ⋅F α
= 1−α
⎥
,n2 −1,n1 −1
1− ,n2 −1,n1 −1
S
σ
S
2
2
⎣ 2 2
⎦
2
⎡ 2
⎤
2
2
σ 1 S1
1
⎢ S1
⎥
IC ⎢ 2 ⋅
≤ 2 ≤ 2 ⋅F α
= 1−α
⎥
S2 F α
σ 2 S2 1− 2 ,n2 −1,n1 −1
⎢⎣
⎥⎦
1− , n1 −1, n2 −1
2
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
3. Poblaciones normalmente distribuidas
con varianzas
i
d
desconocidas
id
y dif
diferentes
t
•Cuando se determina,, mediante el IC p
para la razón de varianzas,, q
que
éstas difieren se debe modificar el estadístico de prueba.
•De esta manera los grados de libertad del estadístico Tcrítico (teórico) se
d
determinan
i
d una forma
de
f
dif
diferente.
• La Ho sigue siendo: μx – μy = 0 (Contraste bilateral).
El estadístico es el siguiente:
T=
X − Y − δ0
2
x
2
y
S
S
+
nx n y
2
⎛S
S ⎞
+
⎜⎜
⎟⎟
n
n
x
y ⎠
G.L(v) = ⎝
2
2
2
2
⎛
⎞
S
⎛ Sx ⎞
y
⎜ ⎟ ⎜⎜ n ⎟⎟
Y los grados de libertad:
⎝ nx ⎠ + ⎝ y ⎠
nx − 1 ny − 1
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
2
x
2
y
Poblaciones que se distribuyen normalmente y las
varianzas poblacionales son desconocidas pero iguales
Ejercicio: dos profesores en una escuela desean comparar
el rendimiento de los alumnos de octavo año que han
sido móviles (población 1) con los puntajes de los
alumnos que no lo han sido (población
(
2).
) ¿Se puede
concluir con los datos de las muestras si el puntaje de
rendimiento promedio es diferente en los dos grupos?
Grupo1 n= 15 Promedio= 85 S2 =30
Grupo 2 n= 22 Promedio= 87 S2 =25
Móviles= estudiantes que asistieron a dos o más escuelas
No móviles= estudiantes que permanecen en la misma
escuela
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Procedimiento de verificación de
hi ót i
hipótesis
1. Planteamiento de las hipótesis
1.‐
Ho: µ1 = µ2
Ho: µ1 ‐ µ2 = 0
µ1 ≠ µ
µ2
H1: µ
µ1 ‐ µ
µ2 ≠ 0
H1: µ
2.‐ Nivel se significación: α = 0,05
3.‐ Descripción de la población y supuestos: ambas poblaciones se
distribuyen normalmente
Las σ2 son desconocidas. Las muestras son independientes. M.a.s.i
Para saber
b si las
l σ2 poblacionales
bl
l son iguales,
l es preciso realizar
l
ell IC
para la razón de varianzas
IC[ S21 / S22 * Fα/2 ; gl2, gl1 ≤ σ21/σ22 ≤ S21 / S22 * F1‐α/2 ; gl2, gl1 ]= 1‐α
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Fα/2 ; gl2,
Fα/2 ; gl2,
1 = 0,39
gl2 gl1 = 1
gl2 gl1 =
F1‐α/2; gl1, gl2
2,5632
IC [ 30/25*0,39 ≤ σ12/σ22 ≤ 30/25*2,8437]= 1‐α
IC [ 0,468 ≤ σ12/σ22 ≤ 3,4124 ]= 0,95
Como el intervalo contiene al 1, las varianzas son iguales.
4.‐ El estadístico pertinente: Diferencia de medias muestrales.
5.‐ El estadístico de prueba: t de student con n1+n2‐2 gl.
6.‐ RR y RA: la hipótesis es bilateral.
Para 35 gl y alfa= 0,05 el t crítico es 2,0301
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
7.‐ Recolección de datos y cálculos:
7.
T=
σ X −X
1
X − Y − δ0
1 1
Sp ⋅
+
nx n y
2
27 27
=
+ = 1.76
15 22
14(30) + 21(25)
S =
= 27
35
2
p
85 − 87 −2
T=
=
= −1.14
1.76
1.76
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
8 ‐ Decisión Estadística:
8.
• Como ‐2.03
2 03 < ‐1.14
1 14 < 2.03
2 03 no es posible rechazar Ho.
Ho
• Por lo tanto, se acepta.
9.‐ Conclusión:
• No hay diferencia entre las medias poblacionales.
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Muestreo en poblaciones no distribuidas
normalmente.
l
t
Ejercicio:
• Un equipo de consejeros de rehabilitación juvenil tiene la impresión
de que los jóvenes no reincidentes (NR) son mayores en cuanto al
promedio de edad que los sujetos reincidentes (R) al momento en
que caen en poder de las autoridades.
• El equipo
eq ipo obtiene una
na m.a.
m a de n1=
n1 50 registros de reincidentes y
n2= 60 no reincidentes.
Estadísticos:
• Promedio NR = 14.3; Varianza = 4.
• Promedio R = 12.3; varianza = 6.25
• Alfa = 0.05
Estadística II
Equipo Docente: Iris Gallardo ‐ Andrés Antivilo – Francisco Marro
Descargar