Subido por ralgloui16

TEMA 1-datos inferenciales

Anuncio
30/09/2019
Curso 2019/20
Diseño y Análisis de Datos II
Tema 1. Contraste de hipótesis y estimación de parámetros
Dra. Sara Domínguez Salas
sdominguez@uloyola.es
UNIVERSIDAD LOYOLA
Universidad de Almería
Tema 1. Contraste de hipótesis y estimación de parámetros
1. Puntuaciones típicas (Z) y curva normal
2. Inferencia estadística
2.1. Estimación de parámetros
2.2. Contraste de hipótesis
2.2.1. Errores en el contraste de hipótesis
2.2.2. Tamaño del efecto
1
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
¿Es posible comparar una altura de 160 cm con un peso de 67 kg?
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Ⴟ
S
¿Qué podemos interpretar si un alumno ha sacado un 4 en estas asignaturas?
El significado de una misma calificación depende de la asignatura.
2
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Ⴟ
S
Las puntuaciones de distribuciones distintas no admiten una comparación
directa si no tienen la misma métrica, el mismo centro y la misma dispersión
Puntuaciones típicas o puntuaciones Z
PUNTUACIONES CON LA MISMA MÉTRICA, EL MISMO CENTRO Y LA MISMA DISPERSIÓN
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Z=
µ
1. Puntuaciones con el mismo centro:
Cualquiera que sea la media de la variable original, la media de las puntuaciones Z = 0
2. Puntuaciones con la misma dispersión:
Cualquiera que sea el grado de dispersión de la variable original, la varianza y la desviación
típica de las puntuaciones Z = 1
3. Puntuaciones con la misma métrica:
Al dividir por σ, la métrica de las nuevas puntuaciones Z cambia a unidades de desviación típica.
*Un cambio en una unidad en la nueva métrica siempre está indicando un cambio de una dt.
3
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Z=
µ
¿Qué podemos decir de una calificación de 4 en Lengua y en Matemáticas?
Tema 1. Contraste de hipótesis y estimación de parámetros
EJERCICIOS
1.
Si una población tiene una media de 170 y una desviación típica de 25, calcula la puntuación Z
(puntuación típica) para cada una de las siguientes observaciones:
a)
250
2.
Una población tiene una media de 150 y una desviación típica de 32. Calcula la puntuación directa de
cada una de las siguientes puntuaciones típicas:
a)
0.52
b) 137
b) 2.31
c) 199
c) 1.06
d) 147
d) 0.03
4
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
EJERCICIO
Sujeto 1:
- 92 sobre 100
- µ = 78.1 y σ = 12.2
Sujeto 2:
- 8.1 sobre 10
- µ = 6.8 y σ = 0.74
¿Quién ha obtenido mejor calificación?
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
N (µ, σ)
5
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
N (0, 1)
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Buscar probabilidades asociadas a valores
X
X
X
Y
6
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
X
P(Z < x) = TABLA DIRECTAMENTE!!!
P(Z < 1.04 ) = 0.8508
X
X
Y
P(Z > x) = 1 – P (Z < x)
P(Z > 2.14) = 1 – P (Z < 2.14)
P(X < Z < Y) = P (Z < Y) - P (Z < X)
P(0,6 < Z < 1,4) = P (Z < 1,4) - P (Z < 0,6)
1 – 0.9838 = 0,0162
P(Z < 1,4 ) = 0,9192 (TABLA!!!)
P(Z < 0,6 ) = 0,7257 (TABLA!!!)
P(0,6 < Z < 1,4) = 0,9192 - 0,7257 = 0,1935
7
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
=
X
-X
TRUCO!!!! Cambia el signo y el símbolo
P(Z > - x) = P (Z < x)
P(Z > - 0,34) = P (Z < 0,34)
TABLA DIRECTAMENTE!!!!
P(Z < 0,34) = 0,6331
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
=
RECUERDA!!!!
Cambia el signo y el símbolo
X
-X
P(Z < - x) = P (Z > x)
P(Z < - 1,25) = P (Z > 1,25)
O DALE LA VUELTA A LA
TABLA!!!!!
CUIDADO!!!!
1- P(Z < 1,25)
1- (0,8944) = 0,1056
8
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Calcula las probabilidades correspondientes a las siguientes puntuaciones típicas, según la curva de
distribución normal:
1)
2)
3)
4)
5)
6)
7)
8)
9)
10)
11)
12)
P (Z < -1.25)
P (Z > -1.78)
P ( -2.33 < Z < -1.33)
P (Z < 1.35)
P (Z > 2.1)
P ( -1.39 < Z < -0.44)
P (Z > 0.31)
P (Z < 2.34)
P ( 0.32 < Z < 1.24)
P (Z < -0.33)
P (Z > -1)
P ( -1.52 < Z < 0.89)
Tema 1. Contraste de hipótesis y estimación de parámetros
N (µ, σ)
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Z=
µ
Ejemplo
Supongamos que los resultados de un examen siguen una distribución normal con media 78 y desviación típica
6. ¿Cuál es la probabilidad de que una persona que se presente al examen obtenga una calificación superior a
72?
9
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
N (µ, σ)
µ
Z=
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
0,0481
0,0228
0,000
-2
6,66
-3,33
-1,66
El peso medio de los estudiantes de un colegio es de 70kg y la desviación típica 3kg. Suponiendo que el peso
de los alumnos se distribuye de forma normal, ¿Cuál es la probabilidad de que un estudiante pese menos de
64kg? ¿Y la probabilidad de que pese más de 90kg? ¿Y la probabilidad de que pese entre 60 y 65kg?
Tema 1. Contraste de hipótesis y estimación de parámetros
EJERCICIOS
Las puntuaciones de un test de inteligencia de 120 alumnos siguen una distribución normal con media 100 y
desviación típica 15.
1) Determina la probabilidad de que un sujeto obtenga un coeficiente entre 95 y 110
2) Calcula el porcentaje de población que obtendría un coeficiente entre 95 y 110
10
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
EJERCICIOS
Las calificaciones de los 500 aspirantes presentados a un examen para contratación laboral se distribuyen de
forma normal con media 6,5 y varianza 4.
1) Calcule la probabilidad de que un aspirante obtenga más de 8 puntos
2) Determine la proporción de aspirantes con calificaciones inferiores a 5 puntos
3) ¿Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7,5 puntos?
Tema 1. Contraste de hipótesis y estimación de parámetros
N (µ, σ)
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
¿Y SI QUEREMOS HACER LO CONTRARIO?
Z=
µ
Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de
esta variable para los cuales se cumplen las siguientes condiciones:
1. Aquel para el que la probabilidad de observar un valor menor o igual a él sea 0,063
2. Aquel valor que deja un área a su derecha igual a 0,33
3. Aquellas dos puntuaciones que dejan a su izquierda y a su derecha áreas iguales a 0,25.
Despejamos X
Con la probab.
vamos a la tabla
y hallamos Z
11
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
N (µ, σ)
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Z=
Con la probab.
vamos a la tabla
y hallamos Z
Despejamos X
µ
Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de
esta variable para los cuales se cumplen las siguientes condiciones:
1. Aquel para el que la probabilidad de observar un valor menor o igual a él sea 0,063
0,063
-1,53 =
Z0,063 = -1,53
X
! "#
$
X = (-1.53 * 5)+40 = 32,35
40
Tema 1. Contraste de hipótesis y estimación de parámetros
N (µ, σ)
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Z=
Con la probab.
vamos a la tabla
y hallamos Z
Despejamos X
µ
Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de
esta variable para los cuales se cumplen las siguientes condiciones:
2. Aquel valor que deja un área a su derecha igual a 0,33
0,33
P(Z > x) = 1 – P (Z < x)
1- 0,33 = 0,67
Z0,67 = 0,44
40 X
0,44 =
! "#
$
X = (0,44 * 5)+40 = 42,2
OJO!!! La tabla solo nos da valores menores!!!
12
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL
Con la probab.
vamos a la tabla
y hallamos Z
Despejamos X
N (µ, σ)
Z=
µ
Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de
esta variable para los cuales se cumplen las siguientes condiciones:
3. Aquellas dos puntuaciones que dejan a su izquierda y a su derecha áreas iguales a 0,25.
X: Z0,25 = -0,67
-0,67 =
X
40
! "#
$
= 36,65
Y: P(Z > x) = 1 – P (Z < x)
0,67 =
! "#
$
= 43,35
Y
OJO!!! La tabla solo nos da valores menores!!! TRUCO SIMETRÍA!!!!
Tema 1. Contraste de hipótesis y estimación de parámetros
2. INFERENCIA ESTADÍSTICA
La inferencia estadística es un tipo de razonamiento que procede de lo
particular a lo general: Intenta extraer conclusiones de tipo general
(población) de unos pocos datos particulares (muestra)
Las inferencias pueden realizarse utilizando dos estrategias distintas:
- La estimación de parámetros
- El contraste de hipótesis
Generalización de los datos de la muestra
a la población. Averiguar qué valores
habrían correspondido en la población de
haber trabajado directamente con ella.
Presencia de un efecto significativo, es
decir, una diferencia entre grupos, una
relación entre variables
13
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Proceso mediante el cual la información muestral es utilizada para inferir
valores poblacionales (parámetros desconocidos).
Dos tipos: Estimación puntual y estimación por intervalos
Estimación puntual:
Asignar un valor muestral concreto al valor poblacional que se desea estimar.
Ej. Cuando para conocer la edad media de un grupo (µ), se toma una muestra de ese grupo y
se adopta como edad media de todo el grupo la obtenida en la muestra (Ⴟ).
Ej. Cuando para conocer la proporción de españoles que tienen intención de votar en las
próximas elecciones, se toma una muestra aleatoria de españoles y se adopta como
proporción poblacional (π) la proporción muestral (P) obtenida.
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
El valor que tome un estadístico en una muestra NO siempre tiene por
qué coincidir con el valor del parámetro estimado.
Variación muestral
Error de estimación (E) = |estadístico utilizado – parámetro estimado|
Muestra
Población
Error de estimación (E) = |Ⴟ– µ|
14
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Estimación por intervalos:
Asignar al parámetro que se desea estimar, NO un valor concreto, sino un rango de valores
(intervalo de confianza) entre los que se espera que pueda encontrarse el verdadero valor
del parámetro con una probabilidad conocida (nivel de confianza).
Rango de valores (IC): 2 extremos llamados límites de confianza (Li y Ls)
IC = estadístico utilizado (Ⴟ) ± Emax
Ls = Ⴟ+ Emax
Li = Ⴟ - Emax
Emax: representa la diferencia máxima que, con una determinada probabilidad, cabe esperar
encontrar entre el verdadero valor del parámetro estimado (población) y el valor concreto
del estadístico utilizado para estimarlo (muestra).
Emax = Z1-α/2
√&
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Permite conocer la probabilidad con la que se espera que el intervalo construido incluya el
verdadero valor del parámetro estimado ---- NIVEL DE CONFIANZA ( 1 – α)
P (Li ≤ µ ≤ Ls) = 1 - α
N = 5; X = {1, 2, 3, 4, 5}
Extraemos todas las posibles muestras de tamaño n=2 ---- Nⁿ = 5² = 25 muestras distintas.
Probabilidad de cada muestra de ser elegida = 1/25
15
30/09/2019
Ⴟ
f (Ⴟ)
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
f (Ⴟ)
f (Ⴟ)
16
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
N = 5; X = {1, 2, 3, 4, 5}
Supongamos que conocemos el valor del parámetro media (µ = 3)
La estimación por intervalo considera que el verdadero valor de µ no se alejará del
estadístico Ⴟ en más de una determinada cantidad (Emax).
Supongamos Emax = 1 ¿Qué garantía tenemos de que nuestra estimación es correcta?
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
f (Ⴟ)
Muestra elegida (1,1) --- Ⴟ = 1
Emax = 1
Li = Ⴟ - Emax = 1-1 = 0
Ls = Ⴟ + Emax = 1+1 = 2
Inferimos que el verdadero valor del
parámetro µ se encuentra entre 0 y 2.
¿Y con la muestra (1,2) o (2,1)?
17
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
f (Ⴟ)
Muestras elegidas (1,3), (2,2) y (3,1) --- Ⴟ = 2
Emax = 1
Li = Ⴟ - Emax = 2-1 = 1
Ls = Ⴟ + Emax = 2+1 = 3
Inferimos que el verdadero valor del
parámetro µ se encuentra entre 1 y 3.
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
f (Ⴟ)
19 de las 25 muestras --- intervalos correctos
6 de las 25 muestras --- intervalos incorrectos
- Probabilidad de construir un intervalo correcto =
19/25 = 0,76
- Probabilidad de construir un intervalo incorrecto =
6/25 = 0,24
18
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
19 de las 25 muestras --- intervalos correctos
f (Ⴟ)
Nivel de confianza (1-α) --- zona no rayada
Probabilidad de construir un intervalo entre cuyos limites se encuentre
el verdadero valor del parámetro
6 de las 25 muestras --- intervalos incorrectos
Nivel de riesgo o nivel de significación (α) --- zona
rayada
Amplitud del intervalo
Probabilidad de construir un intervalo entre cuyos limites NO se
encuentre el verdadero valor del parámetro
Al construir un intervalo con Emax = 1, podemos afirmar que el verdadero valor del
parámetro se encontrará dentro de ese intervalo con un nivel de confianza de 0,76
(es decir, con un nivel de riesgo de 0,24)
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Nivel de confianza (1-α)
f (Ⴟ)
Nivel de riesgo o nivel de significación (α)
Si extrajésemos todas las muestras posibles de una
población mediante muestreo aleatorio simple,
calculásemos la media de cada una de ellas y para cada
media calculáramos el IC, una proporción de 1-α de todos
los IC contendrá la media poblacional y una proporción α
no la contendrá.
Amplitud del intervalo
19
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
α/2
0,76
1-α
0,12
Li
µ
α/2
0,12
α/2
Ls
Amplitud del intervalo
de confianza
1.
2.
α/2
1-α
Li
µ
Ls
Amplitud del intervalo
de confianza
Que el IC construido sea lo bastante amplio como para garantizar que la probabilidad de incluir el
parámetro sea alta, y al mismo tiempo…
Que el IC construido sea lo bastante estrecho como para ofrecer una precisión aceptable.
Nivel de confianza del 0,95 (1-α) y por tanto un nivel de riesgo de 0,05 (α)
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Pasos para construir un Intervalo de Confianza:
IC = Ⴟ ± Z1-α/2 √&
1.Determinar el nivel de riesgo que se quiere tomar (α)
2.Buscar la puntuación típica correspondiente Z1-α/2 Buscamos dentro de la tabla!!
3.Calculamos el error máximo Emax = Z1-α/2 * √&
4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax
20
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Ejercicio
Una muestra aleatoria de 100 estudiantes de psicología responde a una prueba de
inteligencia obteniendo una media de 80. Se sabe por otros cursos que la desviación típica
de las puntuaciones de dicha titulación es de 10.
¿Entre qué límites se hallará la verdadera inteligencia media de los estudiantes de
psicología con un nivel de confianza del 0.99?
Pasos para construir un Intervalo de Confianza:
1.Determinar el nivel de riesgo que se quiere tomar (α)
2.Buscar la puntuación típica correspondiente Z1-α/2 – dentro Tabla!!
3.Calculamos el error máximo Emax = Z1-α/2 * √&
4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax
IC = Ⴟ ± Z1-α/2 √&
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Ejercicio
El director de una universidad desea estimar el número medio de horas por semana que
estudian los alumnos La variable número de horas por semana de estudio se distribuye
normalmente con una desviación típica de 4. Los datos obtenidos de una muestra de 49
estudiantes, aportaron una media de 24 horas.
¿Cuál es el IC al 95% para el número promedio de horas por semana que estudian los
alumnos?
Pasos para construir un Intervalo de Confianza:
1.Determinar el nivel de riesgo que se quiere tomar (α)
2.Buscar la puntuación típica correspondiente Z1-α/2 – dentro tabla!!
3.Calculamos el error máximo Emax = Z1-α/2 * √&
4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax
IC = Ⴟ ± Z1-α/2 √&
21
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.1. ESTIMACIÓN DE PARÁMETROS
Ejercicio
Un investigador quiere conocer el tiempo de reacción en una tarea de discriminación en
niños de 12 años. La variable tiempo de reacción se distribuye normalmente con una
desviación típica igual a 3. El investigador extrae una muestra aleatoria de 35 niños de 12
años, les mide el tiempo de reacción medio en la tarea de discriminación y obtiene una
media de 4 segundos.
¿Cuál es el intervalo de confianza para un nivel de confianza del 95%?
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
En numerosas ocasiones los psicólogos se realizan preguntas del tipo:
o ¿El tratamiento que se está aplicando es eficaz para la reducción de la ansiedad?
o Son las técnicas de reducción del estrés empleadas en un experimento apropiadas?
o ¿Influye el desempleo de larga duración en la depresión de las personas?
o ¿Existen diferencias en la salud mental de hombres y mujeres?
El contraste de hipótesis es el procedimiento para comprobar si una
afirmación sobre alguna propiedad poblacional puede ser sostenida a partir
de la información muestral disponible
22
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Hipótesis:
o Explicación tentativa a un problema de investigación que puede someterse a
comprobación.
o Establece relaciones entre variables
o Es un punto de enlace entre la teoría y la observación
o Debe formularse en términos claros
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
 Las hipótesis se formulan sobre la Población.
 Las conclusiones sobre la validez de esas hipótesis se basan en la información muestral.
Hipótesis de investigación: formulada en términos generales, es una pregunta de
investigación. Ej. El entrenamiento en técnicas de estudio mejora el rendimiento
académico.
Hipótesis estadística: Formulada en términos matemáticos. Expresa la hipótesis de forma
estadística. Ej. La nota media en el examen final de los alumnos que usaron subrayado es
mayor que la nota media del grupo control
23
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Hipótesis estadística:
Hipótesis nula (Ho): establecemos la NO existencia de relación o de diferencias
estadísticamente significativas entre las variables.
Hipótesis alternativa (H1): planteamos la existencia de relación o de diferencias
estadísticamente significativas entre las variables.
Ej. La nota media en el examen final de los alumnos que usaron subrayado (µexp) es mayor
que la nota media del grupo control (µctr)
Ho: µ ≥ µ0
Ho: µexp ≤ µctr
Contraste unilateral
H1: µ < µ0
H1: µexp > µctr
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Hipótesis estadística:
Hipótesis nula (Ho): establecemos la NO existencia de relación o de diferencias
estadísticamente significativas entre las variables.
Hipótesis alternativa (H1): planteamos la existencia de relación o de diferencias
estadísticamente significativas entre las variables.
Ej. La nota media en el examen final de los alumnos que usaron subrayado (µexp) difiere de
la nota media del grupo control (µctr)
Ho: µexp = µctr
Contraste bilateral
H1: µexp ≠ µctr
24
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Hipótesis nula (Ho):
- Propone la negación de la relación entre las variables (establece la =)
- Es la hipótesis que sometemos a contraste
- Siempre vamos a intentar demostrar la no evidencia de efecto entre las
variables porque teóricamente una evidencia en contra pesa más que una a
favor (rechazo de Ho)
- El rechazo de la Ho lleva emparejado la aceptación de la H1
Hipótesis alternativa (H1):
- Niega la Ho
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
¿Cuáles son los pasos en el contraste de hipótesis?
1.Formular la hipótesis estadísticas (Ho e H1)
2.Fijar el nivel de riesgo con el que se trabajará (nivel de significación α)
3.Seleccionar y calcular el estadístico de contraste y establecer la región crítica (región en
la que el estadístico tiene una probabilidad de ser obtenido muy pequeña (< α) si Ho fuera
cierta).
4.Tomar una decisión (mantenemos o rechazamos la Ho)
25
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Nivel de significación α
- Concepto estadístico asociado a la verificación de una hipótesis.
- Se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula
cuando ésta es verdadera.
- A partir de este valor, la distribución queda dividida en 2 partes.
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
• La zona de rechazo (zona crítica): área correspondiente a los valores del estadístico de
contraste que se encuentran tan alejados de la afirmación establecida en la Ho que es poco
probable que ocurra. Su probabilidad se representa con α (nivel de significación o nivel de
riesgo).
• La zona de aceptación (nivel de confianza 1-α): área correspondiente a los valores del
estadístico de contraste próximos a la afirmación establecida en Ho. Es la zona en la que se
encuentran los valores del estadístico que es probable que ocurran si Ho es verdadera.
26
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Tomamos una decisión
- Rechazar la Ho si el estadístico de contraste toma un valor perteneciente a la zona de
rechazo
- Mantener la Ho si el estadístico de contraste cae en la zona de aceptación
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Ejemplo:
El nivel de conocimiento de Análisis de Datos II de los estudiantes de Psicología de la
Universidad de la Loyola presenta una media de 6 y una σ=2. Tras impartir dicha asignatura
con un nuevo método, se selecciona a una muestra de 36 alumnos cuya media resulta ser
5. ¿Puede afirmarse que el nuevo método cambia los resultados? (α = 0.05).
1.Formular la hipótesis estadísticas (Ho e H1)
Ho: µ = 6
H1: µ ≠ 6
2.Fijar el nivel de riesgo con el que se trabajará
(nivel de significación α)
α = 0,05
27
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
B
A
3.Calcular el estadístico de contraste y establecer la región crítica
Z=
Z=
Ⴟ µ
/√&
( )
*/√+)
1,96
-1,96
= −¿A qué valores Z le corresponde α/2?
4.Tomar una decisión
El estadístico de contraste (-3) cae en la
zona de rechazo, por lo que rechazamos
Ho. ¿Puede afirmarse que el nuevo
método cambia los resultados? Sí
A: Z0,025 = -1,96
B: P(Z > 0,025) = 1 – P (Z < 0,025) = 0,975
Z0,975 = 1,96
TRUCO SIMETRÍA!!!!! AHORRAMOS CÁLCULOS
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Utilizando los mismos datos pero con un alfa de 0,01,
¿Puede afirmarse que el método nuevo es menos eficaz?
1.Formular la hipótesis estadísticas (Ho e H1)
2.Fijar el nivel de riesgo con el que se trabajará
(nivel de significación α)
Ho: µ ≥ 6
H1: µ < 6
0,01
3.Calcular el estadístico de contraste y establecer la región crítica
4.Tomar una decisión
El estadístico de contraste (-3) cae en la
zona de rechazo, por lo que rechazamos
Ho. ¿Puede afirmarse que el nuevo
método es menos eficaz? Sí
-2,33 6
¿A qué valores Z le corresponde α?
A: Z0,01 = -2,33
28
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Las puntuaciones que se obtienen en la escala de inteligencia para adultos de Wechsler se
distribuyen normalmente con una media = 100 y una desviación típica = 16.
Un psicólogo ha construido una nueva prueba de inteligencia y desea saber si la media que
se obtiene con ella es igual a la proporcionada por el test de Wechsler. Para ello, selecciona
una muestra de 100 sujetos y tras pasarle la nueva prueba obtiene una media de 104.
¿A qué conclusión llegará el psicólogo con un nivel de confianza de 0,95?
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
La media en extraversión de los estudiantes de psicología de Sevilla a lo largo de los
últimos años es de 80 (σ = 40).
Un profesor desea investigar este tema por lo que extrae una muestra de 100 estudiantes,
los cuales contestan a un cuestionario que mide extraversión. La media que obtiene con
este cuestionario es de 70.
Si el investigador quiere probar si la media obtenida es diferente a 80, ¿Qué conclusión
extrae de los datos de la muestra con un nivel de confianza de 0,95?
29
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2. CONTRASTE DE HIPÓTESIS
Actualmente los programas estadísticos para el análisis de datos nos facilitan el proceso
de contraste de hipótesis y toma de decisión mediante el p valor.
Los programas informáticos siempre aportan el valor del estadístico de contraste y la
probabilidad asociada al mismo (p valor).
En lugar de comparar el valor empírico del estadístico de contraste con los puntos críticos
establecidos en la regla de decisión, se compara el p valor con el nivel de significación (α).
Si el p valor es ≤ al nivel de significación, entonces la hipótesis nula se rechaza.
Contraste significativo cuando p menor que α
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
- Error tipo I o falso positivo (α): Rechazar una hipótesis nula cuando realmente es verdadera.
- Error tipo II o falso negativo (β): NO rechazar una hipótesis nula cuando realmente es falsa.
30
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
- Error tipo I o falso positivo (α): Rechazar una hipótesis nula cuando realmente es verdadera.
- Error tipo II o falso negativo (β): NO rechazar una hipótesis nula cuando realmente es falsa.
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
Ejemplo: Se cree que un nuevo tratamiento ofrece buenos resultados contra el cáncer
Ho: El nuevo tto no tiene efecto
H1: El nuevo tto sí tiene efecto
31
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
Ejemplo: Se cree que un nuevo tratamiento ofrece buenos resultados contra el cáncer
Ho: El nuevo tto no tiene efecto
H1: El nuevo tto sí tiene efecto
Realidad
No tiene efecto
Sí tiene efecto
No tiene efecto
OK (especificidad)
Error tipo II
(falso negativo)
Sí tiene efecto
Error tipo I
(falso positivo)
Ok (sensibilidad)
Decisión
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
Ejemplo: Se juzga a un individuo por la presunta comisión de un delito
Ho: Es inocente
H1: Es culpable
32
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
Ejemplo: Se juzga a un individuo por la presunta comisión de un delito
Ho: Es inocente
H1: Es culpable
Realidad
Inocente
Culpable
Inocente
OK (especificidad)
Error tipo II
Culpable
Error tipo I
Ok (sensibilidad)
Veredicto
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS
Potencia de un contraste (1- β):
- Probabilidad de rechazar Ho siendo falsa (Rechazo correcto).
- Probabilidad de que NO ocurra un Error Tipo II (1- β).
33
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.2. TAMAÑO DEL EFECTO
• Una vez corroborada la existencia de diferencias estadísticamente significativas, llega
el momento de estudiar cuál es el tamaño del efecto de dichas diferencias, cuál es la
intensidad de dicha relación.
Ⴟ₁ − Ⴟ₂
.=
12
La d de Cohen
Sp = √
&₁ 3 4₁5 6 &₂ 3 4₂5
&₁6&₂ *
Ⴟ₁: Media del grupo 1
Ⴟ₂: Media del grupo 2
Sp: Desviación típica ponderada
n₁: Tamaño del grupo 1
7₂: Tamaño del grupo 2
1₁* : varianza grupo 1
1₂* : varianza grupo 2
Sp = √
4₁5 64₂5
*
• Es una medida de tamaño del efecto que valora la diferencia entre dos medias de dos
grupos comparados, en términos de desviaciones típicas.
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.2. TAMAÑO DEL EFECTO
34
30/09/2019
Tema 1. Contraste de hipótesis y estimación de parámetros
2.2.2. TAMAÑO DEL EFECTO
Ejemplo:
Se ha llevado a cabo un estudio para evaluar el rasgo de personalidad búsqueda de
sensaciones en hombres y mujeres. Los resultados del estudio han manifestado la
existencia de diferencias significativas entre ambos grupos, presentando las mujeres
niveles más altos de esta variable.
Con los datos que se detallan a continuación, calcula el tamaño del efecto e interpreta el
resultado.
Grupo 1 (hombres): n = 13; Ⴟ = 0,528; S = 0,382
Grupo 2 (mujeres): n = 16; Ⴟ = 1,062; S = 0,339
http://www.psychometrica.de/effect_size.html#nonparametric
35
Descargar