30/09/2019 Curso 2019/20 Diseño y Análisis de Datos II Tema 1. Contraste de hipótesis y estimación de parámetros Dra. Sara Domínguez Salas sdominguez@uloyola.es UNIVERSIDAD LOYOLA Universidad de Almería Tema 1. Contraste de hipótesis y estimación de parámetros 1. Puntuaciones típicas (Z) y curva normal 2. Inferencia estadística 2.1. Estimación de parámetros 2.2. Contraste de hipótesis 2.2.1. Errores en el contraste de hipótesis 2.2.2. Tamaño del efecto 1 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL ¿Es posible comparar una altura de 160 cm con un peso de 67 kg? Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Ⴟ S ¿Qué podemos interpretar si un alumno ha sacado un 4 en estas asignaturas? El significado de una misma calificación depende de la asignatura. 2 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Ⴟ S Las puntuaciones de distribuciones distintas no admiten una comparación directa si no tienen la misma métrica, el mismo centro y la misma dispersión Puntuaciones típicas o puntuaciones Z PUNTUACIONES CON LA MISMA MÉTRICA, EL MISMO CENTRO Y LA MISMA DISPERSIÓN Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Z= µ 1. Puntuaciones con el mismo centro: Cualquiera que sea la media de la variable original, la media de las puntuaciones Z = 0 2. Puntuaciones con la misma dispersión: Cualquiera que sea el grado de dispersión de la variable original, la varianza y la desviación típica de las puntuaciones Z = 1 3. Puntuaciones con la misma métrica: Al dividir por σ, la métrica de las nuevas puntuaciones Z cambia a unidades de desviación típica. *Un cambio en una unidad en la nueva métrica siempre está indicando un cambio de una dt. 3 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Z= µ ¿Qué podemos decir de una calificación de 4 en Lengua y en Matemáticas? Tema 1. Contraste de hipótesis y estimación de parámetros EJERCICIOS 1. Si una población tiene una media de 170 y una desviación típica de 25, calcula la puntuación Z (puntuación típica) para cada una de las siguientes observaciones: a) 250 2. Una población tiene una media de 150 y una desviación típica de 32. Calcula la puntuación directa de cada una de las siguientes puntuaciones típicas: a) 0.52 b) 137 b) 2.31 c) 199 c) 1.06 d) 147 d) 0.03 4 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros EJERCICIO Sujeto 1: - 92 sobre 100 - µ = 78.1 y σ = 12.2 Sujeto 2: - 8.1 sobre 10 - µ = 6.8 y σ = 0.74 ¿Quién ha obtenido mejor calificación? Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL N (µ, σ) 5 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL N (0, 1) Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Buscar probabilidades asociadas a valores X X X Y 6 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL X P(Z < x) = TABLA DIRECTAMENTE!!! P(Z < 1.04 ) = 0.8508 X X Y P(Z > x) = 1 – P (Z < x) P(Z > 2.14) = 1 – P (Z < 2.14) P(X < Z < Y) = P (Z < Y) - P (Z < X) P(0,6 < Z < 1,4) = P (Z < 1,4) - P (Z < 0,6) 1 – 0.9838 = 0,0162 P(Z < 1,4 ) = 0,9192 (TABLA!!!) P(Z < 0,6 ) = 0,7257 (TABLA!!!) P(0,6 < Z < 1,4) = 0,9192 - 0,7257 = 0,1935 7 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL = X -X TRUCO!!!! Cambia el signo y el símbolo P(Z > - x) = P (Z < x) P(Z > - 0,34) = P (Z < 0,34) TABLA DIRECTAMENTE!!!! P(Z < 0,34) = 0,6331 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL = RECUERDA!!!! Cambia el signo y el símbolo X -X P(Z < - x) = P (Z > x) P(Z < - 1,25) = P (Z > 1,25) O DALE LA VUELTA A LA TABLA!!!!! CUIDADO!!!! 1- P(Z < 1,25) 1- (0,8944) = 0,1056 8 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Calcula las probabilidades correspondientes a las siguientes puntuaciones típicas, según la curva de distribución normal: 1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) P (Z < -1.25) P (Z > -1.78) P ( -2.33 < Z < -1.33) P (Z < 1.35) P (Z > 2.1) P ( -1.39 < Z < -0.44) P (Z > 0.31) P (Z < 2.34) P ( 0.32 < Z < 1.24) P (Z < -0.33) P (Z > -1) P ( -1.52 < Z < 0.89) Tema 1. Contraste de hipótesis y estimación de parámetros N (µ, σ) 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Z= µ Ejemplo Supongamos que los resultados de un examen siguen una distribución normal con media 78 y desviación típica 6. ¿Cuál es la probabilidad de que una persona que se presente al examen obtenga una calificación superior a 72? 9 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros N (µ, σ) µ Z= 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL 0,0481 0,0228 0,000 -2 6,66 -3,33 -1,66 El peso medio de los estudiantes de un colegio es de 70kg y la desviación típica 3kg. Suponiendo que el peso de los alumnos se distribuye de forma normal, ¿Cuál es la probabilidad de que un estudiante pese menos de 64kg? ¿Y la probabilidad de que pese más de 90kg? ¿Y la probabilidad de que pese entre 60 y 65kg? Tema 1. Contraste de hipótesis y estimación de parámetros EJERCICIOS Las puntuaciones de un test de inteligencia de 120 alumnos siguen una distribución normal con media 100 y desviación típica 15. 1) Determina la probabilidad de que un sujeto obtenga un coeficiente entre 95 y 110 2) Calcula el porcentaje de población que obtendría un coeficiente entre 95 y 110 10 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros EJERCICIOS Las calificaciones de los 500 aspirantes presentados a un examen para contratación laboral se distribuyen de forma normal con media 6,5 y varianza 4. 1) Calcule la probabilidad de que un aspirante obtenga más de 8 puntos 2) Determine la proporción de aspirantes con calificaciones inferiores a 5 puntos 3) ¿Cuántos aspirantes obtuvieron calificaciones comprendidas entre 5 y 7,5 puntos? Tema 1. Contraste de hipótesis y estimación de parámetros N (µ, σ) 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL ¿Y SI QUEREMOS HACER LO CONTRARIO? Z= µ Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de esta variable para los cuales se cumplen las siguientes condiciones: 1. Aquel para el que la probabilidad de observar un valor menor o igual a él sea 0,063 2. Aquel valor que deja un área a su derecha igual a 0,33 3. Aquellas dos puntuaciones que dejan a su izquierda y a su derecha áreas iguales a 0,25. Despejamos X Con la probab. vamos a la tabla y hallamos Z 11 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros N (µ, σ) 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Z= Con la probab. vamos a la tabla y hallamos Z Despejamos X µ Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de esta variable para los cuales se cumplen las siguientes condiciones: 1. Aquel para el que la probabilidad de observar un valor menor o igual a él sea 0,063 0,063 -1,53 = Z0,063 = -1,53 X ! "# $ X = (-1.53 * 5)+40 = 32,35 40 Tema 1. Contraste de hipótesis y estimación de parámetros N (µ, σ) 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Z= Con la probab. vamos a la tabla y hallamos Z Despejamos X µ Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de esta variable para los cuales se cumplen las siguientes condiciones: 2. Aquel valor que deja un área a su derecha igual a 0,33 0,33 P(Z > x) = 1 – P (Z < x) 1- 0,33 = 0,67 Z0,67 = 0,44 40 X 0,44 = ! "# $ X = (0,44 * 5)+40 = 42,2 OJO!!! La tabla solo nos da valores menores!!! 12 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 1. PUNTUACIONES TÍPICAS (Z) Y CURVA NORMAL Con la probab. vamos a la tabla y hallamos Z Despejamos X N (µ, σ) Z= µ Supongamos que tenemos una variable X que se distribuye N (40; 5) y queremos obtener los valores de esta variable para los cuales se cumplen las siguientes condiciones: 3. Aquellas dos puntuaciones que dejan a su izquierda y a su derecha áreas iguales a 0,25. X: Z0,25 = -0,67 -0,67 = X 40 ! "# $ = 36,65 Y: P(Z > x) = 1 – P (Z < x) 0,67 = ! "# $ = 43,35 Y OJO!!! La tabla solo nos da valores menores!!! TRUCO SIMETRÍA!!!! Tema 1. Contraste de hipótesis y estimación de parámetros 2. INFERENCIA ESTADÍSTICA La inferencia estadística es un tipo de razonamiento que procede de lo particular a lo general: Intenta extraer conclusiones de tipo general (población) de unos pocos datos particulares (muestra) Las inferencias pueden realizarse utilizando dos estrategias distintas: - La estimación de parámetros - El contraste de hipótesis Generalización de los datos de la muestra a la población. Averiguar qué valores habrían correspondido en la población de haber trabajado directamente con ella. Presencia de un efecto significativo, es decir, una diferencia entre grupos, una relación entre variables 13 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Proceso mediante el cual la información muestral es utilizada para inferir valores poblacionales (parámetros desconocidos). Dos tipos: Estimación puntual y estimación por intervalos Estimación puntual: Asignar un valor muestral concreto al valor poblacional que se desea estimar. Ej. Cuando para conocer la edad media de un grupo (µ), se toma una muestra de ese grupo y se adopta como edad media de todo el grupo la obtenida en la muestra (Ⴟ). Ej. Cuando para conocer la proporción de españoles que tienen intención de votar en las próximas elecciones, se toma una muestra aleatoria de españoles y se adopta como proporción poblacional (π) la proporción muestral (P) obtenida. Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS El valor que tome un estadístico en una muestra NO siempre tiene por qué coincidir con el valor del parámetro estimado. Variación muestral Error de estimación (E) = |estadístico utilizado – parámetro estimado| Muestra Población Error de estimación (E) = |Ⴟ– µ| 14 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Estimación por intervalos: Asignar al parámetro que se desea estimar, NO un valor concreto, sino un rango de valores (intervalo de confianza) entre los que se espera que pueda encontrarse el verdadero valor del parámetro con una probabilidad conocida (nivel de confianza). Rango de valores (IC): 2 extremos llamados límites de confianza (Li y Ls) IC = estadístico utilizado (Ⴟ) ± Emax Ls = Ⴟ+ Emax Li = Ⴟ - Emax Emax: representa la diferencia máxima que, con una determinada probabilidad, cabe esperar encontrar entre el verdadero valor del parámetro estimado (población) y el valor concreto del estadístico utilizado para estimarlo (muestra). Emax = Z1-α/2 √& Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Permite conocer la probabilidad con la que se espera que el intervalo construido incluya el verdadero valor del parámetro estimado ---- NIVEL DE CONFIANZA ( 1 – α) P (Li ≤ µ ≤ Ls) = 1 - α N = 5; X = {1, 2, 3, 4, 5} Extraemos todas las posibles muestras de tamaño n=2 ---- Nⁿ = 5² = 25 muestras distintas. Probabilidad de cada muestra de ser elegida = 1/25 15 30/09/2019 Ⴟ f (Ⴟ) Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS f (Ⴟ) f (Ⴟ) 16 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS N = 5; X = {1, 2, 3, 4, 5} Supongamos que conocemos el valor del parámetro media (µ = 3) La estimación por intervalo considera que el verdadero valor de µ no se alejará del estadístico Ⴟ en más de una determinada cantidad (Emax). Supongamos Emax = 1 ¿Qué garantía tenemos de que nuestra estimación es correcta? Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS f (Ⴟ) Muestra elegida (1,1) --- Ⴟ = 1 Emax = 1 Li = Ⴟ - Emax = 1-1 = 0 Ls = Ⴟ + Emax = 1+1 = 2 Inferimos que el verdadero valor del parámetro µ se encuentra entre 0 y 2. ¿Y con la muestra (1,2) o (2,1)? 17 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS f (Ⴟ) Muestras elegidas (1,3), (2,2) y (3,1) --- Ⴟ = 2 Emax = 1 Li = Ⴟ - Emax = 2-1 = 1 Ls = Ⴟ + Emax = 2+1 = 3 Inferimos que el verdadero valor del parámetro µ se encuentra entre 1 y 3. Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS f (Ⴟ) 19 de las 25 muestras --- intervalos correctos 6 de las 25 muestras --- intervalos incorrectos - Probabilidad de construir un intervalo correcto = 19/25 = 0,76 - Probabilidad de construir un intervalo incorrecto = 6/25 = 0,24 18 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS 19 de las 25 muestras --- intervalos correctos f (Ⴟ) Nivel de confianza (1-α) --- zona no rayada Probabilidad de construir un intervalo entre cuyos limites se encuentre el verdadero valor del parámetro 6 de las 25 muestras --- intervalos incorrectos Nivel de riesgo o nivel de significación (α) --- zona rayada Amplitud del intervalo Probabilidad de construir un intervalo entre cuyos limites NO se encuentre el verdadero valor del parámetro Al construir un intervalo con Emax = 1, podemos afirmar que el verdadero valor del parámetro se encontrará dentro de ese intervalo con un nivel de confianza de 0,76 (es decir, con un nivel de riesgo de 0,24) Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Nivel de confianza (1-α) f (Ⴟ) Nivel de riesgo o nivel de significación (α) Si extrajésemos todas las muestras posibles de una población mediante muestreo aleatorio simple, calculásemos la media de cada una de ellas y para cada media calculáramos el IC, una proporción de 1-α de todos los IC contendrá la media poblacional y una proporción α no la contendrá. Amplitud del intervalo 19 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS α/2 0,76 1-α 0,12 Li µ α/2 0,12 α/2 Ls Amplitud del intervalo de confianza 1. 2. α/2 1-α Li µ Ls Amplitud del intervalo de confianza Que el IC construido sea lo bastante amplio como para garantizar que la probabilidad de incluir el parámetro sea alta, y al mismo tiempo… Que el IC construido sea lo bastante estrecho como para ofrecer una precisión aceptable. Nivel de confianza del 0,95 (1-α) y por tanto un nivel de riesgo de 0,05 (α) Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Pasos para construir un Intervalo de Confianza: IC = Ⴟ ± Z1-α/2 √& 1.Determinar el nivel de riesgo que se quiere tomar (α) 2.Buscar la puntuación típica correspondiente Z1-α/2 Buscamos dentro de la tabla!! 3.Calculamos el error máximo Emax = Z1-α/2 * √& 4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax 20 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Ejercicio Una muestra aleatoria de 100 estudiantes de psicología responde a una prueba de inteligencia obteniendo una media de 80. Se sabe por otros cursos que la desviación típica de las puntuaciones de dicha titulación es de 10. ¿Entre qué límites se hallará la verdadera inteligencia media de los estudiantes de psicología con un nivel de confianza del 0.99? Pasos para construir un Intervalo de Confianza: 1.Determinar el nivel de riesgo que se quiere tomar (α) 2.Buscar la puntuación típica correspondiente Z1-α/2 – dentro Tabla!! 3.Calculamos el error máximo Emax = Z1-α/2 * √& 4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax IC = Ⴟ ± Z1-α/2 √& Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Ejercicio El director de una universidad desea estimar el número medio de horas por semana que estudian los alumnos La variable número de horas por semana de estudio se distribuye normalmente con una desviación típica de 4. Los datos obtenidos de una muestra de 49 estudiantes, aportaron una media de 24 horas. ¿Cuál es el IC al 95% para el número promedio de horas por semana que estudian los alumnos? Pasos para construir un Intervalo de Confianza: 1.Determinar el nivel de riesgo que se quiere tomar (α) 2.Buscar la puntuación típica correspondiente Z1-α/2 – dentro tabla!! 3.Calculamos el error máximo Emax = Z1-α/2 * √& 4.Obtener el límite inferior y superior Li = Ⴟ – Emax y Ls = Ⴟ + Emax IC = Ⴟ ± Z1-α/2 √& 21 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.1. ESTIMACIÓN DE PARÁMETROS Ejercicio Un investigador quiere conocer el tiempo de reacción en una tarea de discriminación en niños de 12 años. La variable tiempo de reacción se distribuye normalmente con una desviación típica igual a 3. El investigador extrae una muestra aleatoria de 35 niños de 12 años, les mide el tiempo de reacción medio en la tarea de discriminación y obtiene una media de 4 segundos. ¿Cuál es el intervalo de confianza para un nivel de confianza del 95%? Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS En numerosas ocasiones los psicólogos se realizan preguntas del tipo: o ¿El tratamiento que se está aplicando es eficaz para la reducción de la ansiedad? o Son las técnicas de reducción del estrés empleadas en un experimento apropiadas? o ¿Influye el desempleo de larga duración en la depresión de las personas? o ¿Existen diferencias en la salud mental de hombres y mujeres? El contraste de hipótesis es el procedimiento para comprobar si una afirmación sobre alguna propiedad poblacional puede ser sostenida a partir de la información muestral disponible 22 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Hipótesis: o Explicación tentativa a un problema de investigación que puede someterse a comprobación. o Establece relaciones entre variables o Es un punto de enlace entre la teoría y la observación o Debe formularse en términos claros Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Las hipótesis se formulan sobre la Población. Las conclusiones sobre la validez de esas hipótesis se basan en la información muestral. Hipótesis de investigación: formulada en términos generales, es una pregunta de investigación. Ej. El entrenamiento en técnicas de estudio mejora el rendimiento académico. Hipótesis estadística: Formulada en términos matemáticos. Expresa la hipótesis de forma estadística. Ej. La nota media en el examen final de los alumnos que usaron subrayado es mayor que la nota media del grupo control 23 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Hipótesis estadística: Hipótesis nula (Ho): establecemos la NO existencia de relación o de diferencias estadísticamente significativas entre las variables. Hipótesis alternativa (H1): planteamos la existencia de relación o de diferencias estadísticamente significativas entre las variables. Ej. La nota media en el examen final de los alumnos que usaron subrayado (µexp) es mayor que la nota media del grupo control (µctr) Ho: µ ≥ µ0 Ho: µexp ≤ µctr Contraste unilateral H1: µ < µ0 H1: µexp > µctr Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Hipótesis estadística: Hipótesis nula (Ho): establecemos la NO existencia de relación o de diferencias estadísticamente significativas entre las variables. Hipótesis alternativa (H1): planteamos la existencia de relación o de diferencias estadísticamente significativas entre las variables. Ej. La nota media en el examen final de los alumnos que usaron subrayado (µexp) difiere de la nota media del grupo control (µctr) Ho: µexp = µctr Contraste bilateral H1: µexp ≠ µctr 24 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Hipótesis nula (Ho): - Propone la negación de la relación entre las variables (establece la =) - Es la hipótesis que sometemos a contraste - Siempre vamos a intentar demostrar la no evidencia de efecto entre las variables porque teóricamente una evidencia en contra pesa más que una a favor (rechazo de Ho) - El rechazo de la Ho lleva emparejado la aceptación de la H1 Hipótesis alternativa (H1): - Niega la Ho Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS ¿Cuáles son los pasos en el contraste de hipótesis? 1.Formular la hipótesis estadísticas (Ho e H1) 2.Fijar el nivel de riesgo con el que se trabajará (nivel de significación α) 3.Seleccionar y calcular el estadístico de contraste y establecer la región crítica (región en la que el estadístico tiene una probabilidad de ser obtenido muy pequeña (< α) si Ho fuera cierta). 4.Tomar una decisión (mantenemos o rechazamos la Ho) 25 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Nivel de significación α - Concepto estadístico asociado a la verificación de una hipótesis. - Se define como la probabilidad de tomar la decisión de rechazar la hipótesis nula cuando ésta es verdadera. - A partir de este valor, la distribución queda dividida en 2 partes. Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS • La zona de rechazo (zona crítica): área correspondiente a los valores del estadístico de contraste que se encuentran tan alejados de la afirmación establecida en la Ho que es poco probable que ocurra. Su probabilidad se representa con α (nivel de significación o nivel de riesgo). • La zona de aceptación (nivel de confianza 1-α): área correspondiente a los valores del estadístico de contraste próximos a la afirmación establecida en Ho. Es la zona en la que se encuentran los valores del estadístico que es probable que ocurran si Ho es verdadera. 26 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Tomamos una decisión - Rechazar la Ho si el estadístico de contraste toma un valor perteneciente a la zona de rechazo - Mantener la Ho si el estadístico de contraste cae en la zona de aceptación Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Ejemplo: El nivel de conocimiento de Análisis de Datos II de los estudiantes de Psicología de la Universidad de la Loyola presenta una media de 6 y una σ=2. Tras impartir dicha asignatura con un nuevo método, se selecciona a una muestra de 36 alumnos cuya media resulta ser 5. ¿Puede afirmarse que el nuevo método cambia los resultados? (α = 0.05). 1.Formular la hipótesis estadísticas (Ho e H1) Ho: µ = 6 H1: µ ≠ 6 2.Fijar el nivel de riesgo con el que se trabajará (nivel de significación α) α = 0,05 27 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS B A 3.Calcular el estadístico de contraste y establecer la región crítica Z= Z= Ⴟ µ /√& ( ) */√+) 1,96 -1,96 = −¿A qué valores Z le corresponde α/2? 4.Tomar una decisión El estadístico de contraste (-3) cae en la zona de rechazo, por lo que rechazamos Ho. ¿Puede afirmarse que el nuevo método cambia los resultados? Sí A: Z0,025 = -1,96 B: P(Z > 0,025) = 1 – P (Z < 0,025) = 0,975 Z0,975 = 1,96 TRUCO SIMETRÍA!!!!! AHORRAMOS CÁLCULOS Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Utilizando los mismos datos pero con un alfa de 0,01, ¿Puede afirmarse que el método nuevo es menos eficaz? 1.Formular la hipótesis estadísticas (Ho e H1) 2.Fijar el nivel de riesgo con el que se trabajará (nivel de significación α) Ho: µ ≥ 6 H1: µ < 6 0,01 3.Calcular el estadístico de contraste y establecer la región crítica 4.Tomar una decisión El estadístico de contraste (-3) cae en la zona de rechazo, por lo que rechazamos Ho. ¿Puede afirmarse que el nuevo método es menos eficaz? Sí -2,33 6 ¿A qué valores Z le corresponde α? A: Z0,01 = -2,33 28 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Las puntuaciones que se obtienen en la escala de inteligencia para adultos de Wechsler se distribuyen normalmente con una media = 100 y una desviación típica = 16. Un psicólogo ha construido una nueva prueba de inteligencia y desea saber si la media que se obtiene con ella es igual a la proporcionada por el test de Wechsler. Para ello, selecciona una muestra de 100 sujetos y tras pasarle la nueva prueba obtiene una media de 104. ¿A qué conclusión llegará el psicólogo con un nivel de confianza de 0,95? Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS La media en extraversión de los estudiantes de psicología de Sevilla a lo largo de los últimos años es de 80 (σ = 40). Un profesor desea investigar este tema por lo que extrae una muestra de 100 estudiantes, los cuales contestan a un cuestionario que mide extraversión. La media que obtiene con este cuestionario es de 70. Si el investigador quiere probar si la media obtenida es diferente a 80, ¿Qué conclusión extrae de los datos de la muestra con un nivel de confianza de 0,95? 29 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2. CONTRASTE DE HIPÓTESIS Actualmente los programas estadísticos para el análisis de datos nos facilitan el proceso de contraste de hipótesis y toma de decisión mediante el p valor. Los programas informáticos siempre aportan el valor del estadístico de contraste y la probabilidad asociada al mismo (p valor). En lugar de comparar el valor empírico del estadístico de contraste con los puntos críticos establecidos en la regla de decisión, se compara el p valor con el nivel de significación (α). Si el p valor es ≤ al nivel de significación, entonces la hipótesis nula se rechaza. Contraste significativo cuando p menor que α Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS - Error tipo I o falso positivo (α): Rechazar una hipótesis nula cuando realmente es verdadera. - Error tipo II o falso negativo (β): NO rechazar una hipótesis nula cuando realmente es falsa. 30 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS - Error tipo I o falso positivo (α): Rechazar una hipótesis nula cuando realmente es verdadera. - Error tipo II o falso negativo (β): NO rechazar una hipótesis nula cuando realmente es falsa. Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS Ejemplo: Se cree que un nuevo tratamiento ofrece buenos resultados contra el cáncer Ho: El nuevo tto no tiene efecto H1: El nuevo tto sí tiene efecto 31 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS Ejemplo: Se cree que un nuevo tratamiento ofrece buenos resultados contra el cáncer Ho: El nuevo tto no tiene efecto H1: El nuevo tto sí tiene efecto Realidad No tiene efecto Sí tiene efecto No tiene efecto OK (especificidad) Error tipo II (falso negativo) Sí tiene efecto Error tipo I (falso positivo) Ok (sensibilidad) Decisión Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS Ejemplo: Se juzga a un individuo por la presunta comisión de un delito Ho: Es inocente H1: Es culpable 32 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS Ejemplo: Se juzga a un individuo por la presunta comisión de un delito Ho: Es inocente H1: Es culpable Realidad Inocente Culpable Inocente OK (especificidad) Error tipo II Culpable Error tipo I Ok (sensibilidad) Veredicto Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.1. ERRORES EN EL CONTRASTE DE HIPÓTESIS Potencia de un contraste (1- β): - Probabilidad de rechazar Ho siendo falsa (Rechazo correcto). - Probabilidad de que NO ocurra un Error Tipo II (1- β). 33 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.2. TAMAÑO DEL EFECTO • Una vez corroborada la existencia de diferencias estadísticamente significativas, llega el momento de estudiar cuál es el tamaño del efecto de dichas diferencias, cuál es la intensidad de dicha relación. Ⴟ₁ − Ⴟ₂ .= 12 La d de Cohen Sp = √ &₁ 3 4₁5 6 &₂ 3 4₂5 &₁6&₂ * Ⴟ₁: Media del grupo 1 Ⴟ₂: Media del grupo 2 Sp: Desviación típica ponderada n₁: Tamaño del grupo 1 7₂: Tamaño del grupo 2 1₁* : varianza grupo 1 1₂* : varianza grupo 2 Sp = √ 4₁5 64₂5 * • Es una medida de tamaño del efecto que valora la diferencia entre dos medias de dos grupos comparados, en términos de desviaciones típicas. Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.2. TAMAÑO DEL EFECTO 34 30/09/2019 Tema 1. Contraste de hipótesis y estimación de parámetros 2.2.2. TAMAÑO DEL EFECTO Ejemplo: Se ha llevado a cabo un estudio para evaluar el rasgo de personalidad búsqueda de sensaciones en hombres y mujeres. Los resultados del estudio han manifestado la existencia de diferencias significativas entre ambos grupos, presentando las mujeres niveles más altos de esta variable. Con los datos que se detallan a continuación, calcula el tamaño del efecto e interpreta el resultado. Grupo 1 (hombres): n = 13; Ⴟ = 0,528; S = 0,382 Grupo 2 (mujeres): n = 16; Ⴟ = 1,062; S = 0,339 http://www.psychometrica.de/effect_size.html#nonparametric 35