Tema 14: Introducción a la lógica del contraste de hipótesis

Anuncio
Análisis de Datos I
Esquema del Tema 14
Tema 14: Introducción a la lógica del contraste de
hipótesis
LA ESTADÍSTICA INFERENCIAL
EL CONTRASTE DE HIPÓTESIS (prueba de significación
estadística)
EL PROCESO DE DECISIÓN EN 5 PASOS
1)
2)
3)
4)
Hipótesis. Contrastes unilaterales y bilaterales.
Supuestos
Estadístico de contraste
Regla de decisión. Nivel de confianza, nivel de
significación y nivel crítico
5) Decisión y conclusión
__________________
Bibliografía: Tema 14 (págs. 361-378)
Ejercicios recomendados del libro: 1, 2, 3, 4, 6,
7, 8, 9 y 10.
Carmen Ximénez
1
Análisis de Datos I
Esquema del Tema 14
LA ESTADÍSTICA INFERENCIAL
La lógica del contraste de hipótesis se concreta en un número de técnicas particulares. Cada técnica
ha sido desarrollada para ser empleada en un escenario específico, es decir, a las hipótesis referidas
a un determinado parámetro, con unos determinados supuestos distribucionales y en unas
circunstancias concretas. En la asignatura Análisis de Datos II se expondrá una variedad de estas
técnicas, elegidas por ser algunas de las más empleadas en Psicología. En este tema veremos un
esquema general de los pasos que se deben dar en un Contraste de Hipótesis y en el tema siguiente
se exponen tres técnicas concretas, como ilustración de su aplicación.
EL CONTRASTE DE HIPÓTESIS (prueba de significación estadística)
Proceso mediante el cual se trata de comprobar si una afirmación sobre una propiedad
poblacional puede ser mantenida según la información muestral disponible o debe ser rechazada.
EJEMPLO: En las últimas elecciones un partido obtuvo el 40% de votos. Para comprobar que
ese porcentaje ha aumentado de cara a las próximas elecciones se selecciona una m.a.s. de
300 sujetos y se encuentra que 189 (el 63%) votarán al partido.
El contraste de hipótesis = proceso de decisión
1. Formular estadísticamente la hipótesis científica que se desee contrastar
2. Buscar evidencia empírica para informar sobre si la hipótesis establecida es sostenible o no
3. Establecer una regla de decisión en términos de probabilidad
Suponiendo que la hipótesis es correcta, si el resultado muestral es poco probable: la hipótesis
es incompatible con los datos y habría que rechazarla.
Se concluye, por tanto, sobre el grado de compatibilidad de los datos con la hipótesis.
Carmen Ximénez
2
Análisis de Datos I
Esquema del Tema 14
CONTRASTE DE HIPÓTESIS: ESQUEMA DE 5 PASOS
1) Formulación de Hipótesis
Una hipótesis estadística es una afirmación sobre algún aspecto de una distribución de probabilidad
(por ejemplo, el valor de algún parámetro)
Hipótesis nula, H0: hipótesis que se somete a contraste (debe ser concreta y llevar el signo =)
Hipótesis alternativa, H1: negación de H0 (incluye todo lo que excluye H0 y es inexacta)
Tipos de contraste:
Bilateral
H0: = 25
H1:   25
Unilateral derecho
H0:  25
H1:  > 25
Unilateral izquierdo
H0:  25
H1:  < 25
2) Supuestos
Para que la hipótesis nula pueda someterse a contraste es necesario que la distribución poblacional con
la que se trabaje esté especificada lo más posible. Los supuestos son las condiciones que han de
cumplirse para poder decidir sobre la H0 (por ejemplo, que la población de partida sea normal).
* Es importante comprobar los supuestos antes de llevar a cabo el contraste
3) Estadístico de Contraste
Resultado muestral que cumple dos condiciones: 1) proporciona información empírica relevante sobre
la información contenida en H0; y 2) posee una distribución muestral conocida.
El objetivo es evaluar el grado en que el estadístico de contraste (esto es, el dato muestral) se parece a
lo establecido en H0 (dato poblacional) mediante criterios probabilísticos.
4) Regla de Decisión.
Criterio para decidir sobre si H0 debe ser rechazada o no, asumiendo que H0 es verdadera.
Se basa en la división de la distribución muestral del estadístico en dos áreas:
Contraste sobre una
 Zona de rechazo (zona crítica): Valores del estadístico de contraste
media (bilateral)
que están tan alejados de lo establecido en H0, que es muy poco
probable que ocurran si H0 es verdadera.
/2
/2
Su probabilidad es  (nivel de significación)

 Zona de aceptación: Valores del estadístico de contraste que es más
probable que ocurran si H0 es verdadera.
Su probabilidad es 1 - (nivel de confianza)
Definidas las dos zonas … - Se rechaza H0 si el estadístico de contraste cae en la zona de rechazo
- Se mantiene H0 si el estadístico de contraste cae en la zona de aceptación
Importancia de la determinación de , nivel de significación:
 es la probabilidad de que el estadístico de contraste caiga en la zona crítica si, como se supone, H0
es verdadera. Lo especifica previamente (el investigador).  suele fijarse en 0,01 ó 0,05
5) Decisión y conclusión
Conlleva aplicar al estadístico de contraste la decisión estadística: rechazar H0 o no rechazar H0.
- Si se rechaza H0 se considera probado que la hipótesis nula es falsa
- Si se mantiene H0 se considera que la hipótesis nula es compatible con los datos pero su afirmación
(por ejemplo, el valor de un parámetro) queda en incertidumbre
Carmen Ximénez
3
Análisis de Datos I
Esquema del Tema 14
Contraste de hipótesis sobre la media, conocida σ: esquema
Para ilustrar el proceso de decisión vamos a basarnos en el caso del contraste de hipótesis sobre el valor
de una media para el caso en que se conoce la varianza poblacional, 2. El procedimiento consiste en
aplicar el esquema anterior con los siguientes pasos:
1) Hipótesis. Si se trata de un contraste bilateral, éstas serán de la forma,
H0: µ = µ0
H1: µ ≠ µ0
2) Supuestos.
- La población se distribuye N(µ; σ) o la muestra es suficientemente grande como para
asumir la normalidad basándonos en el Teorema Central del Límite.
- La media muestral se ha obtenido sobre una m.a.s. de tamaño N
- Conocemos σ.
3) Estadístico de Contraste y su distribución bajo H0 verdadera.
Z
X  0

N
~ N(0; 1)
4) Regla de Decisión, basada en el nivel de significación (α) adoptado.
Rechazar si Z ≥ 1-α/2z ó Z ≤ α/2z
No rechazar si α/2z < Z < 1-α/2z
5) Decisión y Conclusión. Se rechaza H0 si el estadístico de contraste cae en la zona de rechazo. No se
rechaza H0 si el estadístico de contraste cae en la zona de aceptación.
Ejemplo. El CI se distribuye N(100; 15) en la población general. Un investigador toma una m.a.s. de 9
niños autistas y desea comprobar si la media es distinta en esta población. Encuentra que la media es 115
¿Cuál será su conclusión con  = 0,05?
1) Hipótesis.
H0: µ = 100
H1: µ ≠ 100
2) Supuestos.
(Adviértase que en el problema no se especifica nada sobre la dirección de
la diferencia entre 100 y la media poblacional real, en caso de ser falsa H0,
por lo que se realiza un contraste bilateral)
- La población se distribuye N(100; 15)
- Se trata de una m.a.s.
- Conocemos σ
3) Estadístico de Contraste. Z 
4) Regla de decisión.
X  0

N

115  100
 3 ; donde Z ~ N(0; 1)
15 9
Rechazar si Z ≥ 1,96 ó Z ≤ -1,96
No rechazar si -1,96 < Z < 1,96
5) Decisión y Conclusión. Como 3 > 1,96 rechazamos H0.
Concluimos que la evidencia aconseja rechazar, según la regla de decisión
adoptada, la hipótesis de que la media poblacional sea igual a 100. Por tanto,
La media de los niños autistas es distinta a la de la población general.
Carmen Ximénez
4
Documentos relacionados
Descargar