Document

Anuncio
Contrastes de hipótesis
1: Ideas generales
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
1
Inferencia Estadística paramétrica
población
Técnicas de
muestreo
Muestra de
individuos
10/06/2014
X1
X2
X3
.
.
Xn
Inferencia Estadística: métodos y
procedimientos que por medio de la
inducción determina propiedades de
una población. Comprende:
•Estimación de parámetros
desconocidos de la distribución de
la variable observada
•Comparación de los parámetros de
dos o más poblaciones
•….
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
2
Los problemas de la inferencia.
Estimación de parámetros:
Suponiendo un cierto modelo probabilístico (una distribución) cuales son los
parámetros que mejor se adaptan a la muestra.
Contraste de hipótesis:
Dada una suposición sobre los parámetros de una o varias distribuciones, por
ejemplo:
La media de la población es igual a 10?
Las medias de dos poblaciones son iguales?
En el contraste de hipótesis queremos verificar si la muestra obtenida es compatible
con alguna suposición.
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
3
¿Que es una hipótesis?
• Una creencia sobre la
población, principalmente
sus parámetros:
Creo que el porcentaje
de enfermos será el 5%
– Media
– Varianza
– Proporción/Tasa
• OJO: Una hipótesis debe
establecerse antes del
análisis.
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
4
Elementos de los tests de hipótesis
Un test de hipótesis consta de cuatro elementos:
Hipótesis Nula (H0)
Hipótesis alternativa (H1)
El estadístico del test
El valor de rechazo o valor crítico
Bioestadística FMCS Reus URV
Curs 2012-13
M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología
10/06/2014
5
5
Elementos de los tests de hipótesis
Hipótesis Nula (H0):
Una hipótesis que hace referencia a algún parámetro de la
población que desconocemos
La hipótesis nula será la hipótesis que queremos contrastar
Escogeremos la hipótesis nula, siempre que los datos que
tenemos no nos indiquen que es falsa
Bioestadística FMCS Reus URV
Curs 2012-13
M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología
10/06/2014
6
6
Elementos de los tests de hipótesis
Hipótesis alternativa (H1) :
La hipótesis alternativa es la contraria (la
“complementaria”) de la hipótesis nula
Solo se acepta si, con los datos que tenemos, hay una gran
evidencia de que la hipótesis nula es falsa.
Bioestadística FMCS Reus URV
Curs 2012-13
M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología
10/06/2014
7
7
¿Qué es H0?
Problema: ¿La osteoporosis está relacionada con el
sexo?
Solución:
Traducir a lenguaje estadístico:
p  50%
Establecer su opuesto:
p  50%
Seleccionar la hipótesis nula
H 0 : p  50%
8
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
¿Qué es H0?
Problema: ¿El colesterol medio para la dieta
mediterránea es 6 mmol/l?
Solución:
Traducir a lenguaje estadístico:
 6
Establecer su opuesto:
 6
Seleccionar la hipótesis nula
H0 :   6
9
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
Elementos de los tests de hipótesis
Estadístico del test (= estadístico de la prueba = test):
Se calcula a partir de la muestra.
Normalmente es una medida de discrepancia entre la
hipótesis nula i la muestra
• Cuanto mayor sea, más discrepa la muestra de la hipótesis
nula i más probable será que rechacemos la hipótesis
• Y viceversa: cuanto menor sea, menor discrepancia i más
probable es que no la rechacemos.
Bioestadística FMCS Reus URV
Curs 2012-13
M. Carme Ruiz de Villa, Àlex Sánchez Departamento Estadística, Facultad de Biología
10/06/2014
10
10
Razonamiento
  40
Ejemplo Si H0
y el valor obtenido en la muestra es de
X = 20
Que hace un
investigador cuando
su teoría no coincide
con los resultados
que obtiene?
Rechazo que H0 sea
cierta y concluyo que
μ ≠ 40
.
μ = 40
X = 20
... el resultado del experimento era poco probable.
i a pesar de ello ha pasado
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
11
Ejemplo: Si H0:   40 y el valor obtenido en la muestra es de
X  38
μ = 40
X = 38
... el resultado del experimento es
coherente.
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
•
•
•
•
No hay evidencia contra H0
No se puede rechazar H0
El experimento no es concluyente
El contraste no es significativo
Departamento Estadística, Facultad de Biología
12
Valor crítico o valor de rechazo
a
H0: =70
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
ta
Departamento Estadística, Facultad de Biología
13
Nivel de significación
No se rechaza
H0: =70
a
H0: =70
10/06/2014
X  72
M. Carme Ruiz de Villa, Àlex Sánchez
ta
Departamento Estadística, Facultad de Biología
14
Significación: p-valor
• Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del
estadístico obtenido de la muestra.
• Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
• Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la
obtenida.
• p solo se conoce después de realizar el experimento aleatorio
•
•El contraste es no
significativo cuando p>a
• El contraste es
significativo cuando p<a
P
a
P
a
No se rechaza
H0: =70
X  72
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
15
Resumen: a & p como base de rechazo
Sobre a
• Sobre p
Es un número pequeño
prefijado previamente a
análisis del experimento
Una vez fijado obtenemos
el valor crítico ta y
tomaremos la decisión
comparándolo con la texp

– Se obtiene después de
hacer el experimento
– Una vez conocido
tomaremos la decisión
comparándolo con el
nivel de significación
Criterio de rechazo
Contraste significativo = p menor que a
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
16
Contrastes: unilateral y bilateral
La posición del valor crítico depende de como se defina la hipótesis
alternativa
Bilateral
H1: m ≠
Unilateral
Unilateral
H1: m <
10/06/2014
H1: m >
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
17
Muestras independientes vs apareadas
•
Las comparaciones de 2 grupos se basan en recoger una muestra aleatoria simple de
cada grupo
-> los datos son independientes dentro del grupo.
•
A veces se pueden presentar situaciones de dependencia entre los datos de los 2 grupos.
•
Ejemplo 1:
•
Ejemplo 2:
– Se quiere comparar la eficacia de 2 fármacos para adelgazar.
– Se obtienen 20 individuos y se asignan al azar 10 a cada tratamiento.
– A los dos meses se mide la diferencia de peso antes y después del tratamiento: comparación de
2 muestras independientes.
– Se obtienen 10 individuos aleatoriamente, se mide el peso,
– Se suministra durante 2 meses el mismo tratamiento y se mide finalmente el peso.
– Para cada individuo existe una relación (dependencia) entre el peso inicial y el peso al cabo de 2
meses
los datos se encuentran apareados: comparación de 2
muestras apareadas.
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
18
Ejemplo bilateral
•
•
•
•
Parámetro: µ
Hipótesis Nula (H0)
H0: µ = µ0
Hipótesis alternativa (H1) H1 : µ ≠ µ0
El estadístico de la prueba (σ desconocida)
• Bajo la hipótesis H0 (es decir suponiendo que es cierta)
T=
•
X - μX
σX
=
X - μ0
≈ t( n-1 )
s
n
Distribución t-student
El valor de rechazo o valor crítico
Rechazo de H0 si t < -t n-1,α/2 o t > t n-1,α/2
Aceptación de H0 si - t n-1,α/2 <= t <= t n-1,α/2
Si n grande la t-student es equivalente a una N(0,1)
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
19
Ejemplo unilateral
•
•
•
•
Parámetro: µ
Hipótesis Nula (H0)
H0: µ = µ0
Hipótesis alternativa (H1) H1 : µ < µ0
El estadístico de la prueba (σ desconocida)
• Bajo la hipótesis H0 (es decir suponiendo que es cierta)
T=
•
X - μX
σX
=
X - μ0
≈ t( n-1 )
s
n
Distribución t-student
El valor de rechazo o valor crítico
Rechazo de H0 si t < t n-1,α
Aceptación de H0 si t n-1,α/2 >= t n-1,α
Si n grande la t-student es equivalente a una N(0,1)
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
20
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
Los datos pueden refutarla
• H0: Hipótesis nula
– Es inocente
La que se acepta si las pruebas
no indican lo contrario
Rechazarla por error tiene graves
consecuencias
• H1: Hipótesis alternativa
– Es culpable
No debería ser aceptada sin una gran
evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas menos
graves que la anterior
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
21
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H0: Hipótesis nula
No especulativa
– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto
– (Ej.3) No hay nada que destacar
• H1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) El nuevo tratamiento es útil
– (Ej. 3) Hay una situación anormal
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Especulativa
Departamento Estadística, Facultad de Biología
22
Tipos de error al tomar una decisión
Realidad
Inocente
veredicto
Inocente
10/06/2014
OK
Culpable
Error
Menos grave
Culpable
Error
OK
Muy grave
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
23
Errores de tipo I y tipo II
Realidad (población)
Resultado
de la
prueba
(muestra)
Hay diferencia o
asociación (H0 falsa)
No hay diferencia o
asociación (H0 cierta)
diferencia o asociación
significativa
(rechazo de H0)
No error
error tipo I
a
diferencia o asociación no
significativa
(no rechazo de H0)
error tipo II

No error
a = P(cometer un error de tipo I)=P(rechazar H0 |H0 es cierta)
 = P(cometer un error de tipo II)=P(no rechazar H0 |H0 es falsa)
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
24
Potencia y nivel de confianza
Población real
Decisión
H0 es falsa
H0 es cierta
Se rechaza H0
Decisión correcta
1-  (potencia)
Riesgo a
(error tipo I)
No se rechaza H0
Riesgo 
(error tipo II)
Decisión correcta
1- a (confianza)
1-a = nivel de confianza
1- = Potencia= P(rechazar H0 |H0 es falsa)
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
25
No se puede tener todo

a
• Para un tamaño muestral fijo, no se pueden reducir a la vez
ambos tipos de error.
• Para reducir , hay que aumentar el tamaño muestral.
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
26
Conclusiones
Las hipótesis no se plantean después de observar los datos.
En ciencia, las hipótesis nula y alternativa no tienen el mismo papel:
H0 : Hipótesis científicamente más simple.
H1 : El peso de la prueba recae en ella.
α debe ser pequeño
Rechazar una hipótesis consiste en observar si p<α
Rechazar una hipótesis no prueba que sea falsa. Podemos cometer error de tipo I
No rechazar una hipótesis no prueba que sea cierta. Podemos cometer error de tipo II
Si decidimos rechazar una hipótesis debemos mostrar la probabilidad de equivocarnos.
27
10/06/2014
M. Carme Ruiz de Villa, Àlex Sánchez
Departamento Estadística, Facultad de Biología
Descargar