LLIÇÓ 7. CONTRAST D’HIPÒTESI Importància En tot el món científic, especialment en les ciències experimentals. Definició d’hipòtesi És una proposició o afirmació sobre els valors dels paràmetres d’una població (µ, π). Exemple: Edat mitjana de la classe: 21 anys. Proporció de dones: 60 %. µ = 21 π = 60 % Se’n diuen hipòtesis perquè fan referència a aspectes que poden ser certs, però que no coneixem amb certesa. Contrast d’hipòtesi Determinar si la proposició feta sobre la població pot ser mantinguda o confirmada mitjançant l’estudi de la informació mostral. És a dir, decidir si el resultat és fruit de l’atzar o s’ha produït una modificació. En les ciències experimentals, basant-nos en la inferència estadística, es pot comprovar amb uns marges d’errors prefixats si hipòtesis relatives a valors de certs paràmetres d’una població són admesos o rebutjats. Per saber amb tota certesa si és veritat s’hauria d’examinar tota la població. Com que això no és possible, normalment s’agafen mostres representatives de la població i, a partir de la informació de la mostra, es pren una decisió sobre la veritat o falsedat de la hipòtesi establerta. Hipòtesi nul·la És la hipòtesi que s’ha de contrastar que considerem provisionalment com a vertadera. Els resultats de les dades mostrals faran que l’acceptem com a vertadera o que la rebutgem com a falsa. Se’n diu així perquè se suposa que és nul·la la diferència entre el vertader valor del paràmetre i la hipòtesi. També indica que la diferència observada pot ser explicada per fluctuacions aleatòries del mostreig i no que la diferència hagi de ser exactament igual a zero. L’essència del contrast hipòtesi és poder controlar i avaluar el risc que correm. Actua com un filtre que fa augmentar la quantitat relativa d’hipòtesis correctes, rebutja les falses i deixa de rebutjar les correctes. Hipòtesi alternativa Resta d’estats de la naturalesa possibles o admesos com a possibles en una situació experimental donada. H0:µ = 21 H0:µ = 21 H0:µ = 21 H1:µ ≠ 21 H1:µ < 21 H1:µ > 21 68 Errors • Error de primera espècie o de tipus I (α). És la probabilitat de rebutjar la hipòtesi nul·la sent certa. S’anomena nivell de significació. • Error de segona espècie o de tipus II (β). És la probabilitat d’acceptar la hipòtesi nul·la sent falsa. No hi ha cap relació entre l’un i l’altre, però si un tipus disminueix l’altre augmenta. Un cop fixat el nivell de significació, s’elegeix el contrast que tingui la β mínima. Estats de la naturalesa Decisió H0 és certa H0 és falsa S’accepta H0 1-α β Dec. correcta Dec. incorrecta Es rebutja H0 α 1-β Dec. incorrecta Dec. correcta Estadístic de contrast Tot contrast es basa en el càlcul del valor que pren un determinat estadístic a la mostra seleccionada (ξ, p). Valor crític (zα, zα/2) A partir de la distribució en el mostreig de l’estadístic, es calcula un número que s’anomena valor crític. Es compara l’estadístic de contrast amb el valor crític i, segons quin sigui més gran, s’accepta o es rebutja la hipòtesi nul·la. Regió critica o de rebuig És el conjunt de valors de l’estadístic de contrast pel qual es rebutja la hipòtesi nul·la. Regió d’acceptació Conjunt de valors de l’estadístic de contrast pel qual s’accepta la hipòtesi nul·la. Tipus de contrast Alternativa simple: Alternativa múltiple Bilateral Unilateral per l’esquerra Unilateral per la dreta H0: µ = µ0 H1: µ = µ1 H0: µ = µ0 H1: µ ≠ µ0 H0: µ = µ0 H1: µ < µ0 H0: µ = µ0 H1: µ > µ0 69 Relació amb els intervals Si el valor que s’ha de comprovar (H0) està dintre de l’interval, s’accepta la hipòtesi nul·la. Si està fora, es rebutja. Valor p Valor màxim pel qual es pot rebutjar la hipòtesi nul·la. Mitjana poblacional Població σ conegut Normal σ desconegut Normal i valors grans de n (n>30) H0 µ = µ0 H1 µ ≠ µ0 µ = µ0 µ < µ0 -z < -zα µ = µ0 µ > µ0 µ ≠µ0 µ < µ0 z >zα µ = µ0 µ = µ0 µ = µ0 µ > µ0 µ ≠ µ0 µ = µ0 µ < µ0 Estadístic prova z= x -µ0 σ n z>zα/2 o -z<-zα/2 z= -z< -zα µ = µ0 σ desconegut Normal i valors petits de n (n ≤ 30) Rebuig de H0 z>zα/2 o -z<-zα/2 x -µ0 s n z >zα t>tα/2,n-1 o -t<-tα/2,n-1 t= -t < -tα,n-1 x -µ0 s n µ = µ0 µ > µ0 Proporció poblacional H0 H1 π = π0 π ≠π0 t > tα,n-1 Rebuig de H0 Estadístic prova z>zα/2 o -z<-zα/2 π =π0 π <π0 -z < -zα π =π0 π >π0 z >zα z= p - π0 π0 (1-π0) / n Diferència de mitjanes Poblacions σ desconegut Normal i valors grans de les n (n>30) σ1 = σ2 σ desconegut Normal i valors petits de n (n ≤ 30) H0 µ 1 = µ2 µ 1 = µ2 H1 Rebuig de H0 µ 1 ≠ µ2 µ 1 < µ2 z>zα/2 o -z<-zα/2 -z< -zα Estadístic contrast z= X1 - X2 2 2 s1 + s2 n1 n2 µ 1 = µ2 µ 1 = µ2 µ 1 > µ2 µ 1 ≠ µ2 µ 1 = µ2 µ 1 < µ2 z >zα t>tα/2,m o -t<-tα/2,m -t < -tα,m 70 tm = X1 - X2 Sp 1 + 1 n1 n2 σ1 = σ2 µ1= µ2 Diferència de proporcions Poblacions H0 π poblacionals desconeguts n≤30 π1 = π2 π1 = π2 H1 π1 ≠ π2 π1 < π2 t > tα,m Rebuig de H0 Caràcters qualitatius Població H0 Són indep. 2 2 (n1-1) s1 + ( n2-1) s2 m m= n1 + n2 - 2 S p= Estadístic prova z>zα/2 i -z<-zα/2 -z< -zα π1 = π2 Dues poblacions de modalitats h i k µ 1 > µ2 π1 >π2 z >zα p1 - p2 pq(1 + 1) n1 n2 n1 p1 +n2 p2 p= n1 +n2 z= H1 Rebuig de H0 Estadístic prova No són ind. χ2> χ2α, (h-1). (k-1) χ = ∑∑ h k 2 i =1 j =1 71 (n ´ ij − nij n´ij ) 2