7 Erregresio analisia 1 Bibliografía Gorostiaga, A., Aliri, J., Lertxundi, N., Balluerka, N. eta Vergara, A.I. (2018). SPSS eta R Commander. Ikerketa ez-esperimentaletako datuen analisia. Bilbo: EHU. 5. kapitulua. Field, A. (2009). Discovering statistics using SPSS (3rd edition). London: Sage. 7,.kapitulua. Isasi, X. (2010). Erregresio-lineala, bariantza- analisiak eta hipotesi-testak. Datu-analisirako lanabesak. Bilbo: UEU. 2 1 Sarrera Helburua gure datuei eredu bat doitzea da eta eredu hori erabiltzea MAren (irizpidearen) balioak aurresateko edo azaltzeko aurresale bat edo gehiagorekin: Aurresale bakarra: Erregresio sinplea Hainbat aurresale: Erregresio anizkoitza Yi=(b0+b1Xi)+εi Emaitzai=(eredua)+erroreai 3 Erregresio zuzena Yi=(b0+b1Xi)+εi edo Yi=(β0+β1Xi)+εi Erregresio zuzena honako bi elementu hauekin definitu daiteke: Malda: b1 Interzeptoa: b0 Erregresio koefizienteak 4 2 Adibideak Interzepto bera, malda desberdinak Interzepto desberdinak, malda bera Interzeptoa (b0) positiboa Malda (b1) negatiboa 5 Karratu txikienen metodoa Datuetara ondoen egokitzen den lerro zuzena aurkitzeko estrategia, datuen eta lerroaren arteko distantzia txikienetan oinarrituta. Datuen eta lerroaren (gure eredua) artean dauden distantzia bertikalak, hondakinak (desbiderapenak) dira. Distantzia hauek batzen baditugu, hondakinak bata bestearekin ezabatzen dira, horregatik distantziaren karratuak kalkulatzen dira. Distantzien karratuak handiak badira, ereduak EZ ditu datuak modu egokian islatzen. Eredu desegokia. Hondakin handiak 6 3 Doikuntzaren egokitasuna: karratuen batura, R eta R2 Doikuntzaren egokitasuna: Zein neurritan doitzen da lerro zuzena datuetara? Hau jakiteko, gure lerroa eredu oinarrizkoenarekin konparatuko dugu; hau da, batezbestekoarekin. Desbiderapena=Σ(behatutakoa-eredua)2 Behatutako balioen batezbestekoak aurresandako balioen arteko diferentzia kalkula genezake: hau da Berreturen Orotariko Batura (gaztelaniaz SCT, Suma Cuadrática Total). Kalkulu bera egin genezake, baina kasu honetan eredua datuetara ondoen egokitzen den zuzena izango litzateke. Behatutako balio bakoitzaren eta lerro zuzenak aurresandako balioaren arteko diferentzia hondakina izango litzateke; hauen berreturen batura Erroreari dagokion Berreturen Batura da (gaztelaniaz SCR, Suma Cuadrática Residual o del Error). Bien arteko diferentzia, SCT-SCR=SCE Ereduak azaldutako Berreturen Batura (gaztelaniaz Suma Cuadrática Explicada por el modelo). 7 SCT: Behatutako datuen eta Yren batezbestekoaren arteko diferentzia. SCR: Behatutako datuen eta erregresio lerro zuzenaren arteko diferentzia. SCE: Yren batezbestekoa eta erregresio lerro zuzenaren arteko diferentzia. 8 4 Doikuntzaren egokitasuna: karratuen batura, R eta R2 R2=SCE/SCT: Ereduak azaldutako bariantza portzentajea. Determinazio koefizientea. Erregresio sinplearen kasuan, determinazio koefizientearen erro karratuak, Pearsonen korrelazio koefizientearekin bat egiten du. Berreturen baturak beren askatasun graduekin zatituz, berreturen batezbestekoak lortzen dira. 9 Doikuntzaren egokitasuna: karratuen batura, R eta R2 MCE=SCE/gl; gl (askatasun graduak) = ereduaren aldagai aurresale kopurua. MCR=SCR/gl; gl (askatasun graduak) = behaketa kopurua ken estimatu beharreko parametro kopurua (estimatu beharreko koefiziente kopurua). F=MCE/MCR ALDAKORTASUN ITURRIA Berreturen baturak SC Askatasun Graduak gl Berreturen batezbestekoak MC F Erregresioa SCE azaldutakoa gl1 MCE= SCE azaldutakoa/gl1 MCE/ MCR Hondakina SCR hondakina gl2 MCR=SCR hondakina/gl2 Totala SCT orotarikoa gl orotarikoa 5 Erregresio koefizienteak Interzeptoa (b0 edo β0): Aldagai aurresale guztien balioa 0 denean, irizpide aldagaiak hartzen duen balioa adierazten du. Malda (b1 edo β1): Aldagai aurresalea unitate bat aldatzen denean, irizpide aldagaiaren aldaketa adierazten du. Aldagai aurresale batek irizpide aldagaia aurresaten badu, koefizientearen balioa 0ren estatistikoki desberdina izan beharko du. Hau frogatzeko N-p-1 askatasun gradu dituen t estatistikoa erabiltzen da; bertan: N= laginaren tamaina p= aurresale kopurua 11 Aurretikoak Aurresale kuantitatibo edo dikotomikoak Linealtasuna Homozedastizitatea Normaltasuna Behaketen askatasuna (Durbin-Watson: 2 inguruko balioak, 1,5 eta 2,5 artean) Multikolinealtasunik eza: Bi aurresale edo gehiagoren artean korrelazio handirik ez egotea : VIF(Variance Inflation Factor) < 5 Tolerantzia (1/VIF) > 0,2 Bi balioak 1 ingurukoak izan beharko lukete 12 6 Erregresio sinplea ADIBIDEA: Ikertzaile batek harrera familietan dauden haurren integrazio maila azaldu nahi du harrerako gurasoekin ezartzen duten atxikimenduaren arabera. Horretarako, atxikimendua eta integrazioa neurtu ditu harrera familietan dauden haurren lagin batean. N=200 Aldagai aurresalea: atxikimendua Irizpide aldagaia: integrazio maila 13 Erregresio sinplea SPSS Analizar → Regresión → Lineales 14 7 Erregresio sinplea SPSS 15 Erregresio sinplea SPSS Azaldutako bariantzaren % SCT Behaketen askatasuna SCR SCE MCE MCR ANOVAk adierazten digu ea eredu orokorrak irizpide aldagaia azaltzen duen modu estatistikoki esanguratsuan. 16 8 Erregresio sinplea SPSS β estandarizatua b0 b1 Koefizienteen taulak adierazten digu zein den aurresale bakoitzaren pisua irizpide aldagaia azaltzerakoan. • Β0 edo interzeptoa: Atxikimenduko puntuazioa 0 denean, Integrazioan lortutako puntuazioa 13,545 izango da. • Β1 edo malda: Atxikimendua unitate bat gehitzean, Integrazioa 0,858 unitate gehituko da (t(198)=11,46; p=0,0001). Gehiketa hau estatistikoki 0ren desberdina da (t froga). Gogora dezagun R2=0,396 dela, ondorioz, ereduak Integrazioaren bariantzaren %39,6 azaltzen du. 17 Erregresio sinplea Jamovi Analyses → Regression → Linear Regression 18 9 Erregresio sinplea Jamovi Analyses → Regression → Linear Regression Assumtions Checks, Model Coefficients eta Model Fit-en aukerak zabaldu 19 Erregresio sinplea Jamovi Azaldutako bariantzaren % Hipotesi froga b0 b1 20 10 Erregresio anizkoitza ADIBIDEA: Ikertzaileak lehengo eredua osatu nahi du eta aurresale berri bat sartu: Harrera familietan dauden haurren adimen emozionala. Bere helburua da lehen azaldu duen bariantza (%39,6) baino bariantza portzentaje handiagoa azaltzea, hots, azaltzeko dagoen %60,4ren zati bat azaltzea. Aldagai aurresaleak: atxikimendua eta adimen emozionala (IE) Irizpide aldagaia: integrazioa 21 Erregresio anizkoitza SPSS Analizar → Regresión → Lineales 22 11 Erregresio anizkoitza SPSS 23 Erregresio anizkoitza SPSS Azaldutako bariantzaren % aurreko ereduarekin konparatuz handitu egin da. 24 12 Erregresio anizkoitza SPSS Β0 edo interzeptoa: Atxikimenduaren eta Adimen emozionalaren puntuazioak 0 direnean, Integrazioko puntuazioa 10,729 izango da. Β1 : Atxikimenduaren puntuazioa unitate bat gehitzen denean eta Adimen emozionaleko puntuazioa konstante mantendu, Integrazioa 0,809 unitate gehituko da (t(197)=12,31; p=0,0001). Β2 : Adimen emozionalaren puntuazioa unitate bat gehitzen denean eta Atxikimenduko puntuazioa konstante mantendu, Integrazioko puntuazioa 0,338 unitate gehituko da (t(197)=7,88; p=0,0001). R2=0,538, beraz ereduak Integrazioaren bariantzaren %53,8 azaltzen25du. Erregresio anizkoitza Jamovi Analyses → Regression → Linear Regression 26 13 Erregresio anizkoitza Jamovi Analyses → Regression → Linear Regression Desplegamos Assumtions Checks, Model Coefficients y Model Fit 27 Erregresio anizkoitza Jamovi % de varianza explicada 28 14 Nola aurkezten dira erregresio anizkoitzaren emaitzak? 1. modua: Artikulu zientifiko batean 1.taula. Erregresio anizkoitzaren emaitzak Aldagaia B SE B β t Interzeptoa 10,73 0,45 Atxikimendua 0,81 0,07 0,59 12,31** Adimen Emozionala 0,34 0,04 0,38 7,88** 24** Oharra: N=200, R2zuzendua=0,54, *p<0,05, **p<0,01 Bi aldagai aurresalez osatutako ereduak haurren integrazio maila aurresateko ahalmena du. Zehazki, 1. taulan ikus daitekeen bezala, haurrek gurasoekin duten atxikimendu maila eta adimen emozionala handiagoak diren heinean, familian duten integrazio maila handiagoa izango da. 41 Nola aurkezten dira erregresio anizkoitzaren emaitzak? 2. modua: Irakasgaian Ereduak modu estatistikoki esanguratsuan azaltzen du harrera familietan dauden haurren integrazioa [F(2, 197) = 117; p=0,0001]. Eredu horrek azaltzen duen bariantza portzentajea %54koa da. Efektuaren tamaina handia da. Lortutako emaitzek adierazten dute bai Atxikimenduak eta bai Adimen emozionalak harrera familietan dauden haurren integrazioa azaltzen dutela. Zehazki, Atxikimenduaren eta Adimen emozionalaren puntuazioak 0 direnean, Integrazioko puntuazioa 10,729 izango da [t(197)=24; p=0,0001]. Atxikimenduaren puntuazioa unitate bat gehitzen denean eta Adimen emozionaleko puntuazioa konstante mantendu, Integrazioa 0,809 unitate gehituko da [t(197)=12,31; p=0,0001]. Adimen emozionalaren puntuazioa unitate bat gehitzen denean eta Atxikimenduko puntuazioa konstante mantendu, Integrazioko puntuazioa 0,338 unitate gehituko da [t(197)=7,88; p=0,0001]. 15