ANÁLISIS DE CORRELACIÓN Y REGRESIÓN ¿Qué ocurre con el aumenta la de soja cuando de siembra? ¿Tiene algo que ver el ? de los animales con su ¿Hay alguna relación entre la de un pesticida y la de plantas dañadas? ¿Se puede predecir el animal conociendo su que logrará un ? ANÁLISIS DE CORRELACIÓN • Covarianza [ cov(x , y) ] • Coeficiente de correlación lineal de Pearson [ r ] -1 r 1 2435,70 Y 1894,64 1353,57 812,51 271,45 391,07 526,34 661,61 X 796,87 932,14 2435,70 Y 1894,64 1353,57 812,51 271,45 339,31 1015,64 1691,97 X 2368,30 3044,63 2435,70 2435,70 1894,64 Biomasa Biomasa 1894,64 1353,57 812,51 812,51 271,45 23,30 1353,57 27,15 31,00 34,85 271,45 296,18 38,70 2435,70 596,19 896,20 1196,21 1496,22 Potasio Salinidad 2435,70 1894,64 Biomasa Biomasa 1894,64 1353,57 1353,57 812,51 812,51 271,45 2,99 4,16 5,33 pH 6,49 7,66 271,45 -1,34 7,20 15,75 Zinc 24,29 32,84 Análisis de regresión • Se desea conocer el tipo de relación que existe entre el rinde de trigo (en Tn) y la dosis de fertilizante aplicada (en kg). • Si se prueba que hay una relación, se quiere saber cuál es la ecuación que describe el comportamiento del rinde en función al fertilizante. • Si se obtiene dicha ecuación, se propone estimar el rinde para una determinada dosis. • Finalmente es muy útil saber si esta relación es o no significativa. ¿Qué es el análisis de regresión? Es una técnica estadística para investigar y modelar una relación entre variables. Tiene como propósito estimar el valor de una variable dependiente a partir de otra variable, que será la independiente. Componentes • Variable dependiente o variable respuesta (Y) • Variable independiente o variable regresora (X) • Ecuación del modelo que vincula X con Y (fórmula) Etapas del análisis de regresión • Definir las variables a analizar • Recolectar los datos • Confeccionar un diagrama de dispersión • Identificar el modelo • Estimar el modelo • Probar hipótesis (en la unidad 7) • Verificar supuestos (en la unidad 7) Definir variables • X: Variable regresora • Y: Variable respuesta Recolectar datos X X1 X2 X3 X4 Y Y1 Y2 Y3 Y4 …. …. Xn Yn Diagrama de dispersión (X1;Y1) Y X Modelo de regresión lineal simple estimado Y = a + bx Calcular los coeficientes de la ecuación de la recta de regresión Método de los mínimos cuadrados b= Método de los mínimos cuadrados a= Ejemplo Los datos de nuestro ejemplo inicial son X: Fertilizante en Kg 2 4 5 7 10 11 12 15 Y: Producción de trigo en Tn 8 9 11 11 12 14 15 16 Definir variables • Y : rinde en tn • X: dosis de fertilizante en kg Diagrama de dispersión 16,40 rinde 14,20 12,00 9,80 7,60 1,35 4,93 8,50 fertiliz 12,08 15,65 Identificar el modelo Calcular los coeficientes