Clase 3 Estadística Laguna 2016

Anuncio
ANÁLISIS
DE
CORRELACIÓN
Y
REGRESIÓN
¿Qué ocurre con el
aumenta la
de soja cuando
de siembra?
¿Tiene algo que ver el
?
de los animales con su
¿Hay alguna relación entre la
de un pesticida y
la
de plantas dañadas?
¿Se puede predecir el
animal conociendo su
que logrará un
?
ANÁLISIS DE CORRELACIÓN
• Covarianza [ cov(x , y) ]
• Coeficiente de correlación lineal de
Pearson [ r ]
-1  r  1
2435,70
Y
1894,64
1353,57
812,51
271,45
391,07
526,34
661,61
X
796,87
932,14
2435,70
Y
1894,64
1353,57
812,51
271,45
339,31
1015,64
1691,97
X
2368,30
3044,63
2435,70
2435,70
1894,64
Biomasa
Biomasa
1894,64
1353,57
812,51
812,51
271,45
23,30
1353,57
27,15
31,00
34,85
271,45
296,18
38,70
2435,70
596,19
896,20
1196,21
1496,22
Potasio
Salinidad
2435,70
1894,64
Biomasa
Biomasa
1894,64
1353,57
1353,57
812,51
812,51
271,45
2,99
4,16
5,33
pH
6,49
7,66
271,45
-1,34
7,20
15,75
Zinc
24,29
32,84
Análisis de regresión
• Se desea conocer el tipo de relación que
existe entre el rinde de trigo (en Tn) y la
dosis de fertilizante aplicada (en kg).
• Si se prueba que hay una relación, se quiere
saber cuál es la ecuación que describe el
comportamiento del rinde en función al
fertilizante.
• Si se obtiene dicha ecuación, se propone
estimar el rinde para una determinada dosis.
• Finalmente es muy útil saber si esta relación
es o no significativa.
¿Qué es el análisis de regresión?
Es una técnica estadística para investigar y modelar una relación entre
variables. Tiene como propósito estimar el valor de una variable dependiente
a partir de otra variable, que será la independiente.
Componentes
• Variable dependiente o variable respuesta (Y)
• Variable independiente o variable regresora (X)
• Ecuación del modelo que vincula X con Y
(fórmula)
Etapas del análisis de regresión
• Definir las variables a analizar
• Recolectar los datos
• Confeccionar un diagrama de dispersión
• Identificar el modelo
• Estimar el modelo
• Probar hipótesis (en la unidad 7)
• Verificar supuestos (en la unidad 7)
Definir variables
• X: Variable regresora
• Y: Variable respuesta
Recolectar datos
X
X1
X2
X3
X4
Y
Y1
Y2
Y3
Y4
….
….
Xn
Yn
Diagrama de dispersión
(X1;Y1)
Y
X
Modelo de regresión lineal simple estimado
Y = a + bx
Calcular los coeficientes de la
ecuación de la recta de regresión
Método de los mínimos
cuadrados
b=
Método de los mínimos
cuadrados
a=
Ejemplo
Los datos de nuestro ejemplo inicial son
X: Fertilizante en Kg
2
4
5
7
10
11
12
15
Y: Producción de trigo en Tn
8
9
11
11
12
14
15
16
Definir variables
• Y : rinde en tn
• X: dosis de fertilizante en kg
Diagrama de dispersión
16,40
rinde
14,20
12,00
9,80
7,60
1,35
4,93
8,50
fertiliz
12,08
15,65
Identificar el modelo
Calcular los coeficientes
Descargar