REGRESIÓN LINEAL SIMPLE MGTR TAINA MOJICA Qué tan fuerte es? La fuerza de correlación no depende de la dirección. FUNDAMENTOS Modelo matemático La pendiente El punto que intercepta el eje y Modelo para regresión lineal Y= ₀ + ₁ ꓫ FUNDAMENTOS +℮ +℮ -℮ -℮ Primera propiedad La línea debe pasar exactamente por la mitad: es decir: La de puntos por encima, es la misma cantidad de puntos que están por debajo de la recta ajustada. Cada punto va a generar un error ; entonces, si sumamos todos los errores negativos y todos los positivos cuanto daría el total? = método de los mínimos cuadrados Elevar los errores al cuadrado, eso nos dará un numero… es decir haremos una técnica donde todos esos valores, se elevan al cuadrado, lo cual nos dará un numero que no es cero. El método del mínimo cuadrado es hacer, una técnica de la cual, la suma de todos esos errores al cuadrado nos de el valor mas pequeño posible. Es decir entre menos error, mejor ajustada esta. PARA QUÉ SIRVE? Este método nos permite hacer pronostico, trabajando con tendencias. Pero no todos los casos marcan tener relación, entonces necesitamos otro indicador que nos marque la fuerza que tienen las variables. Para esto usamos el coeficiente de correlación de Pearson el cual se COMO FUNCIONA? Cabe señalar que Excel lo calcula al cuadrado es decir ꓣ² CARACTERÍSTICAS DE R2- COEFICIENTE DE DETERMINACIÓN • Es una cantidad adimensional entre valores de 0 a 1. • Cuando el ajuste es bueno , R2 será cercano a uno ( mayor será la fuerza de asociación entre ambas variables) • Cuando el ajuste es malo, R2 será cercano a cero ( la recta no explica nada, no existe asociación entre X e Y) Relación entre R2 y r R2 mide la proporción de variación de la variable independiente explicada por la variable dependiente. r: mide el grado de asociación entre dos variables. REGRESIÓN LINEAL CON EL MÉTODO DE MÍNIMOS CUADRADOS DIAGRAMA DE DISPERSIÓN A B Año Ventas en miles 1 10 2 11 3 12 4 26 5 24 6 25 FÓRMULAS • Línea recta del mejor ajuste • 𝑎 = 𝑦 − 𝑏𝑥 Ordenada al origen • b= σ𝑛 𝑖=1( 𝑥𝑖 −𝑥)(𝑦𝑖 −𝑦) σ𝑛 𝑖=1(𝑥𝑖− 𝑥)² • 𝑟= Pendiente σ𝑛 𝑖=1(𝑥𝑖 −𝑥)(𝑦𝑖 −𝑦) 𝑛 σ𝑛 𝑖=1(𝑥𝑖 −𝑥)² σ𝑖=1(𝑦𝑖 −𝑦)² Coeficiente de regresión lineal OTRAS FÓRMULAS Ecuación: 𝒀: 𝒂 + 𝒃𝑿 r= σ 𝑥−𝑥ҧ 𝑌−𝑌ത (𝑛−1)𝑆𝑥 𝑆𝑦 𝑆𝑦 𝑏=𝑟 𝑆𝑥 𝑎 = 𝑌ത − 𝑏𝑥ҧ EJEMPLO Año 5 6 7 Ventas en miles 13 14 15 Determine: a. El diagrama de dispersión b. La recta de mejor ajuste c. La ecuación de la recta de mejor ajuste d. El coeficiente de correlación e. Calcular y analizar el coeficiente de r f. Usando la ecuación de la recta de mejor ajuste pronostique las ventas para el año 8 y 9. El señor James McWhinney, presidente de Daniel-James Financial Services, considera que hay una relación entre el número de contactos con sus clientes y la cantidad de ventas. Para probar esta afirmación, el señor McWhinney reunió la siguiente información muestral. La columna X indica el número de contactos con sus clientes el mes anterior, mientras que la columna Y indica el valor de las ventas (miles de $) el mismo mes por cada cliente muestreado.