TASACION DE INMUEBLES URBANOS Estadística para Tasadores A tener en cuenta aToda muestra de datos será incompleta aToda muestra es aleatoria aDatos desordenados no sirven `Calcular valores típicos `Encontrar la distribución y frecuencias `Grado de variabiliad y dispersión `Establecer modelos 1 Tipo de datos o variables aIndependientes `Características físicas del inmueble (superficie, clase estructural, calidad y antigüedad, altura, número de baños, estacionamientos, etc), `ubicación (barrio, distancia, equipamiento, etc.) aDependientes `Valor de mercado `Valor unitario Características de los Datos Tipo Dato Ejemplo de Variable Respuestas Nominal Cualitativo Comuna, uso de suelo, etc. Ordinal Estado de conservación, Uso de Bueno, regular, malo suelo (codificado con números), etc. 1, 2, 3, etc. Cualitativo ordenado Discreto Cantidad de recintos, baños, etc. Cardinal Cuantitativo Continuo Superficie, antigüedad, etc Santiago, Arica, Maipú, etc. Habitacional, comercial, industrial, etc. Sí, No Número Medidas en metros, etc. Medida Moda Moda, Mediana Media, Moda, Mediana 2 Estadística aDescriptiva `Estadígrafos de posición o tendencia central `Estadígrafos de dispersión o variabilidad aInferencia Estadística `Estadística paramétrica (comercial) `Estadística No paramétrica o distribución libre (para escalas nominales) Estadígrafos de posición aMedia aritmética (promedio) aMedia geométrica (ej. Interés promedio ganado en depósitos a plazo) aMedia armónica aMediana aModa (ej. Tasas promedio de defunsión) geomética aritmética 1/2 armónica auto acelerando valores tiempo 3 Media ponderada • Cuando se trabaja con datos agrupados en clases, la media de cada clase de datos debe ser ponderada por el peso o contribución proporcional de la clase respecto al total para calcular la media del conjunto de datos. • Si se trabaja con el promedio de las medias se puede originar una distorsión respecto a la media del total. Ejemplo de media ponderada Clases Datos UF 1 570 - 580 - 600 - 620 - 625 - 650 Suma Cantidad ( n ) media ( y ) 3.645 6 607,5 2 680 - 695 - 700 - 700 - 705 - 710 - 725 - 730 - 740 5.690 8 711,3 3 770 - 785 - 800 - 820 3.175 4 793,8 4 860 860 1 860,0 5 970 970 1 970,0 14.340 20 717,0 788,5 Media de las medias de cada clase Total Clases y= 6 x 607,5 + 8 x 711,3 + 4 x 793,8 + 1 x 860 + 1 x 970 6+7+5+1+1 = 14.340 = 717 20 4 Media truncada aLa media truncada al 20%, eliminaremos el 10% más alto y el 10% más bajo de los datos y promediaremos los valores restantes de igual forma como lo haríamos con el total de valores. Por lo tanto, se deben excluir los 4 datos extremos: 570, 580, 860 y 970. Media truncada (al 20%) = 710 DISTRIBUCION DE DATOS ESTADIGRAFOS DE VARIABILIDAD TEORIAS Y CONCEPTOS 5 Distribución de los datos 100 80 60 40 East 0 3rd Qtr 20 1st Qtr Pasos: aN° de clases (divisiones) aFrecuencia de datos por clase aGrafico de frecuencias aAnálisis de frecuencia o comportamiento de los datos Calculo de frecuencia aElegir un número representativo de clases aProcurar que las clases tengan la misma amplitud aLímites de los intervalos aElegir adecuadamente los puntos medios de cada clase aQue los límites de las clases no sean ambiguos aNo dejar espacios vacíos entre cada una de las clases 6 Ejemplo de Frecuencia con la muestra del ejemplo 1, valor de 20 estacionamientos en Las Condes Observación mayor = Observación menor = Número de clases deseadas = 970 570 5 970 - 570 5-1 Ancho del intervalo deseado = = 400 4 = 100 ases 1 2 3 4 5 tervalo 551-650 651-750 751-850 851-950 951-1050 600 6 700 8 800 4 900 1 1000 1 untos medios de cada clase ecuencia absoluta (cantidad de datos en cada clase) ecuencia relativa 6 / 20 = 0.3 0.4 0.2 0.05 0.05 30% 40% 20% 5% 5% ecuencia relativa (%) Estadígrafos de variabilidad aVarianza aDesviación Standar aCobarianza aCoeficiente de variación CV = Desv. Standar promedio aOtras Nota: La variabilidad de los datos siempre debe ser interpretada como positiva, pues la menor variación es = 0 7 Algunas Formulas s 2 ∑ (yi - y) n-1 = En el ejemplo 1:s 2 2 = 188.720 / 19 = 9.932,6 • Coeficiente de variación: es la razón entre la desviación estándar y la media (CV = s/ y). Nos da una indicación de cuánto representa la desviación estándar en relación a la media. En general, se considera una dispersión: baja intermedia alta En el ejemplo 1: intermedia) si si si CV < 0,1 0,1 < CV = 0,3 CV > 0,3 CV = 99,7 / 717 = 0,14 = 14% (dispersión Resumen a La media hay que complementarla con otros análisis e indicadores estadísticos; se puede recurrir a otras medidas de tendencia central y de dispersión, al análisis grafico y, también, a los análisis de regresión, que permiten reflejar en la ecuación de valor las diferencias específicas de los inmuebles de la muestra. a Mediante el análisis de probabilidad, el tasador puede acotar el probable grado de error en las predicciones de valor que debe hacer a partir de la muestra 8 Ejercitación aCalcular las medidas de tendencia central según documentación entregada en clases Desviación Absoluta Media aCorresponde a la medida más simple de medir desviaciones respecto a la media y se define como “la media de los valores absolutos de las desviaciones” aDA = Σ l cada muestra - promedio | número de datos Nota: los valores absolutos dificultan su cálculo automático por lo tanto se utiliza el cuadrado de las desviaciones. 9 Desviación Estandar o típica aPara determinar la desviación estándar se debe calcular previamente la variabilidad promedio de los datos, a través de la “varianza” definida como s2. aLa desviación estandar corresponde a la raíz cuadrada positiva de la varianza. S = √ s2 Interpretación de la “s” aRegla empírica: para un conjunto de valores con forma de campana el intervalo `promedio ± 1s : contiene app. 68% de datos `promedio ± 2s : contiene app. 95% de datos `promedio ± 3s : contiene app. todos los datos 10 Utilidad de la “s” aLa “s” es más sensible a los valores atípicos que la media, lo que favorece gráficas de “s” v/s tiempo. aLa “s” favorece la genereción de gráficos de barras o dispersión con límites de control de cuartiles de distribución (percentil 25 y 75) Rango Intercuartílico aAnte variaciones extrema de datos, se utiliza el “recorrido intercuartílico” que representa tomar el 50% de los datos centrales, evitando la influencia de los valores extremos. `Recorrido intercuartílico = (Q3) - (Q1) Q1 Q2 Q3 Q4 11 Medición de extremos (asimetría) w= Promedio - Mediana Desviación Estandar aSi w > 0: datos sesgados hacia la derecha aSi w < 0: datos sesgados a la izquierda aSi w = 0: datos simetricos Coeficiente de asimetría aConsiste en elevar las deviaciones de la media a la tercera potencia. M 3 / M2 3/2 M3 = ∑(dato-promedio)3/ n M2 = ∑(dato-promedio)2/ n 12 Error de la muestra a Error derivado del número de datos recolectados( que los datos analizados representan un x% del total de ofertas del sector.) e = √ (((M/n)-1)/ (M-1)) donde M=n/80% (n:número datos) (M= total ofertado) a Error de la dispersión de los datos considerados e = (√¹(y-x)2 /n-1)) x (1/ x) donde x: promedio muestra y: valor de cada muestra a Cálculo empírico basado en el nivel de confianza de la muestra e = x ± t ( s/√n ) s: desviación estandar Tabla de error empírico Nivel de Confianza 68.26% 70.00% 75.00% 80.00% 85.00% 90.00% 95.00% 99.00% Intervalo de confianza X ± 1.0000 s/√n X ± 1.0364 s/√n X ± 1.1503 s/√n X ± 1.2816 s/√n X ± 1.4395 s/√n X ± 1.6449 s/√n X ± 1.9600 s/√n X ± 2.5758 s/√n 13 Datos entregados por Excel Herramienta: Análisis de datos / Estadística Descriptiva Error Estandar aDetermina la diferencia promedio entre los valores de datos individuales y la media aSi la desviación promedio es pequeña, la media esta cerca de cada medición muestral 14 Nivel de Confianza aRango situado a ambos lados de una media, que contiene un % elevado de los datos de la muestra. `Ej. De un conjunto de datos al 95% de nivel de confianza, implica que el 95% de los datos están contenidos entre los rangos de la muestra. Oblicualidad aPermite saber si los datos de una muestra estan sesgados, es decir muestra el grado de asimetría de una distribución alrededor de un media. `Nº > 0: indica corrimiento de distribución hacia la izquierda `Nº < 0: indica corrimiento hacia la derecha `Nº = 0: indica datos perfectamente asimétricos. 15 Curtosis aIndica cuanto más o cuanto menos pronunciada es la curva de una distribución, comparada con una distribución normal (campana). `Nº > 0 : indica una distribución relativamente puntiaguda o concentrada en el peak. `Nº < 0 : distribución relativamente plana. `Nº = 0 : indica una distribución normal. Tipos de oblicualidad (coeficinete de asimetria) 16 Tipos de Curtosis Pasos para cálculo de valores vía Excel 17 Pasos para cálculo de valores vía Excel INGRESAR DATOS PEDIR RESUMEN DE VALORES Guía de Ejercicios Estadística para Tasadores 18