TÉCNICAS DE MUESTREO I Profesor: Ing. Celso Gonzales Ch. Mg.Sc Email:cgonzales@lamolina.edu.pe METODOS INDIRECTOS CONTENIDO • Introducción • Estimador de razón • Estimador de Regresión • Estimador por diferencia. Objetivo Comparar diversos estimadores de la varianza de una población finita en presencia de información auxiliar. INTRODUCCION Mejora Mejorala laexactitud exactitudde deun unestimador estimadorsimple simple Aprovecha Aprovechala lainformación informacióncomplementaria complementaria.. La estacorrelacionada correlacionadacon conla la Lavariable variableauxiliar auxiliarXXi iesta variable variableYYi i ESTIMADOR ESTIMADOR DE DERAZON RAZON METODOS METODOS INDIRECTOS INDIRECTOS ESTIMADOR ESTIMADOR DE REGRESION DE REGRESION ESTIMADOR ESTIMADORPOR POR DIFERENCIA DIFERENCIA El error medio cuadrático (MSE) es la medida comúnmente usada para determinar la exactitud del estimador. Viene dada por: ( ) ECM (Yˆ ) = V (Yˆ ) + ⎡ B Yˆ ⎤ ⎣ ⎦ 2 ESTIMADOR DE RAZON Sea la población:{(Yi,Xi)/(X1,Y1),...........,(XN,YN)} Y Y SY X X SX ∑( X N ρ= i =1 i )( − X Yi − Y S XY R ) ( N − 1) S X SY Con el fin de estimar a los parámetros se extrae una aleatoria simple de tamaño n :{(xi,yi)/(x1,y1),...........,(xn,yn)} Supuesto que: Y∼ β X N R= ∑Y i =1 N i ∑X i =1 i ANALISIS DEL SESGO El sesgo del estimador de la razón es despreciable si: 1 cv( x ) < 10 La recta de regresión de la variable auxiliar X sobre la variable en estudio Y pasa por el origen de coordenadas, entonces: E ( Rˆ ) = R ¿Porqué ¿Porqué utilizar utilizar la la estimación estimación de de Razón? Razón? Estimar Estimarrazón razón Estimar Estimarel eltotal totalde deuna unaPoblación Población Aumentar Aumentarla laprecisión precisión Ajustar Ajustar estimaciones estimaciones TEOREMA: Si las variables (xi, yi) son medidas en cada unidad de una m.a.s de tamaño n, supuestamente grande, N ( ) ( ) ECM Rˆ ≅ V Rˆ = 1− f nX 2 ∑ (Y − RX ) i =1 i N −1 i 2 La varianza estimada de: ˆ ) ∑ ( y − Rx n 1− f ˆ ˆ ECM R ≅ v R = 2 nX ( ) ( ) i =1 i n −1 1− f ˆ2 ˆ 2 ˆ2 ˆ ˆˆ + − v R = S R S 2 RS Y X XY 2 nX ( ) ( i ) 2 ESTIMACION DEL PROMEDIO Y TOTAL DE LA VARIABLE OBJETIVO. Promedio: y y R = .X x Varianza a partir de una muestra: ˆ y − Rx ( ) ∑ 1− f n Sˆ Y2 R = v( y R ) = i =1 n i n −1 i 2 Total poblacional objetivo y ˆ YR = . X x Varianza a partir de una muestra: ˆ ) ∑ ( y − Rx n 2 1− f ˆ ˆ v(YR ) = v( RX ) = X 2 nX i =1 i n −1 i 2 LIMITES DE CONFIANZA Razón: LC ( R) = Rˆ ± tSˆR Promedio: LC (Y R ) = y R ± tSˆY R Total: LC (YR ) = YˆR ± tSˆYˆ R EJEMPLO EJEMPLO Se quiere estimar la edad promedio de los árboles que pertenecen a cierto Lote. La determinación de la edad es complicada, hay que contar los anillos del árbol, mayor será el diámetro de los 1132 y determinan que la media de la población es igual a 10,3. Luego, se eligen al azar 20 árboles para medir su edad. Árbol 1 2 3 4 5 6 7 8 9 10 Diámetro 12 11,4 7,9 9 10,5 7,9 7,3 10,2 11,7 11,3 Edad 125 119 83 85 99 117 69 133 154 168 Árbol 11 12 13 14 15 16 17 18 19 20 Diámetro 5,7 8 10,3 12 9,2 8,5 7 10,7 9,3 8,2 Edad 61 80 114 147 122 106 82 88 97 99 180 160 140 Edad 120 100 80 60 40 20 0 0 5 10 Diametro 15 The regression equation is Edad = - 3.1 + 11.8 Diametro Predictor Coef SE Coef T P Constant -3.09 23.18 -0.13 0.895 Diametro 11.754 2.423 4.85 0.000 S = 19.38 R-Sq = 56.7% R-Sq(adj) = 54.3% Analysis of Variance Source DF SS MS F P 1 8845.0 8845.0 23.54 0.000 Residual Error 18 6763.8 375.8 Total 19 15608.8 Regression A. Se quiere estimar la edad promedio de la población de árboles que pertenecen al lote¿qué tipo de estimación utilizaría simple o complementaria?.¿Qué método utilizaría?. Justifique. B. Halle e interprete un intervalo de confianza del 95 % para la media de la variable objetivo mediante el estimador de razón COMPARACION DE LA ESTIMACION POR RAZON Y EL MUESTREO ALEATORIO SIMPLE La estimación basada en la razón es más preciso que la estimación aleatoria simple si: V (YˆR ) < V (YˆMAS ) si y solo si: SX 1 1 CVx X ρ= ⇔ρ= 2 SY 2 CVy Y