MUESTREO ESTRATIFICADO− M.A.S. (S.R.) Objetivo: Estimar el monto de la venta total de pletinas y varillas de cobre entre los meses de enero y setiembre del año 2004 de la empresa D&M Industrial S.A.C. Población Objetivo: Clientes de la empresa D&M Industrial S.A.C. Característica de interés: Ventas de pletinas y varillas de cobre (monto en soles) de la empresa D&M Industrial S.A.C. Método de Muestreo: Usaremos la técnica de muestreo estratificado con muestreo aleatorio simple sin reemplazamiento. Variable Principal: Y: Montos de ventas por factura o boleta de los meses de enero a setiembre del presente año. Variable Auxiliar: En este caso vemos que existe una relación entre los pesos de pletinas y varillas de cobre con su precio y por ende con el monto total de la factura o boleta. Entonces, la variable auxiliar sería: X: Peso total de las pletinas o varillas de cobre por factura o boleta. Marco Muestral: Registro de ventas de la empresa D&M Industrial S.A.C. desde el mes de enero a setiembre del año 2004. Unidad de Muestreo: Cada factura de la empresa emitida entre los meses de enero y setiembre del presente año. Tabulación de datos: Emplearemos el método de Sturges, para ello trabajaremos con los datos de la variable auxiliar X. • K=1+3.322log(N) K=1+3.322log(85) K=7.4095 • R=Xmáx−Xmín 1 R=215−2=213 • A=R/K A=213/7=30.42"31 • Re=(A*K)−R Re = (31*7)−213=217−213=4 • A=R/K A=213/8=26.625"27 • Re=(A*K)−R Re = (27*8)−213=216−213=3 Luego, elegiremos el número de intervalos (K) que al efectuar el residuo por exceso nos de el menor resultado. Entonces elegimos K=8 en nuestro caso. Aplicamos el Método de Dalenius: Intervalo f(Y) <1;28> [28;55> [55;82> [82;109> [109;136> [136;163> [163;190> [190;219> 49 20 6 4 3 0 2 1 Acumulada 7 4.4721 2.4495 2 1.7321 0 1.4142 1 7 11.472 13.9216 15.9216 17.6537 17.6537 19.0679 20.0679 Formación de Estratos: Se formarán 2 estratos de la tabla. • ; se busca el valor más cercano a 10.03395 que es 11.472, entonces tenemos que el primer estrato está formado por el intervalo : <1;55> • 10.03395+10.03395=20.06; se busca el valor más cercano a 20.06 que es 20.0679, entonces tenemos que el segundo estrato está formado por el intervalo : [55;219> Luego, los estratos serán: Estrato Límites del estrato Primero <1; 55> Segundo [55;219> 2 N1 = 69 N2=16 X1 =1426.9 X2=1173.7 Datos por estrato Datos Poblacionales Estratificados: X=pesos 2 2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 3,2 4 5,7 5,7 5,7 5,7 6 6,4 6,5 8 8 9,6 10,8 12,1 12,8 13 13 13,4 13,4 13,6 13,6 15 16 16,1 Y=monto 37,89 38,21 60,71 60,71 61,5 63,37 63 63 63 63 81,07 108,5 108,5 108,68 111,5 116,14 126 132,16 154,48 164,65 174,18 219,47 241,14 242,57 250,39 251,43 265,6 272,22 249,25 263,26 305,34 317,21 321,28 Primer Estrato X − Media X −18,6797101 −18,6797101 −17,4797101 −17,4797101 −17,4797101 −17,4797101 −17,4797101 −17,4797101 −17,4797101 −17,4797101 −16,6797101 −14,9797101 −14,9797101 −14,9797101 −14,9797101 −14,6797101 −14,2797101 −14,1797101 −12,6797101 −12,6797101 −11,0797101 −9,87971014 −8,57971014 −7,87971014 −7,67971014 −7,67971014 −7,27971014 −7,27971014 −7,07971014 −7,07971014 −5,67971014 −4,67971014 −4,57971014 (X − Media X)^2 348,9315711 348,9315711 305,5402668 305,5402668 305,5402668 305,5402668 305,5402668 305,5402668 305,5402668 305,5402668 278,2127305 224,391716 224,391716 224,391716 224,391716 215,4938899 203,9101218 201,0641798 160,7750494 160,7750494 122,7599769 97,60867255 73,61142617 62,08983197 58,97794791 58,97794791 52,99417979 52,99417979 50,12229574 50,12229574 32,25910733 21,89968704 20,97374501 3 18,2 19,2 19,6 20 20,4 21,6 22,4 22,4 22,4 24 24 24,4 24,4 26,9 27 27 30,5 30,5 32 32 32 32 32,2 32,4 37,8 39 40,2 42,7 43 43 44,7 48,3 50,3 51,2 52 53,5 Total X 1426,9 X=pesos 55,2 55,4 361,32 365,12 371,33 376,63 381,12 430,1 390,28 434,36 443,6 464,85 483,58 452,61 453,79 495,35 471,23 523,4 568,81 568,81 602,61 612,28 634,26 636,82 621,3 638,48 680,29 754,94 700,41 737,56 760,23 823,96 801,3 889,42 950,52 985,91 962,11 1066,52 Media X 20,6797101 Y=monto 1015,58 1021,38 −2,47971014 −1,47971014 −1,07971014 −0,67971014 −0,27971014 0,92028986 1,72028986 1,72028986 1,72028986 3,32028986 3,32028986 3,72028986 3,72028986 6,22028986 6,32028986 6,32028986 9,82028986 9,82028986 11,3202899 11,3202899 11,3202899 11,3202899 11,5202899 11,7202899 17,1202899 18,3202899 19,5202899 22,0202899 22,3202899 22,3202899 24,0202899 27,6202899 29,6202899 30,5202899 31,3202899 32,8202899 Cuasivar. (X) 218,7781117 6,148962403 2,189542113 1,165773997 0,462005881 0,078237765 0,846933417 2,959397185 2,959397185 2,959397185 11,02432472 11,02432472 13,84055661 13,84055661 38,69200588 39,94606385 39,94606385 96,43809284 96,43809284 128,1489624 128,1489624 128,1489624 128,1489624 132,7170783 137,3651943 293,1043247 335,6330204 381,041716 484,8931653 498,1953392 498,1953392 576,9743247 762,8804117 877,3615711 931,4880928 980,9605566 1077,171426 Total 14876,91159 Segundo Estrato X − Media X −75,85625 −75,85625 (X − Media X)^2 5754,17066 5754,17066 4 57,6 61 64,5 80,7 83,4 84,4 104,5 107 124,6 129 129 172,4 178 215 Total X 1701,7 1072,39 1054,74 1194,09 1517,97 1532,52 1590,84 2074,29 2069,44 2470,74 2548,21 2556,84 3198,47 3462,15 4144,29 Media X 106,35625 −74,35625 −74,35625 −74,35625 −74,35625 −74,15625 −73,95625 −68,55625 −67,35625 −66,15625 −63,65625 −63,35625 −63,35625 −61,65625 −58,05625 Cuasivar. (X) 5163,87113 5528,85191 5528,85191 5528,85191 5528,85191 5499,14941 5469,52691 4699,95941 4536,86441 4376,64941 4052,11816 4014,01441 4014,01441 3801,49316 3370,52816 Total 77458,0669 Cálculo del tamaño de la muestra para un valor especificado de la varianza si Ch es constante: Pero tenemos en cuenta que: Entonces, para X=3128.6 y un a0 específico se tiene: a0 0.05 V0 24 470.3449 n 39 5 0.10 0.15 97 881.3796 220 233.1041 25 15 Elegimos n=15. Asignación de los elementos de los estratos en la muestra mediante la asignación de Neyman: Ahora,reemplazamos los valores hallados en la fórmula: Muestras aleatorias simples sin reemplazo por estrato: Nº de orden 1 2 3 4 5 6 7 Nº de orden 1 2 3 4 5 6 7 Nº Aleatorio 28 52 13 26 45 9 21 Media Y 281,724286 Primer Estrato Y 249,25 612,28 108,68 265,6 453,79 63 219,47 Total Y 1972,07 Y − Media Y −32,4742857 330,555714 −173,044286 −16,1242857 172,065714 −218,724286 −62,2542857 Cuasivar. (Y) 36974,7494 Nº Aleatorio 15 4 5 2 1 13 10 Segundo Estrato Y 4144.29 1194.09 1517.97 1072.39 1021.38 3198.47 2470.74 Y − Media Y 1884,105 −1066,095 −742,215 −1187,795 −1238,805 938,285 210,555 (Y − Media Y)^2 1054,57923 109267,08 29944,3248 259,99259 29606,61 47840,3132 3875,59609 Total 221848,496 (Y − Media Y)^2 3549851,65 1136558,55 550883,106 1410856,96 1534637,83 880378,741 44333,408 6 8 14 Media Y 2260,185 3462.15 Total Y 18081,48 1201,965 Cuasivar. (Y) 1507460,02 1444719,86 Total 10552220,1 Estimaciones para el total poblacional Y: • Estimación de Y: Nota: Y=59 578.805 • Estimación de la Varianza: • Estimación del C.V.: El estimado es de 12% lo cual nos indica que este método de muestreo es muy acertado para realizar las estimaciones respectivas al total poblacional Y. • Intervalo de confianza al 95%: 7 La empresa D&M Industrial S.A.C. ha tenido una venta total que varía entre los s/.40 941 y s/.70 262 en el período de enero a setiembre del presente año . MUESTREO ALEATORIO SIMPLE SIN REEMPLAZAMIENTO Quiero solucionar el mismo problema: ¿Cuánto ha vendido en total,en lo que va del año, la empresa D&M Industrial S.A.C. en cuanto a pletinas y varillas de cobre se refiere? Mi objetivo es el mismo, pero en ésta oportunidad haremos las estimaciones correspondientes con una técnica de muestreo distinta: Muestreo Aleatorio Simple sin reemplazamiento, para luego comparar cuál de los 2 métodos es mejor de aplicar en este caso. Variable en estudio: Y: Montos de ventas por factura o boleta de los meses de enero a setiembre del presente año. Y es una variable cuantitativa contínua. Datos Poblacionales: N=85 Y=59 578.56 Tamaño de muestra: Para un a0 fijo de 15% y reemplazando los datos poblacionales en la fórmula, se tiene: n " 34.559 n = 35. Obteniendo la muestra: Nº de Orden 1 2 3 4 Nº Aleatorio 35 30 5 2 y 483,58 361,32 680,29 390,28 y− Media (y) −186,884571 −309,144571 9,82542857 −280,184571 (y − Media(y))^2 34925,84304 95570,36604 96,53904661 78503,39407 8 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 59 25 37 13 10 44 8 76 60 24 28 20 68 53 45 77 31 46 69 43 47 17 3 61 67 32 83 74 38 11 15 Media(y) 670,464571 823,96 251,43 430,1 242,57 3462,15 568,81 381,12 250,39 737,56 263,26 63,37 754,94 1054,74 985,91 568,81 376,63 63 1066,52 3198,47 568,81 2548,21 464,85 700,41 111,5 154,48 219,47 317,21 495,35 305,34 60,71 60,71 y 23466,26 153,495429 −419,034571 −240,364571 −427,894571 2791,68543 −101,654571 −289,344571 −420,074571 67,0954286 −407,204571 −607,094571 84,4754286 384,275429 315,445429 −101,654571 −293,834571 −607,464571 396,055429 2528,00543 −101,654571 1877,74543 −205,614571 29,9454286 −558,964571 −515,984571 −450,994571 −353,254571 −175,114571 −365,124571 −609,754571 −609,754571 Cuasivar.(y) 644516,8223 23560,84659 175589,9721 57775,1272 183093,7643 7793507,532 10333,65189 83720,28102 176462,6456 4501,796535 165815,563 368563,8187 7136,098032 147667,605 99505,81841 10333,65189 86338,75537 369013,2055 156859,9025 6390811,447 10333,65189 3525927,895 42277,35198 896,7286923 312441,3921 266240,078 203396,1035 124788,7922 30665,11313 133315,9527 371800,6374 371800,6374 Total 21913571,96 Estimación del Total: = 670.4646 Estimación de la Varianza: 9 V = 78 262 756.99 Estimación del C.V.: C.V ( )= El C.V. estimado de es de 16.5% , lo cual indica que esta técnica es buena para hacer las estimaciones correspondientes. Estimación del total poblacional por intervalo de confianza al 95%: La venta total en cuanto a pletinas y varillas de cobre, en el período enero−setiembre del 2004, de la empresa D&M Industrial S.A.C. se encuentra entre los s/.39 650 y s/.74 328. CONCLUSIONES • Hemos analizado el mismo problema pero con 2 técnicas distintas de muestreo. • Con el MAS (SR) hemos obtenido buenas estimaciones y con el muestreo estratificado(mas−sr) también .Pero comparando ambos métodos nos damos cuenta que el muestreo estratificado con mas(sr) nos da una mejor aproximación del total de ventas que el mas (sr) y esto lo vemos claramente en la amplitud de los respectivos intervalos de confianza , el de muestreo estratificado tiene una menor amplitud. • La pregunta es ¿podemos trabajar directamente con mas(sr)?,la respuesta es si, tengo una buena estimación del total en este caso,. • ¿Puedo emplear un muestreo estratificado para este caso?, la respuesta es no, porque si bien obtengo un mejor resultado, gastaría más tiempo y dinero para encontrar la variable auxiliar y luego para encontrar los valores muestrales. • En general puedo usar un muestreo estratificado siempre que no conozca mi variable principal o en caso contrario que ésta sea muy heterogénea. • 10