Muestreo estratificado aleatorio simple

Anuncio
MUESTREO ESTRATIFICADO− M.A.S. (S.R.)
Objetivo:
Estimar el monto de la venta total de pletinas y varillas de cobre entre los meses de enero y setiembre del año
2004 de la empresa D&M Industrial S.A.C.
Población Objetivo:
Clientes de la empresa D&M Industrial S.A.C.
Característica de interés:
Ventas de pletinas y varillas de cobre (monto en soles) de la empresa D&M Industrial S.A.C.
Método de Muestreo:
Usaremos la técnica de muestreo estratificado con muestreo aleatorio simple sin reemplazamiento.
Variable Principal:
Y: Montos de ventas por factura o boleta de los meses de enero a setiembre del presente año.
Variable Auxiliar:
En este caso vemos que existe una relación entre los pesos de pletinas y varillas de cobre con su precio y por
ende con el monto total de la factura o boleta. Entonces, la variable auxiliar sería:
X: Peso total de las pletinas o varillas de cobre por factura o boleta.
Marco Muestral:
Registro de ventas de la empresa D&M Industrial S.A.C. desde el mes de enero a setiembre del año 2004.
Unidad de Muestreo:
Cada factura de la empresa emitida entre los meses de enero y setiembre del presente año.
Tabulación de datos:
Emplearemos el método de Sturges, para ello trabajaremos con los datos de la variable auxiliar X.
• K=1+3.322log(N)
K=1+3.322log(85)
K=7.4095
• R=Xmáx−Xmín
1
R=215−2=213
• A=R/K
A=213/7=30.42"31
• Re=(A*K)−R
Re = (31*7)−213=217−213=4
• A=R/K
A=213/8=26.625"27
• Re=(A*K)−R
Re = (27*8)−213=216−213=3
Luego, elegiremos el número de intervalos (K) que al efectuar el residuo por exceso nos de el menor
resultado. Entonces elegimos K=8 en nuestro caso.
Aplicamos el Método de Dalenius:
Intervalo
f(Y)
<1;28>
[28;55>
[55;82>
[82;109>
[109;136>
[136;163>
[163;190>
[190;219>
49
20
6
4
3
0
2
1
Acumulada
7
4.4721
2.4495
2
1.7321
0
1.4142
1
7
11.472
13.9216
15.9216
17.6537
17.6537
19.0679
20.0679
Formación de Estratos:
Se formarán 2 estratos de la tabla.
•
; se busca el valor más cercano a 10.03395 que es 11.472, entonces tenemos que el primer estrato está
formado por el intervalo : <1;55>
• 10.03395+10.03395=20.06; se busca el valor más cercano a 20.06 que es 20.0679, entonces tenemos que el
segundo estrato está formado por el intervalo : [55;219>
Luego, los estratos serán:
Estrato
Límites del estrato
Primero
<1; 55>
Segundo
[55;219>
2
N1 = 69
N2=16
X1 =1426.9
X2=1173.7
Datos por estrato
Datos Poblacionales Estratificados:
X=pesos
2
2
3,2
3,2
3,2
3,2
3,2
3,2
3,2
3,2
4
5,7
5,7
5,7
5,7
6
6,4
6,5
8
8
9,6
10,8
12,1
12,8
13
13
13,4
13,4
13,6
13,6
15
16
16,1
Y=monto
37,89
38,21
60,71
60,71
61,5
63,37
63
63
63
63
81,07
108,5
108,5
108,68
111,5
116,14
126
132,16
154,48
164,65
174,18
219,47
241,14
242,57
250,39
251,43
265,6
272,22
249,25
263,26
305,34
317,21
321,28
Primer Estrato
X − Media X
−18,6797101
−18,6797101
−17,4797101
−17,4797101
−17,4797101
−17,4797101
−17,4797101
−17,4797101
−17,4797101
−17,4797101
−16,6797101
−14,9797101
−14,9797101
−14,9797101
−14,9797101
−14,6797101
−14,2797101
−14,1797101
−12,6797101
−12,6797101
−11,0797101
−9,87971014
−8,57971014
−7,87971014
−7,67971014
−7,67971014
−7,27971014
−7,27971014
−7,07971014
−7,07971014
−5,67971014
−4,67971014
−4,57971014
(X − Media X)^2
348,9315711
348,9315711
305,5402668
305,5402668
305,5402668
305,5402668
305,5402668
305,5402668
305,5402668
305,5402668
278,2127305
224,391716
224,391716
224,391716
224,391716
215,4938899
203,9101218
201,0641798
160,7750494
160,7750494
122,7599769
97,60867255
73,61142617
62,08983197
58,97794791
58,97794791
52,99417979
52,99417979
50,12229574
50,12229574
32,25910733
21,89968704
20,97374501
3
18,2
19,2
19,6
20
20,4
21,6
22,4
22,4
22,4
24
24
24,4
24,4
26,9
27
27
30,5
30,5
32
32
32
32
32,2
32,4
37,8
39
40,2
42,7
43
43
44,7
48,3
50,3
51,2
52
53,5
Total X
1426,9
X=pesos
55,2
55,4
361,32
365,12
371,33
376,63
381,12
430,1
390,28
434,36
443,6
464,85
483,58
452,61
453,79
495,35
471,23
523,4
568,81
568,81
602,61
612,28
634,26
636,82
621,3
638,48
680,29
754,94
700,41
737,56
760,23
823,96
801,3
889,42
950,52
985,91
962,11
1066,52
Media X
20,6797101
Y=monto
1015,58
1021,38
−2,47971014
−1,47971014
−1,07971014
−0,67971014
−0,27971014
0,92028986
1,72028986
1,72028986
1,72028986
3,32028986
3,32028986
3,72028986
3,72028986
6,22028986
6,32028986
6,32028986
9,82028986
9,82028986
11,3202899
11,3202899
11,3202899
11,3202899
11,5202899
11,7202899
17,1202899
18,3202899
19,5202899
22,0202899
22,3202899
22,3202899
24,0202899
27,6202899
29,6202899
30,5202899
31,3202899
32,8202899
Cuasivar. (X)
218,7781117
6,148962403
2,189542113
1,165773997
0,462005881
0,078237765
0,846933417
2,959397185
2,959397185
2,959397185
11,02432472
11,02432472
13,84055661
13,84055661
38,69200588
39,94606385
39,94606385
96,43809284
96,43809284
128,1489624
128,1489624
128,1489624
128,1489624
132,7170783
137,3651943
293,1043247
335,6330204
381,041716
484,8931653
498,1953392
498,1953392
576,9743247
762,8804117
877,3615711
931,4880928
980,9605566
1077,171426
Total
14876,91159
Segundo Estrato
X − Media X
−75,85625
−75,85625
(X − Media X)^2
5754,17066
5754,17066
4
57,6
61
64,5
80,7
83,4
84,4
104,5
107
124,6
129
129
172,4
178
215
Total X
1701,7
1072,39
1054,74
1194,09
1517,97
1532,52
1590,84
2074,29
2069,44
2470,74
2548,21
2556,84
3198,47
3462,15
4144,29
Media X
106,35625
−74,35625
−74,35625
−74,35625
−74,35625
−74,15625
−73,95625
−68,55625
−67,35625
−66,15625
−63,65625
−63,35625
−63,35625
−61,65625
−58,05625
Cuasivar. (X)
5163,87113
5528,85191
5528,85191
5528,85191
5528,85191
5499,14941
5469,52691
4699,95941
4536,86441
4376,64941
4052,11816
4014,01441
4014,01441
3801,49316
3370,52816
Total
77458,0669
Cálculo del tamaño de la muestra para un valor especificado de la varianza si Ch es constante:
Pero tenemos en cuenta que:
Entonces, para X=3128.6 y un a0 específico se tiene:
a0
0.05
V0
24 470.3449
n
39
5
0.10
0.15
97 881.3796
220 233.1041
25
15
Elegimos n=15.
Asignación de los elementos de los estratos en la muestra mediante la asignación de Neyman:
Ahora,reemplazamos los valores hallados en la fórmula:
Muestras aleatorias simples sin reemplazo por estrato:
Nº de orden
1
2
3
4
5
6
7
Nº de orden
1
2
3
4
5
6
7
Nº Aleatorio
28
52
13
26
45
9
21
Media Y
281,724286
Primer
Estrato
Y
249,25
612,28
108,68
265,6
453,79
63
219,47
Total Y
1972,07
Y − Media Y
−32,4742857
330,555714
−173,044286
−16,1242857
172,065714
−218,724286
−62,2542857
Cuasivar. (Y)
36974,7494
Nº Aleatorio
15
4
5
2
1
13
10
Segundo
Estrato
Y
4144.29
1194.09
1517.97
1072.39
1021.38
3198.47
2470.74
Y − Media Y
1884,105
−1066,095
−742,215
−1187,795
−1238,805
938,285
210,555
(Y − Media Y)^2
1054,57923
109267,08
29944,3248
259,99259
29606,61
47840,3132
3875,59609
Total
221848,496
(Y − Media Y)^2
3549851,65
1136558,55
550883,106
1410856,96
1534637,83
880378,741
44333,408
6
8
14
Media Y
2260,185
3462.15
Total Y
18081,48
1201,965
Cuasivar. (Y)
1507460,02
1444719,86
Total
10552220,1
Estimaciones para el total poblacional Y:
• Estimación de Y:
Nota: Y=59 578.805
• Estimación de la Varianza:
• Estimación del C.V.:
El
estimado es de 12% lo cual nos indica que este método de muestreo es muy acertado para realizar las
estimaciones respectivas al total poblacional Y.
• Intervalo de confianza al 95%:
7
La empresa D&M Industrial S.A.C. ha tenido una venta total que varía entre los s/.40 941 y s/.70 262 en el
período de enero a setiembre del presente año .
MUESTREO ALEATORIO SIMPLE SIN REEMPLAZAMIENTO
Quiero solucionar el mismo problema: ¿Cuánto ha vendido en total,en lo que va del año, la empresa D&M
Industrial S.A.C. en cuanto a pletinas y varillas de cobre se refiere?
Mi objetivo es el mismo, pero en ésta oportunidad haremos las estimaciones correspondientes con una técnica
de muestreo distinta: Muestreo Aleatorio Simple sin reemplazamiento, para luego comparar cuál de los 2
métodos es mejor de aplicar en este caso.
Variable en estudio:
Y: Montos de ventas por factura o boleta de los meses de enero a setiembre del presente año.
Y es una variable cuantitativa contínua.
Datos Poblacionales:
N=85
Y=59 578.56
Tamaño de muestra:
Para un a0 fijo de 15% y reemplazando los datos poblacionales en la fórmula, se tiene:
n " 34.559
n = 35.
Obteniendo la muestra:
Nº de Orden
1
2
3
4
Nº Aleatorio
35
30
5
2
y
483,58
361,32
680,29
390,28
y− Media (y)
−186,884571
−309,144571
9,82542857
−280,184571
(y − Media(y))^2
34925,84304
95570,36604
96,53904661
78503,39407
8
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
59
25
37
13
10
44
8
76
60
24
28
20
68
53
45
77
31
46
69
43
47
17
3
61
67
32
83
74
38
11
15
Media(y)
670,464571
823,96
251,43
430,1
242,57
3462,15
568,81
381,12
250,39
737,56
263,26
63,37
754,94
1054,74
985,91
568,81
376,63
63
1066,52
3198,47
568,81
2548,21
464,85
700,41
111,5
154,48
219,47
317,21
495,35
305,34
60,71
60,71
y
23466,26
153,495429
−419,034571
−240,364571
−427,894571
2791,68543
−101,654571
−289,344571
−420,074571
67,0954286
−407,204571
−607,094571
84,4754286
384,275429
315,445429
−101,654571
−293,834571
−607,464571
396,055429
2528,00543
−101,654571
1877,74543
−205,614571
29,9454286
−558,964571
−515,984571
−450,994571
−353,254571
−175,114571
−365,124571
−609,754571
−609,754571
Cuasivar.(y)
644516,8223
23560,84659
175589,9721
57775,1272
183093,7643
7793507,532
10333,65189
83720,28102
176462,6456
4501,796535
165815,563
368563,8187
7136,098032
147667,605
99505,81841
10333,65189
86338,75537
369013,2055
156859,9025
6390811,447
10333,65189
3525927,895
42277,35198
896,7286923
312441,3921
266240,078
203396,1035
124788,7922
30665,11313
133315,9527
371800,6374
371800,6374
Total
21913571,96
Estimación del Total:
= 670.4646
Estimación de la Varianza:
9
V
= 78 262 756.99
Estimación del C.V.:
C.V (
)=
El C.V. estimado de
es de 16.5% , lo cual indica que esta técnica es buena para hacer las estimaciones correspondientes.
Estimación del total poblacional por intervalo de confianza al 95%:
La venta total en cuanto a pletinas y varillas de cobre, en el período enero−setiembre del 2004, de la empresa
D&M Industrial S.A.C. se encuentra entre los s/.39 650 y s/.74 328.
CONCLUSIONES
• Hemos analizado el mismo problema pero con 2 técnicas distintas de muestreo.
• Con el MAS (SR) hemos obtenido buenas estimaciones y con el muestreo estratificado(mas−sr)
también .Pero comparando ambos métodos nos damos cuenta que el muestreo estratificado con
mas(sr) nos da una mejor aproximación del total de ventas que el mas (sr) y esto lo vemos claramente
en la amplitud de los respectivos intervalos de confianza , el de muestreo estratificado tiene una
menor amplitud.
• La pregunta es ¿podemos trabajar directamente con mas(sr)?,la respuesta es si, tengo una buena
estimación del total en este caso,.
• ¿Puedo emplear un muestreo estratificado para este caso?, la respuesta es no, porque si bien obtengo
un mejor resultado, gastaría más tiempo y dinero para encontrar la variable auxiliar y luego para
encontrar los valores muestrales.
• En general puedo usar un muestreo estratificado siempre que no conozca mi variable principal o en
caso contrario que ésta sea muy heterogénea.
•
10
Descargar