Contribución al equilibrio de varias características deseables 1*)

Anuncio
Contribución al equilibrio de varias características
deseables 1*)
por F. AZOR^N y J. L. SANCHEZ-CRESPO
Instítuto Nacíonal de Estadística, España
l.
C'ARACTERISTIC'AS DESEABLES (DESIDERATA) EN EL CAMPO DE LA
ESTADISTICA
Los resultados estadisticos se consideran aceptables en tanto cumplan algunos re-
quisitos básicos. Entre éstos deben destacar los siguientes:
a)
Ac•rrrac•idad: Proxirnidad a un valor verdadero. La acuraeidad de un estimador
incluye precisión e insesgamiento.
b)
Pertinenc•ia: Capacidad de los resultados estadísticos para completar c iertas
lagunas en el conocimiento de un fenómeno especial.
c)
Opc^rtunidad: Utilidad de un resultado estadístico en función de su disponibili-
dad en el tiempo. Incluye: nc^ntualidad (^jando límite de tiempo), rapide^ (brevedad del
tiempo transcurrido entre la primera etapa de producción de datos y su aprovec ha;^
miento) y ac•tualidad (tiempo transcurrido desde su referencia).
.
d)
Ac•c•c^sibilidad: Aptitud para ser conseguidos, recuperados, admitidos y com-
prendidos.
e)
D^talt^ ^^ c•uhE^rtura: Aptitud para proporcionar información particularizada y
circunstancias relacionadas, en profundidad y extensión.
^^
Inte^ración: Comparabilidad y otros atributos sistémicos.
g)
Pc•c^nc^rnía: Absoluta o relativa (eficiencia).
(*)
Artículo presentado a la sesión plenaria de la Conferencia de Estadísticos Europeos,
Ginebra, junio (19t30), con et titulo ^Contribution to the balancing of various desiderata attributes».
Traducido por M.a Rosa Villagrasa Novoa.
FSTADISTICA E'SPAÑULA
^i
N^^tus reyui^,itus generalmente se cuntra^x^nen en el sentidu de ser difícíl u imposible
mt^jurar unu de eilus sin detrimentu de lus demás. Puede llegarse a una situación de
eyuilibriu, ^umu resultante de la cunsideración simultánea de tudus ellus, o bien pueden
estahlecerse restricciune^; cun valures mínimus de unu u varius de dichus requisitos.
^n particufar, una restrícción muy impurtante en la práetíca es e! presupuesto
dispunible.
Asimismo, creemus que en la investigación debería tenerse en cuenta la inc^c•«idnd,
en el sentidu de prutección del derechu a la intimidad y limitación de carga a lus
respundientes.
Finaimente, cunviene menciunar la c^rc^c^ihiliclccc^ de lus resultadus, como consecuencia de la imagen yue tenga en lus usuarius, el urganismu pruductur de estadísticas.
Pasaremus ahora revista a estos requisitos cun relación a la Encuesta española de la
Pubiacián Activa.
In^^c•rcirlncl: l_a carga a lus retipundientes, cunsistente en seis entrevistas trimestrales
a lu largu de añu y mediu, nu parece excesiva. Nu ubstante, hay que tener en cuenta
que en el prugrama de evaluación de la calidad de lus datos se realizan una o dus
entrevistas suplementarias en una submuestra. En cuantu al derechu de intimidad, éste
yueda prutegidu pur la legi^;lación españula vigente.
Ac•rcrccc^ic^uc^: Se calculan y publican tantu lus errores de muesireu cumu algunos de
ius ajenus al mismu. Cumu ejernplu, menciunaremus que !a característica de desempleu,
a nivef naciunal, fue estimada en el 9,3 p^^r 100 de la publación activa (13.105.000
persunas) par^i el últimu trimestre de 1979. A nivel pruvincial uscilan entre el 1,2 por
100 en L.érida y el 20,0 pur 100 en Cáaiz. Lus errures relativus del muestreu fueron 1,9
pc.^r 100 para nivel naciunal y 32,t^ y 7,4 pur 100, respectivamente, para las pruvincias
menciunadas. Cumu indicadur del sesgu de respuesta se calcula, en la encuesta de
ev^rluación, et índice de cambiu netu, srendu su valur -7,0. Finalmente, el número
dc.^ pt^rsunas idénticamente clasiticadas en la entrevista uriginal y en la repetida fue 64,ó
pur IOU.
H n cutmtu a la ^^^hertura, se ubtuvu inti^rmación directa en el 89,7 p^^r 100 de fas
viviendas e infurm^iciún indirtct^^ en 0,7 pur l0U para negativas y 9, I pur 100 para
ause ntes.
^I I. N. ^.. está realiZandu un estudiu suhre acur^^c:idad en relación ^^I c:uste y
upurtunidad, y st está trah^ij^mdu c:n l^i ubtc^nción de la enc.•uesta pilutu menciunada
ante riurm^nte .
9
CONTRIBUCION AL EQUIL1BR10 DE vAR1AS CARACTERISTfC: AS DFSE A81._F S
Para los restantes requisitos, con excepción de la upcartunidad, nu parece yue
puedan alterarse sus valores con las restricciunes presupuestarias actualeti.
Opc^rtunidad: En el estudio mencionado anteriurmente se está tratando pc^r un Iddo
de reducir los intervalos de tiempo entre las distintas fases de pruducción y por c^tro se
buscan mecanismos que permitan conocer los principales datos en un avance basado en
,
una submuestra e incluso algún tipo de predicción.
2.
CONSIDERACION DE LC)S COSTES PARA LA ENCUESTA DE POBLACION
ACTIVA
En relación con el estudio piloto mencionado en la sección 1, fueron cansiderados los
siguientes datos básicos.
a)
Coste en pvrcentaje por fases
Planificación (*) . . . . . . . . . . . . . . . .^ . . . . . .
5,38
Toma de datos . . . . . . . . . . . . . . . . . . . . . . .
90,93
Proceso de datos . . . . . . . . . . . . . . . . . . . . .
3,48
Publicaciones ........................
0,21
100, 00
Esta tabla ha sido elaborada a partir de los ingresos brutos, por todos los conceptos,
de las personas que a distintos niveles trabajan en la encuesta. Incluye como factor de
carácter subjetivo el porcentaje de tiempo dedicado a la encuesta por ciertas personas,
según la opiñión de los jefes de unidad.
b)
Tiempo, en horas, por secc^ión y vivienda
Horas de enirevista y localización
por sección
Capita^ ............... ........
Resto de la provincia ... ... ...
Actualizarción por
sección
Entrevista
I-'OC^^^
zac ián
Total
Haras!viv.
Horas/sec.
7
7
3
11
10
18
te = 0,5
t^, = 0,9
t^, - 6,6
tQ = 6,6
(*) Organización y mantenimiento del trabajo del campo no respuesta y procedimientos de
imputación, retroalimentación («feed-backN) para el diseño de la muesta, actualización del marco y
probabilidad, etc.
10
ESTADISTICA ESPAÑOi_A
C,r^st^s rrt^di^^s n^,r h^^rn, ^n pc^sEatvs (*/
d)
Agente
Jefe grupo
Capital . . . . . . . . . . . . . . . . . . . . . . .
Resto de la provincia .........
3fi2
385
385
447
O^cina .......................
362
385
Dtrus datc^s
-- Distancia media oficina-sección-oficina: D= 230,3 Km.
- Tiempo medic^ para recorrer un Km: tk = 0,0125.
- Tiempo medio de proceso por cuestionario en la oficina provinci^l: td ^ 0,3
horas.
- Tiempo mediu de actualización por sección: 6,6 horas.
- Coste p^r Km: Ck = 9 ptas.
- Coste medio de proceso por un cuestionario en la oficina provincial: Cd = 108,6
ptas.
Por cada tres agentes existe un jefe de grupu.
E1 número de agentes para esta encuesta es aproximadamente de 250.
A partir de estos datos hemos formado la siguiente tabla:
E ntre secciones
Tipo de operación
Enirevista, localización y actualización ...
Viaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
En las secciones
En las viviendas
Ce • tQ • n
CQ • t^ • n^R
C^ • tk • D • n
Ck• D•n
Cd • td • n 1R
Depuración y otros trab^jos de oficina .. .
De la que se obtiene la siguiente función de costo:
`^ C t
+ L
3^ k ^ k
*)
1 U S^= 7Q ptas.
. D-^- 4 L^^
^
3
• n +^ C'^ t^ + Cd td n rn
3
CONTRIBUCION AL EQUII.lBRIt) DE VARIAS CARAC'TERISTIC'AS DE SE.ABLES
11
en la que utilizaremos el factor 4/3 para incluir el cc>stc^ de lc^^s jefes de grup^.^.
La función de custe para el total prc^vincial, excluida la capita), era:
C( P) = 10.164 n+ l.412,4 n in
Análogamente se obtuvo la siguiente función de coste para la capital:
C(C^ = 3. i8S,b n+ 284,77 n m
donde n es el nú^rnero de secciones y n m el número de viviendas.
El coste total de la recogida de datos es, pur lu tanto:
C = C.'(P) + C(C)
3.
EQUIL1BR10 ENTRE CC)STES Y ACURACtDAD
Estudiaremos por separado el conjunto de las provincias (excluyendo las capitales) y
el de las SO capitales.
Los pares de valores (in, n) que satisfacen la función de coste por provincias en la
proximidad del par (20; 1.OQ0) utilizado actualmente por t^ = 0,05, P= 0,38 (*), son:
iii
n
nm
C`( P) ^ l0`^
C( P) ^ 10'
35
30
25
20
645
731
845
l.oo0
22.S7S
21.930
21. l 25
19S
182
170
14,0
13,5
l 3,0
1S
1. 22S
18. 375
1S1
12 , 3
20.000
1 s9
12.b
10
1.582
15.820
149
12,2
12
1.417
17.004
148
12,1
S
2.230
1 1.1 SO
17S
13,2
2
2.957
5.914
289
17,0
donde C2(P) es la varianza relativa a cuadrado del coe^ciente de variación. Vemas que
el par (12; I.417) corresponde a la mínima varianza relativa.
En el conjunto de las capitales de función de coste es:
C(C) ^ 3.18S,b n + 284,77 • n •m
(*)
Valores utilizados en la función de costo de 1971.
ESTADISTICA ESPAlVOLA
12
y los pares (m, n) que la satisfacen y las currespondientes varianzas relativas para
análogos valores de d y P son:
^r
^
^^
35
34
2S
1.350
1. S 14
^.724
47.250
45 .420
43.100
c^t P) ^ ^ o^
c^ P^ ^^ a^
9,6
9,3
9,1
93
88
83
20
2. 000
40.000
79
8,9
1S
10
S
2
2. 382
2.944
3.854
4. 730
3S .734
29.440
19.2?0
9.4b0
78
80
102
181
8,8
8,9
10,1
13,5
En este caso, el par óptimo consiste en rñ = iS viviendas y n^ 2.382 secciones.
Puede observarse que en ambos casos más que de valores ó ptimos podemus hablar
de regiones óptimas, S < m< 24, 1,OU < n< 2.230 en provincias; 5< jn < 25, l.724 <
< n< 3.854 en capitales. Parece por consiguiente ^til para tomar una decisión consíder<ar
otros aspectos operativos que no son fáciies de inciuir en un tratamiento matemático.
A continuación obtendremos los valores óptimos de m con la fórmula
í^iap --
C' • 1
para varios valores de ^
m ^P
Pravincias (excepto capitales) . . . . . . . . . . . . . . .
Capitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
^= o,01
b= o,os
a= 0,09
27
33
1 i,7
14,4
8,5
10,5
calculándose los correspondientes valores de n a partir de ias funciones de costo.
Esta tabla pone de manifiesto ei efecto, sobre el tamaño de la muestra, de consideraciones multidimensionales del problema.
RESUMEN
Se definen las siguientes características deseables (desiderata) para los resultados
estadísticos: Acuracidad, Pertinencia, ^portunidad, Accesibilidad, Detalle y Cobertura,
CONTRIBUCION AL EQUtLtBRlO DE VARIAS CARACTERISTICAS DESEABLES
^3
integración, Economía, y también inocuidad y Credibilidad. Se consideran estos requisitos en relac ión con la Encuesta de Poblac ión Activa.
Palabras clave: Características deseables, desiderata, resultados estadísticos, definiciones, acuracidad, función de coste.
SG'MMARY
The following desiderata of statistical results are defined: Accuracy, Relevancy,
Timeliness, Accesibility, Detail and Coverage, Integration, Economy, and also Innocuousness and Credibility. These requirements are reviewed in relation to the Spanish
Labor Force Survey.
Key words: Desiderata, statistical results, definitions, accuracy, cost functions.
AMS Subject classification: 62D05
Descargar