Contribución al equilibrio de varias características deseables 1*) por F. AZOR^N y J. L. SANCHEZ-CRESPO Instítuto Nacíonal de Estadística, España l. C'ARACTERISTIC'AS DESEABLES (DESIDERATA) EN EL CAMPO DE LA ESTADISTICA Los resultados estadisticos se consideran aceptables en tanto cumplan algunos re- quisitos básicos. Entre éstos deben destacar los siguientes: a) Ac•rrrac•idad: Proxirnidad a un valor verdadero. La acuraeidad de un estimador incluye precisión e insesgamiento. b) Pertinenc•ia: Capacidad de los resultados estadísticos para completar c iertas lagunas en el conocimiento de un fenómeno especial. c) Opc^rtunidad: Utilidad de un resultado estadístico en función de su disponibili- dad en el tiempo. Incluye: nc^ntualidad (^jando límite de tiempo), rapide^ (brevedad del tiempo transcurrido entre la primera etapa de producción de datos y su aprovec ha;^ miento) y ac•tualidad (tiempo transcurrido desde su referencia). . d) Ac•c•c^sibilidad: Aptitud para ser conseguidos, recuperados, admitidos y com- prendidos. e) D^talt^ ^^ c•uhE^rtura: Aptitud para proporcionar información particularizada y circunstancias relacionadas, en profundidad y extensión. ^^ Inte^ración: Comparabilidad y otros atributos sistémicos. g) Pc•c^nc^rnía: Absoluta o relativa (eficiencia). (*) Artículo presentado a la sesión plenaria de la Conferencia de Estadísticos Europeos, Ginebra, junio (19t30), con et titulo ^Contribution to the balancing of various desiderata attributes». Traducido por M.a Rosa Villagrasa Novoa. FSTADISTICA E'SPAÑULA ^i N^^tus reyui^,itus generalmente se cuntra^x^nen en el sentidu de ser difícíl u imposible mt^jurar unu de eilus sin detrimentu de lus demás. Puede llegarse a una situación de eyuilibriu, ^umu resultante de la cunsideración simultánea de tudus ellus, o bien pueden estahlecerse restricciune^; cun valures mínimus de unu u varius de dichus requisitos. ^n particufar, una restrícción muy impurtante en la práetíca es e! presupuesto dispunible. Asimismo, creemus que en la investigación debería tenerse en cuenta la inc^c•«idnd, en el sentidu de prutección del derechu a la intimidad y limitación de carga a lus respundientes. Finaimente, cunviene menciunar la c^rc^c^ihiliclccc^ de lus resultadus, como consecuencia de la imagen yue tenga en lus usuarius, el urganismu pruductur de estadísticas. Pasaremus ahora revista a estos requisitos cun relación a la Encuesta española de la Pubiacián Activa. In^^c•rcirlncl: l_a carga a lus retipundientes, cunsistente en seis entrevistas trimestrales a lu largu de añu y mediu, nu parece excesiva. Nu ubstante, hay que tener en cuenta que en el prugrama de evaluación de la calidad de lus datos se realizan una o dus entrevistas suplementarias en una submuestra. En cuantu al derechu de intimidad, éste yueda prutegidu pur la legi^;lación españula vigente. Ac•rcrccc^ic^uc^: Se calculan y publican tantu lus errores de muesireu cumu algunos de ius ajenus al mismu. Cumu ejernplu, menciunaremus que !a característica de desempleu, a nivef naciunal, fue estimada en el 9,3 p^^r 100 de la publación activa (13.105.000 persunas) par^i el últimu trimestre de 1979. A nivel pruvincial uscilan entre el 1,2 por 100 en L.érida y el 20,0 pur 100 en Cáaiz. Lus errures relativus del muestreu fueron 1,9 pc.^r 100 para nivel naciunal y 32,t^ y 7,4 pur 100, respectivamente, para las pruvincias menciunadas. Cumu indicadur del sesgu de respuesta se calcula, en la encuesta de ev^rluación, et índice de cambiu netu, srendu su valur -7,0. Finalmente, el número dc.^ pt^rsunas idénticamente clasiticadas en la entrevista uriginal y en la repetida fue 64,ó pur IOU. H n cutmtu a la ^^^hertura, se ubtuvu inti^rmación directa en el 89,7 p^^r 100 de fas viviendas e infurm^iciún indirtct^^ en 0,7 pur l0U para negativas y 9, I pur 100 para ause ntes. ^I I. N. ^.. está realiZandu un estudiu suhre acur^^c:idad en relación ^^I c:uste y upurtunidad, y st está trah^ij^mdu c:n l^i ubtc^nción de la enc.•uesta pilutu menciunada ante riurm^nte . 9 CONTRIBUCION AL EQUIL1BR10 DE vAR1AS CARACTERISTfC: AS DFSE A81._F S Para los restantes requisitos, con excepción de la upcartunidad, nu parece yue puedan alterarse sus valores con las restricciunes presupuestarias actualeti. Opc^rtunidad: En el estudio mencionado anteriurmente se está tratando pc^r un Iddo de reducir los intervalos de tiempo entre las distintas fases de pruducción y por c^tro se buscan mecanismos que permitan conocer los principales datos en un avance basado en , una submuestra e incluso algún tipo de predicción. 2. CONSIDERACION DE LC)S COSTES PARA LA ENCUESTA DE POBLACION ACTIVA En relación con el estudio piloto mencionado en la sección 1, fueron cansiderados los siguientes datos básicos. a) Coste en pvrcentaje por fases Planificación (*) . . . . . . . . . . . . . . . .^ . . . . . . 5,38 Toma de datos . . . . . . . . . . . . . . . . . . . . . . . 90,93 Proceso de datos . . . . . . . . . . . . . . . . . . . . . 3,48 Publicaciones ........................ 0,21 100, 00 Esta tabla ha sido elaborada a partir de los ingresos brutos, por todos los conceptos, de las personas que a distintos niveles trabajan en la encuesta. Incluye como factor de carácter subjetivo el porcentaje de tiempo dedicado a la encuesta por ciertas personas, según la opiñión de los jefes de unidad. b) Tiempo, en horas, por secc^ión y vivienda Horas de enirevista y localización por sección Capita^ ............... ........ Resto de la provincia ... ... ... Actualizarción por sección Entrevista I-'OC^^^ zac ián Total Haras!viv. Horas/sec. 7 7 3 11 10 18 te = 0,5 t^, = 0,9 t^, - 6,6 tQ = 6,6 (*) Organización y mantenimiento del trabajo del campo no respuesta y procedimientos de imputación, retroalimentación («feed-backN) para el diseño de la muesta, actualización del marco y probabilidad, etc. 10 ESTADISTICA ESPAÑOi_A C,r^st^s rrt^di^^s n^,r h^^rn, ^n pc^sEatvs (*/ d) Agente Jefe grupo Capital . . . . . . . . . . . . . . . . . . . . . . . Resto de la provincia ......... 3fi2 385 385 447 O^cina ....................... 362 385 Dtrus datc^s -- Distancia media oficina-sección-oficina: D= 230,3 Km. - Tiempo medic^ para recorrer un Km: tk = 0,0125. - Tiempo medio de proceso por cuestionario en la oficina provinci^l: td ^ 0,3 horas. - Tiempo mediu de actualización por sección: 6,6 horas. - Coste p^r Km: Ck = 9 ptas. - Coste medio de proceso por un cuestionario en la oficina provincial: Cd = 108,6 ptas. Por cada tres agentes existe un jefe de grupu. E1 número de agentes para esta encuesta es aproximadamente de 250. A partir de estos datos hemos formado la siguiente tabla: E ntre secciones Tipo de operación Enirevista, localización y actualización ... Viaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . En las secciones En las viviendas Ce • tQ • n CQ • t^ • n^R C^ • tk • D • n Ck• D•n Cd • td • n 1R Depuración y otros trab^jos de oficina .. . De la que se obtiene la siguiente función de costo: `^ C t + L 3^ k ^ k *) 1 U S^= 7Q ptas. . D-^- 4 L^^ ^ 3 • n +^ C'^ t^ + Cd td n rn 3 CONTRIBUCION AL EQUII.lBRIt) DE VARIAS CARAC'TERISTIC'AS DE SE.ABLES 11 en la que utilizaremos el factor 4/3 para incluir el cc>stc^ de lc^^s jefes de grup^.^. La función de custe para el total prc^vincial, excluida la capita), era: C( P) = 10.164 n+ l.412,4 n in Análogamente se obtuvo la siguiente función de coste para la capital: C(C^ = 3. i8S,b n+ 284,77 n m donde n es el nú^rnero de secciones y n m el número de viviendas. El coste total de la recogida de datos es, pur lu tanto: C = C.'(P) + C(C) 3. EQUIL1BR10 ENTRE CC)STES Y ACURACtDAD Estudiaremos por separado el conjunto de las provincias (excluyendo las capitales) y el de las SO capitales. Los pares de valores (in, n) que satisfacen la función de coste por provincias en la proximidad del par (20; 1.OQ0) utilizado actualmente por t^ = 0,05, P= 0,38 (*), son: iii n nm C`( P) ^ l0`^ C( P) ^ 10' 35 30 25 20 645 731 845 l.oo0 22.S7S 21.930 21. l 25 19S 182 170 14,0 13,5 l 3,0 1S 1. 22S 18. 375 1S1 12 , 3 20.000 1 s9 12.b 10 1.582 15.820 149 12,2 12 1.417 17.004 148 12,1 S 2.230 1 1.1 SO 17S 13,2 2 2.957 5.914 289 17,0 donde C2(P) es la varianza relativa a cuadrado del coe^ciente de variación. Vemas que el par (12; I.417) corresponde a la mínima varianza relativa. En el conjunto de las capitales de función de coste es: C(C) ^ 3.18S,b n + 284,77 • n •m (*) Valores utilizados en la función de costo de 1971. ESTADISTICA ESPAlVOLA 12 y los pares (m, n) que la satisfacen y las currespondientes varianzas relativas para análogos valores de d y P son: ^r ^ ^^ 35 34 2S 1.350 1. S 14 ^.724 47.250 45 .420 43.100 c^t P) ^ ^ o^ c^ P^ ^^ a^ 9,6 9,3 9,1 93 88 83 20 2. 000 40.000 79 8,9 1S 10 S 2 2. 382 2.944 3.854 4. 730 3S .734 29.440 19.2?0 9.4b0 78 80 102 181 8,8 8,9 10,1 13,5 En este caso, el par óptimo consiste en rñ = iS viviendas y n^ 2.382 secciones. Puede observarse que en ambos casos más que de valores ó ptimos podemus hablar de regiones óptimas, S < m< 24, 1,OU < n< 2.230 en provincias; 5< jn < 25, l.724 < < n< 3.854 en capitales. Parece por consiguiente ^til para tomar una decisión consíder<ar otros aspectos operativos que no son fáciies de inciuir en un tratamiento matemático. A continuación obtendremos los valores óptimos de m con la fórmula í^iap -- C' • 1 para varios valores de ^ m ^P Pravincias (excepto capitales) . . . . . . . . . . . . . . . Capitales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ^= o,01 b= o,os a= 0,09 27 33 1 i,7 14,4 8,5 10,5 calculándose los correspondientes valores de n a partir de ias funciones de costo. Esta tabla pone de manifiesto ei efecto, sobre el tamaño de la muestra, de consideraciones multidimensionales del problema. RESUMEN Se definen las siguientes características deseables (desiderata) para los resultados estadísticos: Acuracidad, Pertinencia, ^portunidad, Accesibilidad, Detalle y Cobertura, CONTRIBUCION AL EQUtLtBRlO DE VARIAS CARACTERISTICAS DESEABLES ^3 integración, Economía, y también inocuidad y Credibilidad. Se consideran estos requisitos en relac ión con la Encuesta de Poblac ión Activa. Palabras clave: Características deseables, desiderata, resultados estadísticos, definiciones, acuracidad, función de coste. SG'MMARY The following desiderata of statistical results are defined: Accuracy, Relevancy, Timeliness, Accesibility, Detail and Coverage, Integration, Economy, and also Innocuousness and Credibility. These requirements are reviewed in relation to the Spanish Labor Force Survey. Key words: Desiderata, statistical results, definitions, accuracy, cost functions. AMS Subject classification: 62D05