Errores en los Censos Taller sobre evaluación y estimaciones demográficas con base en información censal Santiago, Chile 1 – 5 de agosto, 2011 Carlos Ellis, Asesor Regional en Censos, UNFPA SRO-Jamaica 1 Cobertura/ retorno del campo • Regreso del material del campo • Control de AE (Carpeta) • Velocidad en detectar material perdido • Todas las áreas de empadronamiento regresaron del campo? 2 Errores en el proceso censal • Errores de Cobertura – Omisiones o duplicaciones – Mapas incompletos o interpretados erróneamente – Entrevistas duplicadas – Perdida de material censal luego del empadronamiento – Errores de estructura dentro de los casos 3 Errores de contenido • Informante proporciona malos datos • Cuestionario censal con diseño mediocre • Mala comunicación entre el informante y el empadronador • Errores de codificación • Errores en la captura de los datos • Errores en la edición manual o informática de los datos 4 Como y cuando editar los datos? • En el terreno? – Si es posible retornar al informante • Corrección manual de la información – Alto costo – No garantiza tener mejor calidad • Al momento de la captura de los datos? – Sólo si una inspección visual puede ser útil – Mantener los datos originales incluso con errores – El operador no es la mejor persona para hacer cambios – Cuellos de botella podrían ser creados – No se generan estadísticas de imputación • Desarrollo de un sistema de edición inteligente – Producir estadísticas por tipo de error e imputación 5 Grupo de Edición • • • • Managers del censo Demógrafos Informáticos Comenzar a trabajar al inicio del proceso censal 6 Desarrollo de las reglas de Edición • Contar con tiempo suficiente para probar las reglas • Utilizar el censo piloto para probar el sistema • Evaluar adecuadamente los resultados • Introducir mejoras oportunamente • Los demógrafos son responsables de la calidad obtenida 7 Que hacer en la edición datos • • • • Proporcionar al usuario datos de alta calidad Identificar tipos y fuentes de los errores Proporcionar resultados censales ajustados Inspeccionar y corregir sistemáticamente las respuestas según reglas pre-establecidas – Correcciones manuales – Correcciones automáticas • Reducir estimados distorsionados, facilitar el procesamiento y aumentar la confianza del usuario • Datos originales en un censo contienen muchos tipos de errores 8 Proceso de edición • Errores fatales – Identifica errores obvios • Consulta de casos – Variables con categorías sospechosas – Más difícil de corregir – Ofrece menos beneficios que la corrección de los errores fatales – Agrega costo al proceso • Debe preservar lo más posible el dato original • Puede o NO mejorar la calidad, pero datos limpios facilitan enormemente el análisis 9 Corregir en “demasía” es malo • Aumenta tiempo de proceso • Incrementa el costo total • Distorsiona los valores verdaderos • Crea un falso sentimiento de seguridad 10 Corrección manual versus automática • Verificar la validez de una variable buscando un valor aceptable • Edición manual – Puede tomar meses – Muchas posibilidades de error humano – Débil alternativa a edición automática • Edición automática – Reduce el tiempo necesario – Reduce errores humanos – Deja un camino de la corrección realizada y es reproducible cosa que no ocurre con la edición manual 11 Objetivos para la corrección de datos • Realice la menor cantidad posible de cambios al dato original • Elimine inconsistencias obvias • Suministre valores consistentes a variables con error usando como referencia otras variables del mismo tipo de registro • Ninguna variable puede contener valores inválidos 12 Métodos de imputación • Imputación estática – Asigna un valor particular a un dato con error – Los valores no cambian con el tiempo – Asignaciones según proporciones pre definidas • Imputaciones dinámicas – Produce datos limpios y es fácil de replicar – Se ajusta a las condiciones del área que se procesa • Técnicas del donante 13